Durante seu primeiro ano no governo, o presidente da Argentina Javier Milei concedeu 58 entrevistas longas a veรญculos de comunicaรงรฃo e proferiu 84 discursos oficiais, em um total de 89 horas de รกudio e vรญdeo, segundo levantamento do jornal La Naciรณn.
Depois de mapear todas as falas de Milei neste perรญodo, o jornal argentino usou inteligรชncia artificial para transcrever e analisar as 739 mil palavras a fim de identificar padrรตes de linguagem do polรญtico: de insultos a opositores, ao Estado e ร imprensa a frases que ele repete rotineiramente.
O resultado foi a reportagem especial “Asรญ nos hablรณ Milei: 9 trucos del relato libertario para construir un nuevo sentido comรบn” (Assim nos falou Milei: 9 truques do relato libertรกrio para construir um novo senso comum).
“Milei se tornou presidente sem um partido polรญtico, com muito pouco poder institucional e sem histรณrico polรญticoโ explicou Martรญn Rodrรญguez Yebra, editor executivo e colunista do La Naciรณn que assina a matรฉria, ร LatAm Journalism Review (LJR).
โSeu poder repousava particularmente em suas palavras. Ele รฉ um lรญder muito focado na comunicaรงรฃo, e pensamos que seria muito importante desvendar as caracterรญsticas de seu discurso: o que o torna tรฃo รบnico, quais sรฃo seus ‘truques’ mais comuns, como ele busca construir uma รฉpica que lhe permite superar suas fraquezas polรญticas.
Foi por isso que comeรงamos a coletar todos os seus discursos e entrevistas. Querรญamos realizar uma anรกlise baseada em dados objetivos e quantificรกveis.”
O que a anรกlise de discursos e entrevistas de Milei na Argentina revelou
A pesquisa apurou nove caracterรญsticas principais do discurso de Milei, incluindo o uso frequente de insultos โ foram mais de 4 mil expressรตes desqualificantes presentes em 130 discursos e entrevistas โ , a construรงรฃo da imagem de salvador em uma catรกstrofe herdada e o uso recorrente de hipรฉrboles.
“O mais surpreendente รฉ o nรบmero de insultos e ataques aos seus rivais, ร imprensa e a figuras pรบblicas que, embora nรฃo sejam seus inimigos, expressaram posiรงรตes diferentes da suaโ, disse Rodrรญguez Yebra.
โSabรญamos que isso era comum, mas nรฃo sabรญamos que serรญamos capazes de identificar mais de 4 mil ataques desse tipo em apenas um ano.”
O trabalho tambรฉm analisou os ataques sistemรกticos de Milei ร imprensa. De acordo com a anรกlise do jornal argentino, foram 410 menรงรตes depreciativas sobre o jornalismo registradas em 69 discursos e entrevistas.
A palavra mais falada pelo presidente contra o jornalismo
โMentirosoโ foi a palavra com mais menรงรตes no ranking de desqualificaรงรตes utilizadas contra o jornalismo, segundo a reportagem.
A matรฉria diz ainda que, ao longo de um ano, o presidente desqualificou mais de 60 jornalistas com termos ofensivos em um exercรญcio diรกrio em que bombardeava as pessoas com expressรตes como “corruptos”, “miserรกveis”, “ressentidos”, “tiranos”, “mentirosos”, “capangas” e “falsos”.
“Estava claro desde o inรญcio que o ataque sistemรกtico ร imprensa era uma das caracterรญsticas essenciais do discurso de Mileiโ, explicou o jornalista.
โNunca antes um presidente na Argentina havia sido tรฃo verbalmente agressivo em relaรงรฃo ร mรญdia. Nosso objetivo era determinar padrรตes para entender esse comportamento: que tipo de palavras ele usa, quando รฉ mais agressivo e em quais questรตes reage mais agressivamente.
Acredito que a anรกlise nos permite entender melhor que essa รฉ uma estratรฉgia, ativada em certos momentos de necessidade polรญtica, e nรฃo uma simples reaรงรฃo espontรขnea.”
Para decifrar o estilo de comunicaรงรฃo do presidente, um time multidisciplinar de 14 profissionais trabalhou por cerca de dois meses desde a concepรงรฃo da ideia atรฉ a publicaรงรฃo da matรฉria.
A equipe incluรญa um analista polรญtico, um especialista em IA, programadores, a equipe de design digital, editores de vรญdeo e um editor geral.
โSem IA, teria sido impossรญvel quantificar o nรบmero de insultos que Milei proferiu ao longo de seu primeiro ano. Ou determinar com precisรฃo o quanto de hipรฉrbole permeou seus discursosโ, disse Rodrรญguez Yebra.
“Acho humanamente impossรญvel trabalhar com dezenas de horas de discurso e conseguir extrair informaรงรตes quantitativas e precisas como este trabalho fez.โ
Arquitetura tecnolรณgica da anรกlise das falas de Javier Milei
O processo de desenvolvimento foi dividido em vรกrias etapas bem definidas, explicou Martรญn Pascua, desenvolvedor do laboratรณrio de IA do La Naciรณn.
A primeira fase consistiu na coleta dos mais de 100 vรญdeos de discursos e entrevistas que Milei deu em seu primeiro ano, e foi liderada pela equipe editorial, sob a direรงรฃo de Rodrรญguez Yebra.
Em seguida, a equipe de operaรงรตes e entรฃo carregou todo o material para o Google Cloud Platform (GCP).
“A partir daรญ, comeรงamos a avaliar a melhor estratรฉgia tรฉcnica para processar os vรญdeosโ disse Pascua ร LJR.
“Tรญnhamos experiรชncia prรฉvia de projetos anteriores, como nossa anรกlise ao vivo do debate presidencial [em outubro de 2023], mas desta vez estรกvamos trabalhando em uma escala muito maior, com arquivos mais longos e um volume significativamente maior.
Alรฉm disso, quase 12 meses haviam se passado entre aquele projeto e este, um longo tempo em termos de evoluรงรฃo da IA generativa.โ
Pascua contou que antes de escolher os modelos de IA mais adequados, a equipe realizou testes controlados com diversas opรงรตes, como Google Speech, API Whisper da OpenAI, Whisper rodando localmente e Gemini via Vertex AI.
Eles acabaram escolhendo o Whisper Large V3 executado localmente para as transcriรงรตes e o Gemini Pro para processamento e anรกlise de conteรบdo.
As ferramentas de IA escolhidas
“Nossos critรฉrios equilibraram qualidade de transcriรงรฃo, velocidade de processamento e custos operacionais โ especialmente considerando que estรกvamos trabalhando com mais de 100 discursos, muitos deles bem longosโ, disse Pascua.
โO Whisper Large v3 apresentou os melhores resultados para as nossas necessidades. Isso nos permitiu evitar custos com o uso de APIs, ao mesmo tempo em que proporcionou excelente precisรฃo de transcriรงรฃo, especialmente na diferenciaรงรฃo de falantes, crucial para a anรกlise do discurso.
Executรก-lo em nosso prรณprio hardware tambรฉm nos deu controle total sobre o processo e a flexibilidade para adaptar o ambiente ร s nossas necessidades.โ
O Gemini Pro, segundo Pascua, forneceu um excelente equilรญbrio de qualidade, velocidade e custo.
Eles usaram a ferramenta para corrigir erros residuais de transcriรงรฃo; normalizar o texto e preparรก-lo para anรกlise estruturada; explorar diferentes estratรฉgias para classificar e agrupar trechos relevantes; e colaborar com a equipe editorial para iterar sobre diferentes รขngulos temรกticos.
Apรณs obter as transcriรงรตes dos discursos de Milei, Pascua disse que a equipe criou um script em Python para limpar erros comuns do reconhecimento automรกtico de fala, como problemas de pontuaรงรฃo, rotulagem de falantes e palavras de preenchimento.
Eles tambรฉm desenvolveram uma aplicaรงรฃo interna usando Streamlit, que permitia carregar e explorar todos os textos rapidamente, para facilitar o controle de qualidade.
Leia tambรฉm | Vaticano e Big Techs: a Igreja Catรณlica entre o alerta รฉtico e a parceria estratรฉgica em Inteligรชncia Artificial
Explorando os focos temรกticos de discursos e entrevitstas ao longo de um ano
Depois que todas as transcriรงรตes foram concluรญdas, a equipe editorial comeรงou a identificar os principais focos temรกticos.
Ao mesmo tempo, a equipe de infogrรกficos e de design digital se juntou ao time para comeรงar a transformar as descobertas em narrativas visuais claras e impactantes.
โA equipe de design trabalhou com a equipe de vรญdeo em maneiras envolventes de apresentar as informaรงรตesโ, disse Rodrรญguez Yebra.
โTestamos vรกrios modelos atรฉ chegarmos ao que mais gostamos, o que nos permite ver as evoluรงรตes temporais de cada variรกvel da fala e pequenos videoclipes que resumem a ideia.โ
Com todos os pontos-chave do discurso de Milei definidos e validados, Pascua contou que foi realizada uma segunda rodada de processamento para quantificar as descobertas e entregรก-las em um formato estruturado para a equipe de design, que construiu as visualizaรงรตes finais.
โComo desenvolvedor, essa foi uma das partes mais enriquecedoras do projeto: ver como os jornalistas trabalham com grandes volumes de texto, como eles navegam, comparam e extraem significado foi uma verdadeira experiรชncia de aprendizadoโ, disse Pascua.
โA dinรขmica da equipe tambรฉm foi um dos aspectos mais gratificantes de todo o projeto. Foi um verdadeiro esforรงo colaborativo, com perfis muito diferentes, mas altamente complementares, trabalhando juntos com um objetivo comum.
Pessoalmente, acho que esse tipo de interaรงรฃo โ entre desenvolvedores, jornalistas e designers โ รฉ uma das partes mais enriquecedoras do trabalho em uma redaรงรฃo hoje em dia.”
Validaรงรฃo humana dos dados
Apesar do uso avanรงado de tecnologia, ambos os profissionais reforรงaram que o trabalho jornalรญstico humano foi essencial para garantir a precisรฃo e a contextualizaรงรฃo das informaรงรตes obtidas pela IA.
โTalvez a parte mais complexa do trabalho tenha sido verificar a precisรฃo dos dados extraรญdos da fala de Milei pela IAโ, disse Rodrรญguez Yebra.
โRevisamos repetidamente as respostas e garantimos que ela [a IA] pudesse interpretar a linguagem especรญfica de Milei.
Querรญamos ser muito precisos com os dados. Depois, tambรฉm tivemos muitas discussรตes sobre como apresentar as informaรงรตes e o que deixarรญamos de fora, por uma questรฃo de clareza.โ
Pascua ressaltou que a revisรฃo humana foi uma parte essencial do processo em todas as etapas.
A equipe implementou diversos mecanismos para garantir a qualidade, incluindo scripts de limpeza para corrigir problemas comuns de transcriรงรฃo e uma ferramenta interna de revisรฃo para facilitar a navegaรงรฃo pelo conteรบdo.
Segundo o desenvolvedor, tambรฉm foram criados fluxos de trabalho de validaรงรฃo entre equipes, nos quais a equipe tรฉcnica revisava os resultados estruturalmente โ como formataรงรฃo, completude, integridade do processamento โ, enquanto a equipe editorial revisava o significado, o tom, a fidelidade ร fonte e a relevรขncia jornalรญstica.
“Desde as primeiras transcriรงรตes atรฉ os resultados finais, trabalhamos em estreita coordenaรงรฃo com a equipe editorial para garantir que os dados permanecessem consistentes e fiรฉis ao conteรบdo original”, explicou Pascua.
โEsse processo de validaรงรฃo hรญbrido, combinando automaรงรฃo e supervisรฃo humana, foi fundamental para a entrega de um resultado robusto e confiรกvel. Ele nos permitiu nรฃo apenas corrigir erros tรฉcnicos, mas tambรฉm refinar o foco editorial ร medida que avanรงรกvamos no material.โ
O futuro da IA no jornalismo investigativo
O trabalho do La Naciรณn foi vencedor do prรชmio de “Melhor Uso de Inteligรชncia Artificial na Redaรงรฃo”, concedido pela Associaรงรฃo Mundial de Editores de Notรญcias (WAN-IFRA), em maio.
De acordo com o jรบri do prรชmio, o uso da IA โโno trabalho do La Naciรณn permitiu um nรญvel de profundidade e precisรฃo que sรณ a combinaรงรฃo de tecnologia avanรงada e rigor jornalรญstico pode proporcionar.
โSua implementaรงรฃo contribuiu claramente para uma forma de jornalismo mais impactante e perspicazโ, diz o comentรกrio dos jurados sobre a matรฉria.
Rodrรญguez Yebra disse que espera que o reconhecimento do trabalho possa servir como incentivo para que as equipes editoriais do La Naciรณn e de outros veรญculos utilizem mais amplamente ferramentas de IA nรฃo sรณ para analisar discursos de autoridades, mas tambรฉm para investigaรงรตes jornalรญsticas em geral.
“Estamos trabalhando para desenvolver ferramentas que nos permitam realizar anรกlises como esta de forma mais simples e rรกpidaโ, disse o jornalista.
โEssas ferramentas podem ser aplicadas, por exemplo, a um discurso especรญfico e em tempo real. Acho que as possibilidades sรฃo infinitas.โ
Trabalho colaborativo entre jornalistas e desenvolvedores
Para Pascua, de uma perspectiva tรฉcnica, o papel dos desenvolvedores nas redaรงรตes estรก evoluindo rapidamente.
O desenvolvedor acredita que nรฃo se trata mais apenas de โapoiarโ a equipe editorial com ferramentas, e sim de estar ativamente envolvido na prรณpria investigaรงรฃo, propondo novas maneiras de coletar, processar e contar histรณrias com dados.
Em um mundo em que a maioria das informaรงรตes รฉ digital, massiva e em constante mudanรงa, ele disse que a colaboraรงรฃo entre desenvolvedores e jornalistas รฉ essencial para conduzir investigaรงรตes profundas e impactantes.
โA capacidade de aplicar modelos de linguagem, tรฉcnicas de scraping, automaรงรฃo, visualizaรงรตes interativas ou verificaรงรฃo em tempo real abre possibilidades de narrativa impensรกveis hรก apenas alguns anos”, disse Pascua.
โร por isso que acredito que essa funรงรฃo nรฃo sรณ continuarรก a crescer, como tambรฉm se tornarรก cada vez mais especializada โ com desenvolvedores que entendem as necessidades editoriais, jornalistas tecnicamente qualificados e equipes hรญbridas que falam a mesma lรญngua.
Na minha opiniรฃo, รฉ aรญ que residem alguns dos futuros mais promissores do jornalismo investigativo.โ
Este artigo foi publicado originalmente na LatAm Journalism Review, um projeto do Knight Center para o Jornalismo nas Amรฉricas. Todos os direitos reservados ร autora.
Leia tambรฉm | IA, boatos e mais: onda de fake news envolvendo atรฉ presidente do Mรฉxico inflama protestos em Los Angeles