Com a crescente expansão da inteligência artificial generativa (IA) nos últimos anos, muitos meios de comunicação na América Latina desenvolveram iniciativas inovadoras utilizando esta tecnologia para aumentar o poder do seu jornalismo, mas poucos destes esforços concentraram-se nas necessidades de informação dos povos indígenas.

Um deles é o Ojo Público, site de jornalismo investigativo, que desenvolveu o Quispe Chequea, uma ferramenta que utiliza recursos generativos de inteligência artificial para produzir conteúdo de verificação jornalística em texto e áudio em idiomas nativos.

O veículo está utilizando a ferramenta para facilitar a geração de informações em pequenas redações de comunidades indígenas no Peru, principalmente estações de rádio.

Inteligência artificial usada em prol das comunidades indígenas

“No âmbito da evolução dos projetos de verificação promovidos pelo Ojo Público, detectamos que era necessário facilitar a geração de conteúdos para estas comunidades e para que os comunicadores regionais aplicassem a metodologia de verificação, mas também algum recurso que lhes permitisse gerar conteúdo de forma rápida e eficiente”, disse David Hidalgo, diretor executivo do projeto à LatAm Journalism Review (LJR).

Foi durante a pandemia de Covid-19 que o Ojo Público começou a colaborar com rádios comunitárias de pelo menos oito regiões dos Andes peruanos e da Amazônia para produzir material verificado traduzido para línguas indígenas.

Os veículos perceberam que estas comunidades eram o grupo populacional mais vulnerável à desinformação naquele momento, pois não dispunham de informação em sua língua sobre a doença.

Com o boom da inteligência artificial generativa nos últimos anos, o Ojo Público pensou em aplicar esta tecnologia para impulsionar ainda mais a sua colaboração com os meios de comunicação comunitários.

Em 2023, reuniu uma equipe multidisciplinar que incluía jornalistas, desenvolvedores, cientistas de dados e tradutores para criar o Quispe Chequea, com apoio da Google News Initiative.

Ferramenta de IA produz conteúdo em línguas indígenas

A ferramenta é composta por dois componentes: um para geração de conteúdo verificado em texto e outro para geração de áudio em línguas indígenas.

O primeiro componente funciona por meio de um gerenciador de conteúdo capaz de gerar textos utilizando recursos do ChatGPT.

O jornalista usuário precisa inserir informações previamente verificadas pela metodologia do Ojo Público, bem como outros elementos de evidência necessários, para que então a ferramenta redija um texto.

Uma vez gerado o texto, um editor deverá revisá-lo e corrigir ou acrescentar informações, conforme julgar necessário, até que o material atenda aos padrões de verificação do meio.

Hidalgo foi claro ao enfatizar que o Quispe Chequea, cujo nome foi retirado do sobrenome Quispe, um dos mais comuns em quéchua e cujo significado alude à clareza e transparência, não é uma ferramenta que verifica informações, mas sim organiza os dados inseridos pelo usuário em um texto com características de uma verificação.

“O jornalista não fica apenas sentado esperando que a máquina verifique tudo, mas tem de conhecer e dominar o processo de verificação, incluindo todas as orientações dos padrões internacionais”.

“Se você colocar uma fonte ou link errado, a plataforma vai gerar conteúdo com essa informação. Não evitamos a responsabilidade do jornalista. O que esta plataforma faz é fornecer uma solução para que o texto seja gerado muito rapidamente”, explicou Hidalgo.

Projeto utiliza inteligência artificial para recriar voz humana

A geração do áudio ocorre quando o editor aprova o texto, escolhe o idioma desejado (atualmente a ferramenta é capaz de gerar áudios em espanhol e nas línguas indígenas quéchua, aimará e awajún), e aperta um botão.

A plataforma então traduz o conteúdo e gera um arquivo em formato MP3 que imita a narração do locutor. Porém, gerar voz não foi a parte mais complicada do desenvolvimento da ferramenta.

Atualmente existem múltiplas ferramentas tecnológicas de conversão de texto em fala (chamadas de text-to-speech em inglês) capazes de recriar a voz humana com inteligência artificial.

Para este projeto, a equipe utilizou o Tacotron 2, software desenvolvido por pesquisadores do Google.

A parte complexa, segundo Hidalgo, foi fazer com que o Quispe Chequea traduzisse os textos para as línguas nativas, para as quais os recursos de tradução existentes eram muito limitados.

Criação de banco de dados para três línguas indígenas

Para isso, a equipe teve que desenvolver um tradutor como parte da ferramenta. Um grupo de jornalistas do OjoBiónico, a unidade de fact-checking do Ojo Público, e três intérpretes criaram um banco de dados para cada idioma, com milhares de frases comuns para cada língua.

Posteriormente, os intérpretes gravaram cada frase com a voz até obter um banco sonoro de cerca de quatro horas para cada idioma.

Com esse material, os desenvolvedores “treinaram” o tradutor, projetado com arquitetura Tacotron 2, o que permitiu à ferramenta converter os textos em áudios nas três línguas indígenas.

Após vários ajustes e processos de treinamento, obtiveram um sistema capaz de criar vozes com sonoridade natural.

A editora de checagem de fotos do Ojo Público, Gianella Tapullima, explicou: “Foi um trabalho muito árduo, especialmente coletar dados para treinar esse modelo. Usamos frases que obtivemos de uma raspagem das verificações que realizamos ao longo destes anos [nesses idiomas]”.

Tradução da língua nativa ‘awajún’ demandou mais esforços

A tradução em awajún, a língua do segundo povo amazônico mais populoso do Peru, representou um esforço adicional.

Para as traduções em quéchua e aimará, os desenvolvedores do Quispe Chequea recorreram a recursos do Google Translate, que possui ambas as línguas indígenas em seu sistema.

Mas, para awajún, a equipe teve que criar um modelo de tradução automática internamente.

Para isso, foi necessário um banco de dados com mais de 20 mil frases em awajún, língua considerada de poucos recursos digitais, ou seja, de baixa presença no universo digital.

Para obter o banco, as frases foram retiradas de algumas das poucas fontes existentes, como uma versão da Bíblia nesse idioma, além de histórias, poemas e documentos governamentais. Hidalgo explicou que:

“Houve uma investigação prévia por parte da equipe de desenvolvimento sobre se existia uma ferramenta adaptada para linguagens de poucos recursos”.

“Constatou-se que houve experiências com o desenvolvimento de um modelo semelhante ao sânscrito. E a partir daí eles o desenvolveram e sugeriram o uso do Tacotron 2″, disse.

Ferramenta de IA foi testada com comunicadores indígenas

“O Quispe Chequea foi testado com comunicadores indígenas e eles aprovaram a precisão dos resultados”, disse Tapullima. “Porém, a equipe pretende melhorar a qualidade do áudio, e para isso no momento estão testando outros softwares, como o FastPitch”.

“Era importante para nós que a mensagem fosse compreendida. É claro que há coisas que ainda precisam ser melhoradas, e isso é feito gerando mais dados e expandindo ainda mais a quantidade de dados”.

Atualmente, o Ojo Público está realizando um programa de treinamento com 12 emissoras de rádio das regiões amazônica e andina do Peru. 

O programa não aborda apenas como usar o Quispe Chequea, mas também a metodologia de verificação de fatos do meio.

Uma dessas emissoras é a Rádio Uno, da cidade de Tacna, no Sul do Peru, que atinge diversas comunidades remotas da região andina do país, na fronteira com o Chile e a Bolívia.

Emissora de rádio atinge comunidades indígenas remotas

Em 2023, a emissora passou a incluir manchetes em aimará em seus resumos de notícias. Com a ajuda de Quispe Chequea, a emissora poderá expandir o conteúdo nesse idioma e, assim, beneficiar as comunidades indígenas que alcança.

A redatora do site da Rádio Uno, Doris Rosas, disse que “Ter esta plataforma com tradução integral das notícias em aimará aproximaria ainda mais a informação desses setores”.

“A própria Rádio Uno está em dials em áreas remotas em AM, não apenas em FM. O que poderia ser melhor do que poder ouvi-la em sua linguagem natural?”.

Rosas e Fernando Rondinel, gerente da Rádio Uno, são os integrantes da equipe da emissora que participam do treinamento do Quispe Chequea.

Rosas falou que os seus colegas cuja língua nativa é o aimará aprovaram até agora a qualidade e precisão das mensagens que a ferramenta transmite.

Desafio é incluir mais idiomas indígenas

Embora o Ojo Público tenha contado com o apoio da Google News Initiative para o desenvolvimento da ferramenta, o desafio para este ano é encontrar um modelo de negócio que a torne sustentável e melhorá-la com a inclusão de mais idiomas, sem aplicar taxas de utilização para os veículos comunitários.

“Acho que [o Quispe Chequea] abre um precedente importante, tanto no país como no mundo. Existe um problema de marginalização dos povos indígenas no desenvolvimento da inteligência artificial”, disse Hidalgo.

“Acredito que o projeto ajuda justamente a proporcionar essa diversidade e inclusão das comunidades, e também a preservação das línguas nativas do nosso país”.

O avatar que aprendeu ‘quéchua’

Illariy é o nome da apresentadora do jornal universitário “Letras TV Willakun”, do canal da Faculdade de Letras e Humanidades da Universidade Nacional de San Marcos (UNMSM), em Lima.

Illariy fala quéchua, a língua indígena mais falada no país, e graças a isso se tornou uma celebridade entre a comunidade universitária que a assiste todos os dias nas telas do sistema de televisão da instituição.

O curioso é que Illariy não existe na vida real. Ela é um avatar criado com inteligência artificial que apresenta semanalmente notícias de interesse da comunidade universitária.

“Encontramos na inteligência artificial uma ferramenta para perpetuar a tradição e a língua, para evitar a sua extinção”, disse à LJR Carlos Fernández, professor de Comunicação Social da UNMSM e líder da equipe criativa de Illariy.

O avatar foi criado depois que Fernández e sua equipe produziram um anúncio para a divulgação da Pós-Graduação em Letras da instituição elaborado inteiramente com inteligência artificial.

Para essa chamada, o escritor peruano José María Arguedas foi recriado através de ferramentas generativas de voz e vídeo.

Anúncio para curso de pós-graduação criado por IA deu ideia para avatar

Dada a boa recepção do anúncio na universidade, Fernández pensou em fazer algo semelhante para a próxima temporada do “Letras TV Willakun”, que desde 2019 transmite notícias em quéchua para a comunidade universitária.

A equipe decidiu então criar um avatar que aparecesse no quadro narrando a notícia. Para isso, usaram o Dall-E, a ferramenta de inteligência artificial da OpenAI (organização que criou o ChatGPT) que gera imagens a partir de texto.

A equipe solicitou que a ferramenta gerasse uma mulher com traços físicos andinos e características da população da região.

Além disso, deram-lhe instruções precisas sobre o traje que deveria usar. Foi assim que nasceu Illariy, em 20 de março de 2023, cujo nome significa “amanhecer” em quéchua.

O próximo passo foi fazer com que Illariy falasse quéchua fluentemente sozinha. Para isso, a equipe recorreu ao D-ID, plataforma da empresa israelense de mesmo nome capaz de dar vida a imagens estáticas e falar com base em instruções de texto.

Línguas nativas são difíceis de encontrar em plataformas de IA

“Todas as plataformas de inteligência artificial de conversão de texto em voz tinham a particularidade de só terem disponíveis idiomas modernos. Havia espanhol, francês, inglês, mas o que não existia eram línguas nativas”, disse Fernández.

“O quéchua não está na equação das grandes empresas transnacionais de inteligência artificial”.

O professor e especialista em tecnologias emergentes aplicadas ao jornalismo teve uma ideia inovadora para contornar o obstáculo.

Junto com Óscar Huamán, pesquisador da Cátedra de Língua Quechua da Universidade, eles criaram um modelo fonético de palavras em quéchua, mas escritas com palavras em espanhol.

A equipe introduziu essas palavras no sistema D-ID para fazer Illariy falar. Após várias repetições, por meio de tentativa e erro, eles notaram que essa série de palavras, pronunciadas pelo avatar em espanhol da Nicarágua, soava muito semelhante ao quéchua fluente.

“Então começamos a buscar uma série de equivalências para que o avatar soasse [fiel ao que estava sendo dito] em quéchua apesar de usar espanhol”.

“Você põe o texto e pela forma como os nicaraguenses têm de pronunciar certas consoantes, soa como quéchua”, disse Fernandez.

Uso da inteligência artificial para criação de âncoras de notícias

Já existem vários exemplos de âncoras de notícias geradas com inteligência artificial na região. Para Fernández, a principal inovação de seu projeto é que, por meio de uma transcrição fonética, possibilitaram que Illariy narrasse a notícia em uma língua nativa.

Huamán, cuja língua nativa é o quéchua, é quem recebe as notas em espanhol da equipe de reportagem, as traduz para o quéchua e as transfere para o modelo fonético.

Em seguida, as palavras do modelo são inseridas no sistema e uma primeira versão em áudio das notas é gerada.

“Na edição, tenho que voltar e passar por outro filtro, [para verificar se] tanto a mensagem quanto o som estão ou não coerentes”, disse Huamán.

O linguista disse que, até agora, Illariy tem uma precisão entre 80 e 90% em comparação com o quéchua humano.

“Devido à própria estrutura que tem a língua, as frases têm tonalidade. É isso que está faltando.

Aí você pode melhorar trabalhando com segmentação [de palavras], ou usando letras maiúsculas, e em alguns casos pondo acentos”.

Avatar Illariy já falou em outras línguas indígenas

Em experimentos, a equipe já fez o avatar falar aimará e awajún, mas até agora as notícias semanais que o avatar divulga são apenas em quéchua.

“O que estamos fazendo aqui podemos recriar com o awajún, com o aymara e com outros dialetos do quéchua, e garantir que essas 48 línguas originais [que existem no Peru] não se percam”, disse Fernández.

“As línguas não são apenas palavras, mas também é a identidade cultural que está envolvida”.

Em quase um ano, Illariy passou da divulgação de notícias universitárias para a transmidialidade: agora, ensina quéchua no TikTok e tem seu próprio aplicativo na GPT Store, Illariy Willarisunki (“Illariy te conta”), que gera narrações em quéchua a partir de comandos em espanhol.

A equipe planeja melhorar a imagem do avatar e a qualidade de seus movimentos em 2024. Em breve, a personagem poderá passar do público universitário para o público de massa.

Inteligência artificial x empregos

Fernández disse que a UNMSM está conversando com alguns meios de comunicação tradicionais para colaborarem com Illariy.

Embora o orçamento do projeto seja coberto pela universidade, o professor sublinhou que os custos de produção da Illariy são próximos de zero, exceto os custos das versões premium de algumas ferramentas generativas de inteligência artificial que utilizam, que são relativamente acessíveis. Algumas outras ferramentas, disse ele, foram usadas com períodos de teste gratuitos.

Para Fernández, Illariy também é um exemplo que refuta as crenças de que a inteligência artificial veio para substituir o ser humano em seus empregos. No caso do avatar da UNMSM, pelo contrário, a tecnologia gerou mais trabalho.

“A pessoa que supostamente saiu de seu cargo é Óscar Huamán, que anteriormente fazia a locução do noticiário.

Mas na verdade Illariy acabou dando mais trabalho para ele, porque agora ele não só tem que traduzir, mas também é responsável pela transcrição fonética”.


Sobre o autor

César López Linares tem mestrado em jornalismo pela University of Texas em Austin e é bacharel em comunicação pela Universidad Nacional Autonoma de México. Escreve atualmente sobre inovação em jornalismo para a Fundação Gabo na Colômbia e para o blog LatAm Journalism Review do Centro Knight. 


Este artigo foi originalmente publicado na LatAm Journalism Review, um projeto do Knight Center for Journalism in the Americas (Universidade do Texas em Austin). Todos os direitos reservados ao autor.