Inteligência artificial

Um em cada três novos sites usa IA em textos causando ‘empobrecimento’ da linguagem na internet, revela estudo

Pesquisadores analisaram sites criados desde 2022, quando o ChatGPT foi lançado para o público, e encontraram problemas como a falta de diversidade semântica

Homem tocando teclado de notebook com imagem de IA na tela

Foto: Konkapo via Pixabay

Por Luciana Gurgel, MediaTalks

30.04.2026

A IA já não é apenas uma promessa tecnológica ou uma ferramenta usada nos bastidores para tarefas de apoio sem grande interferência no conteúdo final disponível na internet, com mostra um novo estudo de pesquisadores do Imperial College London, do Internet Archive e da Stanford University.

O levantamento estimou que cerca de 35% dos sites publicados até meados de 2025 tinham textos gerados ou assistidos por inteligência artificial. Hoje a taxa pode ser além.

A pesquisa, intitulada The Impact of AI-Generated Text on the Internet, analisou páginas arquivadas entre 2022 e 2025 pela Wayback Machine, do Internet Archive.

O objetivo dos autores foi medir a presença de textos gerados por IA na internet e avaliar possíveis impactos sobre o conteúdo online.

Jonas Dolezal, Sawood Alam, Mark Graham e Maty Bohacek partiram da nova era aberta pelo lançamento público do ChatGPT, em novembro de 2022.

Segundo o estudo, ferramentas de IA generativa tornaram mais fácil produzir textos em grande escala e começaram a levantar preocupações sobre possíveis mudanças na qualidade, diversidade e precisão das informações online.

Para investigar essas questões, os pesquisadores reuniram uma amostra de sites publicamente acessíveis colocados no ar entre 2022 e 2025. Como não existe um índice central da internet, o estudo recorreu ao acervo da Wayback Machine e aplicou uma estratégia de amostragem estratificada.

Segundo os autores, a proporção de sites classificados como gerados ou assistidos por IA era próxima de zero antes do lançamento do ChatGPT, embora a IA generativa já existisse.

Em meados de 2025, essa fatia havia chegado a aproximadamente 35% entre os sites recém-publicados.

IA na internet cresceu depois do ChatGPT

O estudo afirma que a detecção de texto gerado por inteligência artificial continua sendo um desafio, já que eles podem ser totalmente gerados por IA, apenas assistidos por IA ou revisados por humanos.

Por isso, os autores testaram quatro métodos de detecção selecionados com base em desempenho em benchmarks da área: Binoculars, Desklib, DivEye e Pangram v3.

Depois de verificações de confiabilidade envolvendo extensão do texto, HTML, texto puro, famílias de modelos, versões de modelos e idioma, o estudo escolheu o Pangram v3 como detector principal.

A partir dessa metodologia, os pesquisadores identificaram aumento consistente da presença de textos gerados ou assistidos por IA em sites novos depois do lançamento do ChatGPT.

O que o estudo encontrou sobre IA na internet

O estudo avaliou seis hipóteses sobre possíveis efeitos negativos da disseminação de textos gerados por inteligência artificial. Segundo os autores, os resultados confirmaram duas delas.

A primeira é a chamada contração semântica. De acordo com a pesquisa, sites classificados como gerados por IA apresentaram similaridade semântica 33% maior do que sites não classificados dessa forma.

Para os autores, esse resultado indica menor diversidade semântica nos textos associados à IA, um empobrecimento da linguagem.

A segunda hipótese confirmada é o aumento de sentimento positivo. O estudo identificou que sites classificados como gerados por IA tiveram pontuação de sentimento positivo 107% maior do que os demais.

Segundo os autores, esses resultados indicam uma associação entre a presença de textos gerados por IA e mudanças mensuráveis no conteúdo online, especialmente na diversidade semântica e no tom dos textos.

Nem todas as suspeitas sobre IA na internet foram confirmadas

Apesar das evidências sobre redução de diversidade semântica e aumento de sentimento positivo, o estudo não encontrou apoio estatisticamente significativo para outras quatro hipóteses analisadas.

Uma delas era a possibilidade de que a disseminação de textos gerados por IA estivesse associada a uma redução da precisão factual. A pesquisa não encontrou correlação estatisticamente significativa entre maior presença de IA e queda na precisão.

Também não houve confirmação de que sites com mais textos gerados por IA apresentassem menos links externos, nem de que os conteúdos se tornassem mais longos e semanticamente mais diluídos.

Outra hipótese não confirmada foi a de redução da diversidade estilística. Embora essa preocupação tenha aparecido na pesquisa de opinião conduzida pelos autores, a análise quantitativa não encontrou evidência estatisticamente significativa de uma convergência dos textos para um estilo único.

A percepção pública sobre IA na internet é mais negativa que os dados

Além da análise de páginas arquivadas, o estudo incluiu uma pesquisa com 853 adultos nos Estados Unidos. Os participantes foram questionados sobre seus hábitos de uso de ferramentas de IA, sua visão geral sobre o impacto da tecnologia na sociedade e suas crenças sobre seis possíveis efeitos negativos dos textos gerados por IA na internet.

Segundo os autores, a maioria dos adultos entrevistados acredita nas seis hipóteses negativas apresentadas na pesquisa.

No entanto, a análise quantitativa confirmou apenas duas delas: a contração semântica e o aumento de sentimento positivo, apontando uma divergência entre realidade e percepção.

Segundo os pesquisadores, os resultados oferecem uma base para o debate sobre textos gerados por IA na internet.

O estudo também ressalta que a detecção desse tipo de conteúdo permanece tecnicamente difícil e que os efeitos da IA generativa sobre o conteúdo informativo online devem continuar sendo monitorados.

O estudo completo pode ser visto aqui.