A Rede Global de Jornalismo Investigativo (GIJN) criou um guia com dicas para jornalistas criarem seus próprios bancos de dados para reportagens investigativas.
Miriam Forezo Ariza, jornalista colombiana especializada em investigação e dados, apresenta exemplos de projetos de jornalismo investigativo que reuniram informações que não estavam disponíveis publicamente ou de difícil acesso.
Um deles vem da Colômbia, projetado pela organização Rotas do Conflito, que construiu um banco de dados para registrar as mortes durante protestos e conflitos armados no país. O grupo criou mapeamentos, cronogramas, gráficos, entre outras ferramentas para facilitar o acompanhamento da situação.
Jornalismo de dados contra o crime
Em outra iniciativa, um grupo de jornalistas de 12 países construiu um banco de dados com informações nunca sistematizadas antes, sobre mais de 2.400 casos de violência contra defensores dos direitos ambientais na América Latina. O trabalho resultou em 36 matérias investigativas, publicados no projeto especial Terra da Resistência.
A GIJN cita também matérias sobre bens apreendidos de criminosos na Itália e sobre uso de tazer e abuso da força policial nos Estados Unidos.
“Esses projetos são notáveis por terem reunido dados que não estavam disponíveis publicamente, ou não foram centralizados, para gerar reportagens de grande impacto, mas que não teriam sido possíveis sem os bancos de dados que permitiram aos repórteres aprofundar a história.
Jornalistas investigativos também podem criar bancos de dados em uma escala menor e ainda assim ter um impacto enorme”, afirma a instituição.
Confira a seguir as dicas elaboradas para o guia:
Prepare os dados
- Explore os documentos dos quais você extrairá os dados. Identifique padrões que darão pistas sobre como estruturar o banco de dados.
- Se está começando do zero e buscará registros de entrevistas e reportagens, analise casos ou histórias semelhantes para encontrar “denominadores comuns”. Neste estágio de exploração, conversar com especialistas pode ser útil.
- Defina o escopo dos dados a serem coletados. Qual período cobrirão? Quais casos serão incluídos e quais excluídos? Haverá um limite para o número de registros?
- Os recursos do seu projeto – tempo, equipe, fundos, tecnologia, etc. – o ajudarão a responder a essas perguntas.
- Faça uma lista das perguntas que deseja responder durante a investigação. Isso guiará o design do banco de dados.
- Estimule o trabalho em equipe, principalmente nesta fase inicial.
Leia também
Unesco vai treinar policiais em todo o mundo para proteger jornalismo durante manifestações
Projetando e desenvolvendo o banco de dados
- Comece definindo o que cada registro (linha) vai conter: casos, pessoas, lugares, produtos, eventos, países, transações, etc.
- Em seguida, faça uma lista dos elementos que ajudarão a identificar cada registro: esses serão seus campos (colunas). Por exemplo, se cada linha for uma pessoa, os campos podem ser nome, número de identificação, idade, local, profissão, etc.
- Defina uma chave para cada registro. Os números de identificação são uma ideia melhor (quando disponíveis) do que nomes. Você também pode inventar códigos combinando dois ou três aspectos que tornam cada registro único. Essa chave será essencial se você precisar fazer uma verificação cruzada entre dois ou mais conjuntos de dados.
- Além dos campos identificadores, inclua outras notas para detalhes – geralmente parágrafos curtos que serão úteis para a narrativa – e outras para classificação, como aquelas que se referem a características comuns e que estabelecem categorias.
- Para esses campos de categoria, é útil pensar sobre qual matéria pode sair de cada um deles. Por exemplo, você pode incluir uma coluna para “raça” para analisar se há um padrão de racismo envolvido em um determinado conjunto de dados.
- A uniformidade é fundamental. Portanto, use as configurações de validação para garantir que os números sejam digitados como números, as datas estejam no formato correto e as categorias sejam sempre escritas da mesma maneira. Sempre que possível, faça campos de seleção múltipla em vez de perguntas abertas.
- Inclua campos para identificar quem insere cada informação e qual é a fonte original. Isso será útil se você precisar verificar dados posteriormente.
- Tente não exagerar no número de campos. Crie apenas aqueles que serão relevantes para sua investigação, bem como para a análise dos dados, e aqueles que sua equipe poderá preencher.
- Seu banco de dados pode precisar de mais de uma tabela, dependendo da complexidade do tópico e das relações entre os elementos envolvidos.
- Certifique-se de que o design do banco de dados seja amigável para todos os envolvidos no projeto, independentemente do nível de tecnologia.
- Torne o banco de dados escalável: seu design pode ser a primeira etapa de um futuro projeto maior, seja por você e sua equipe ou outra pessoa.
Teste o projeto
- Execute um teste piloto do banco de dados. Preencha alguns registros para ver se funciona da maneira que você espera e para avaliar se será útil para as reportagens.
- Uma boa maneira de estimar quanto tempo o projeto pode levar: meça e calcule o tempo médio que leva para adicionar um novo registro e confirmar as informações.
- Faça uma lista de “e se” para analisar possíveis obstáculos ou erros e estabelecer como você os contornará.
- Avalie a confiabilidade e a consistência dos campos mais importantes. Se houver várias fontes dizendo coisas diferentes — o que é comum com números ou datas — pode-se mover as informações para uma coluna de detalhes, na qual você pode descrever a discordância para depois checar quem está dizendo a verdade.
Preencha o banco de dados
- Aplique o que você aprendeu e descobriu no estágio de testes para dar um treinamento prático aos repórteres que irão coletar, inserir e analisar as informações no banco de dados. Certifique-se de que todos entendam os conceitos e categorias da mesma maneira.
- Utilize ferramentas de armazenamento colaborativo, para que o acesso não dependa de apenas uma pessoa.
- Divida os dados usando as categorias definidas no estágio de design para que as regras sejam claras sobre quem coleta quais informações e como evitar a duplicação.
- Se você precisar extrair dados da web ou de documentos de texto, concentre seus esforços no que é mais relevante para sua investigação e no que determinará o foco de suas reportagens.
- Se a quantidade de dados que você possui for muito grande para ser administrada, considere contratar um profissional externo ou empresa para transcrever os documentos em um banco de dados previamente projetado com sua redação.
Leia também
Em três meses de 2022, total de jornalistas mortos no mundo já é metade de todo o ano passado
Auditoria e checagem de fatos
- Construir o banco de dados é apenas a primeira etapa da investigação. Antes de analisar os dados e tirar conclusões, é necessário confirmá-los com as fontes originais, sejam elas documentos ou personagens principais das reportagens.
- Decida que tipo de auditoria você fará, que irá variar dependendo do escopo do projeto. É possível verificar cada registro cruzando os dados com os documentos originais ou pode realizar verificações aleatórias, mas eles devem abranger um número significativo de registros no banco de dados. Em qualquer um dos cenários, a pessoa que analisa os dados não deve ser a pessoa que os inseriu.
- O que se deve procurar na auditoria? Erros de digitação, números, datas, repetições e registros que não atendem aos critérios.
- Duas ideias para revisar números: fazer o sistema somar automaticamente os totais e compará-los com os dos documentos originais, e classificar os dados para encontrar outliers (números que são muito grandes ou muito pequenos e podem ser um erro).
- O banco de dados não estará pronto para uso até que passe por: verificação de fatos, auditoria de dados, confrontos de fontes pessoais e revisão jurídica.
Dicas de programas úteis
Um jornalista não precisa se tornar um desenvolvedor de sistemas para trabalhar em um projeto de banco de dados. Em vez disso, é mais indicado incluir alguém com esse conhecimento na equipe e trabalhar em parceria. Esta lista de ferramentas pode ser útil:
- Aplicativos para criar um formulário da web que ajudam os repórteres a preencherem o banco de dados: Google Forms, Node.js, Django ou Flask.
- Armazenamento do banco de dados: MongoDB Atlas ou Firebase do Google.
- Para estruturar e processar dados: Python (que pode ser conectado às opções de armazenamento mencionadas acima), PostgreSQL, ELK Stack e Filemaker.
- Para extração de dados e conversão de PDF: Wondershare Pdf Converter Pro, conversor básico de documentos do Google, iLovePDF, Smallpdf, Tabula, Import.io.
- É possível baixar os dados do sistema de banco de dados e trabalhar nele com o Excel ou o Google Spreadsheets. Começar com um desses também pode ser a melhor opção para projetos menores.
Recomendações finais da GIJN
- A segurança é crucial nesses projetos. Use comunicações criptografadas, faça backup dos dados e valorize sua segurança pessoal.
- Aprenda a usar o Excel, mas também colabore com cientistas e desenvolvedores de dados.
- Esteja ciente dos instrumentos que podem tornar o trabalho mais fácil: ferramentas para raspagem, formulários online para preencher o banco de dados, conversores de PDF, digitalização com OCR (reconhecimento óptico de caracteres) e processamento de texto massivo.
- Como essas iniciativas geralmente requerem equipes grandes, decida quem será o líder do projeto e considere as recomendações para colaborações investigativas.
- Torne a metodologia e as fontes transparentes para o seu público, assumindo que os protocolos de segurança e proteção permitem isso. Mostre uma amostra dos documentos originais a partir dos quais você criou o banco de dados para construir credibilidade.
- Publique suas informações de contato junto com a investigação para que os leitores possam entrar em contato com perguntas ou caso vejam um erro no banco de dados.
Leia também
Na internet, na rua, no restaurante: dicas de segurança para repórteres investigativos