Aunque parecen fríos y exactos, los datos pueden despertar emociones y tener sesgos. “¿Quién hizo esta base de datos?, ¿por qué incluyó unas variables y otras no?, ¿los números que estoy sumando representan personas?, ¿cuáles son sus historias?”. Estas son algunas de las preguntas que se ha hecho Mago Torres, editora e investigadora de datos con amplia experiencia en trabajos periodísticos colaborativos. En la tercera edición del ‘Taller Logan de prácticas investigativas’, que se realizó entre el 29 de enero y el 2 de febrero de 2024, Torres compartió su método con periodistas de 10 países latinoamericanos.
¿Cómo trabajar con datos?
Hay cuatro pasos para empezar a encontrar las historias que están en los datos: recolectar, analizar, limpiar y visualizar. A continuación lo que implica cada uno:
1. Recolectar. ¿Dónde?
Se pueden descargar de una fuente original, es decir, bases de datos disponibles en internet. También a través de peticiones de información pública, de creación propia o incluso “raspándolos” de páginas web. Cada una de estas opciones tiene sus retos. Por ejemplo, las bases de datos casi nunca están limpias; la información que envían las entidades a veces vienen en distintos formatos e incluso en documentos fotocopiados; y para rascar datos se necesita realizar un paso extra, que es utilizar una herramienta que tome la información de la web y la ponga en una hoja de cálculo.
Una herramienta: la extensión Data Miner o Instant Data Scraper son gratuitas y muy útiles.
2. Limpiar. ¿Qué?
Este proceso trata de corregir problemas en la base de datos. Para esto hay que tener claro qué es lo que se corrige. Por ejemplo, información incorrecta o incompleta, formatos que no son adecuados o datos duplicados. “Los datos no siempre –o casi nunca– tienen buena calidad”, afirma Torres. Para eso, el periodista debe estar atento, pues es usual que quienes hacen las bases de datos cambien de metodologías o de variables.
3. Analizar. ¿Qué?
Qué nos dicen los datos. Es necesario ver las relaciones, cruzar variables, comparar, interpretar y siempre verificar. Los números se tienen que conectar con historias humanas, pues en sí mismos no pueden contarlas en toda su dimensión.
4. Visualizar. ¿Cómo?
Los productos editoriales sí pueden ser completamente visuales, pero “no todo tiene que terminar en una visualización”, explica Mago Torres. “Tampoco se hace automático. Por ejemplo, que la información sea geográfica no quiere decir que necesariamente es un mapa. Hay que dedicar tiempo a identificar y crear la forma visual que más le sirve a la historia”, enfatiza. Para esto se pueden usar herramientas que ofrecen formatos accesibles que no obstaculizan la navegación web en móvil o escritorio.
Una herramienta: Datawrapper.
¿Y si la visualización publicada no es el objetivo, entonces cuál es? Las visualizaciones pueden ser muy útiles para continuar la reportería.
¿Qué se puede hacer con datos?
El periodismo de datos, para Mago Torres, es en esencia colaborativo y busca lograr una historia potente. A veces la historia puede ser la visualización en sí misma, pero casi siempre los datos son una fuente más. Y hay que interrogarla: ¿quién los creó?, ¿qué afiliaciones tienen?, ¿cuál es su metodología?, ¿cuáles son sus limitaciones? ¿qué es lo que no dicen y por qué?
Entonces, ¿para qué sirven las bases de datos?
-
Estructurar: para determinar las categorías necesarias de acuerdo con lo que se necesita de esa base de datos, es decir, con la conceptualización que le da el periodista. Incluso para determinar si hace falta agregar información.
-
Cruzar historias: para evidenciar conexiones, de manera interna o externa.
-
Verificar: relacionar una afirmación con la fuente o los datos.
-
Preparar un flujo de trabajo: en equipos grandes es importante documentar el propio proceso de trabajo y analizarlo. Una base de datos construida por el equipo puede facilitarlo.
-
Como herramienta de análisis: calcular costos, inflación o comparación entre monedas de distintos países. Por ejemplo, en la investigación ‘El negocio de la represión’, un equipo periodístico analizó cuatro años del gasto público destinado a armas no letales y a equipos antimotines. Sin el análisis de los datos hubiera sido imposible dar una interpretación de los gastos.
-
Visualizar: hay información que es más fácil de comprender si no se muestra, sino que se dice. En ese caso la visualización puede ser útil para llegar a la conclusión. La visualización queda en la sala de redacción y la frase resultado sale a la audiencia.
Valores y recomendaciones
Para Mago Torres hay cuatro valores fundamentales para hacer periodismo de datos:
- Curiosidad: es posible que el o la reportera sepa cuál autoridad o colectivo tiene la información que necesita o en qué página está la base de datos. Pero, es importante tomarse un minuto y preguntarse: ¿quién más puede estar recopilando información de este tipo?, ¿en otros países han hecho algo parecido o de esta manera?
- Paciencia: recopilar información tarda. Tras una solicitud de información, hay que esperar que la entreguen, presentar una réplica para corregir información, o dedicar tiempo a corregir o volver a pedir si la información no viene en el formato necesario. “Encontrar el proceso adecuado para trabajar necesita tiempo”, afirma.
- Atención al detalle: si hay que hacer análisis de datos, será importante tener claro qué está mostrando la visualización, si en eso termina la información. “¿Queremos una visualización pomposa o queremos que sirva para un propósito específico para nuestras audiencias? ¿Las descripciones y las variables son claras? ¿El tipo de visualización es clara? ¿El contenido se presta para malas interpretaciones?”, pregunta.
- Organización: tanto como sea posible. Por ejemplo, determinar dónde y cómo estarán los documentos en los que se toman notas de las conversaciones del equipo editorial y se hacen acuerdos, o cómo se organizan las carpetas, dónde se documenta la fuente original de una base de datos, dónde se documentan los cambios y las versiones finales.
Aún tras interiorizar los procesos, vale la pena tener en cuenta tres claves más:
- Revisar las matemáticas: no es lo mismo un porcentaje que un punto porcentual y el tamaño de la muestra puede no ser el adecuado.
- Asegurarse de que la plataforma utilizada sea adecuada: ¿una historia compleja es para todo tipo de audiencia?, ¿los diferentes tipos de audiencia consumen información de la misma manera?, ¿debería haber modificaciones en el trabajo de acuerdo con la plataforma en la que se presentará el trabajo?
- Hay una relación con los datos con los que se trabaja: los y las periodistas tienen sesgos, expectativas, filias y fobias sobre lo que van a encontrar, aunque “eso” no esté en los datos. Además, trabajar con datos también puede tener una carga emocional.
Sobre Mago Torres
Colaboradora del CLIP, especializada en periodismo de datos. Tiene amplia experiencia desarrollando bases de datos ad-hoc e investigación especializada para proyectos colaborativos. Trabajó como investigadora de datos para ICIJ en los Panama Papers y para el GIJN como directora de investigación.
Mago es directora del Programa The Data-Driven Reporting Project para la Northwestern University, EE.UU, cofundadora de la red Periodistas de a pie, México, y tiene un Doctorado en Estudios Humanísticos especializado en Ética, emitido por la Universidad Tecnológico de Monterrey, Ciudad de México.
Sobre el ‘Taller Logan de prácticas investigativas’
El taller ofrece herramientas destinadas a fortalecer la práctica investigativa en Iberoamérica a través del fomento de historias de impacto e interés público que aborden cuestiones como el abuso de poder, la corrupción, el crimen organizado y otras irregularidades que merecen una atención destacada. Es ofrecido por la Fundación Gabo en alianza con el Centre for Investigative Journalism (CIJ) y el Centro Latinoamericano de Periodismo de Investigación (CLIP), y con el apoyo de The Reva & David Logan Foundation.