Relatoría del taller ‘Periodismo de datos: buscando nuevas y buenas historias’, con Ginna Morelo
4 de Octubre de 2021

Relatoría del taller ‘Periodismo de datos: buscando nuevas y buenas historias’, con Ginna Morelo

Lecciones, consejos y herramientas compartidas por la periodista Ginna Morelo, el ingeniero y diseñador gráfico Jorge Morelo y el periodista de investigación y datos José Díaz Tovar durante este taller virtual impartido 15 periodistas de la Región Caribe colombiana.
La periodista y editora Ginna Morelo durante un taller de la Fundación Gabo.
Tatiana Velásquez Archibold

Cómo contar una historia desde la metodología del periodismo de datos y cómo contarla para no aburrir a la audiencia y hacer que se divierta con los números, fueron los dos principales interrogantes sobre los cuales 15 periodistas del Caribe colombiano reflexionaron, entre el 9 y el 27 de agosto, en el taller Periodismo de datos: buscando nuevas y buenas historias’.

De la mano de la periodista colombiana Ginna Morelo, el ingeniero y diseñador gráfico Jorge Morelo y el periodista de investigación y datos José Díaz Tovar, los reporteros aprendieron sobre esta metodología y se familiarizaron con herramientas para investigar, analizar y visualizar los datos.

Estos fueron los aprendizajes que dejaron las ocho sesiones de este taller, que se desarrolló virtualmente a través de la plataforma Zoom.

La desinformación, una pandemia

La maestra Ginna Morelo dedicó la primera etapa del taller a alertar sobre una industria cada vez más lucrativa y peligrosa para las democracias modernas: la desinformación.

Basándose en hallazgos de un estudio realizado en 81 países por el Instituto Reuters de la Universidad de Oxford, Morelo resaltó que:

  • La desinformación facturó 70 millones de dólares en 2020.

  • 10 millones de dólares se usaron para pagar pauta en Facebook y los 60 millones restantes en contratos con empresas asesoras de redes y medios sociales.

  • En 2020, las bodegas digitales aumentaron un 16%. Es decir, hubo mayor presencia digital de personas o perfiles falsos configurados para publicar y viralizar mensajes en redes sociales con fines políticos, sociales o de propaganda.

  • 81 países tienen bodegas activas, entre ellos Colombia.

  • 65 empresas privadas prestan servicios de desinformación.

  • 90% de los casos involucran al gobierno y a los partidos políticos.

  • 73% de los casos son campañas de acoso o matoneo virtual contra determinados perfiles (políticos, periodistas, líderes de opinión, etc).

  • 48% de los casos impulsan la polarización y división social.

Ante este panorama tan desafiante de polarización y desinformación, Morelo propuso apostar por los datos, que pueden convertirse en parte del antídoto contra los bulos, las verdades a medias o las narrativas instrumentalizadas por intereses políticos o económicos.

“Pasamos de la escasez de información a mucha información. Vivimos en medio de la infoxicación y ahora el desafío del periodismo está en adquirir técnicas para procesar toda esa información, que debe llegarle de manera clara a la audiencia”, resaltó Morelo.

Entonces, de qué hablamos cuando hablamos de periodismo de datos.

¿Qué es periodismo de datos?

También llamado periodismo de precisión o periodismo asistido por computadora, este método de trabajo plantea un escenario en el que los científicos sociales y los periodistas de investigación trabajan en equipo.

Phillip Meyer, periodista estadounidense y pionero de esta metodología, insistía desde los años 50 en la necesaria pero incipiente apropiación de los métodos de la investigación social desde el periodismo.

En aquellos años, Meyer comenzó a moldear su método a partir de una queja ciudadana por los altos costos de los seguros escolares contra incendios y huracanes en los Estados Unidos. Decidió recolectar información para construir una base de datos propia y no depender tanto de las fuentes oficiales.  

Su método lo detalla en el libro Periodismo de precisión, editado en español y un clásico ya de la literatura periodística.

Desde entonces, esa metodología se ha ido consolidando. Algunas de sus características son:

  • Se basa en la investigación a profundidad.

  • Apuesta por la precisión.

  • El análisis de los datos es medular al proceso.

  • Requiere la revisión de enormes cantidades de documentos.

  • Necesita un procesamiento y asignación de categorías de búsqueda, que permitan hacer usable y comprensible los contenidos.

¿En qué se diferencia del método tradicional periodístico? 

  • En que los periodistas deben procesar grandes cantidades de datos para llegar a hallazgos sorprendentes.

  • En qué combina el obligatorio olfato para las noticias y la capacidad de narrar una historia convincente, con la escala y alcance de la información digital disponible.

  • En que le acerca al ciudadano la información incomprensible que producen los gobiernos y las empresas.

  • En que plantea una nueva forma de narrar las historias a partir de un periodismo para explicar.

  • En que permite nuevos enfoques y abordajes, incluso, de temáticas que suelen ser constantes o predecibles en las agendas periodísticas.

  • En que ayuda al periodista a contar una historia convincente con una carga de datos alta, especialmente clave en tiempos en que el ciudadano cada vez es más dado a dudar y a no creer en nada.

  • En que ayuda al periodista en su labor de explicarles a las audiencias cómo se relacionan los fenómenos con ellos. Y quizá sea ese el aspecto más importante de esta metodología porque el periodista se debe al ciudadano.

Lo multidisciplinar, la clave de los equipos de periodismo de datos

La riqueza de un equipo de periodismo de datos está en la suma de varias disciplinas, que al final se complementan. Por eso, entre más diverso, más exitoso será este equipo. Entre sus perfiles están: 

  • Reporteros 

  • Ingenieros de sistemas

  • Diseñadores

  • Analistas de datos, muchas veces académicos que trabajan en llave con los periodistas para interpretar grandes cantidades de datos. 

En Latinoamérica, esta metodología tiene dos pioneras cuyo trabajo es fuente de inspiración:

  • Gianina Segnigni: periodista costarricense que lideró hasta 2014 el equipo de investigación de La Nación de Costa Rica y por cuyas revelaciones dos expresidentes de ese país fueron enjuiciados. Ganadora del Reconocimiento a la Excelencia del Premio Gabo en 2013. Actualmente es la directora del máster en Periodismo de Datos e Investigación de la Universidad de Columbia en Nueva York. 

  • Sandra Crucianelli: periodista argentina, creadora del portal Sololocal.info, que cubre la realidad de su ciudad natal Bahía Blanca, con fuentes digitales y basándose en la metodología de datos. Crucianelli fue instructora del primer curso masivo online de periodismo de datos en español y es autora de varios tutoriales que permiten un primer acercamiento a esta metodología o profundizar en ella.

El proceso del periodismo de datos

Si bien esta metodología puede ser abrumadora para quienes recién comienzan a familiarizarse con ella, la maestra Morelo resaltó que tiene niveles de complejidad que permiten ir escalando según el alcance de las historias, los perfiles de los equipos de datos y las destrezas y herramientas a las que se tengan acceso. 

  • Hay proyectos pequeños, cuyo nivel de datos puede procesarse y analizarse, incluso, en menos de una semana.

  • Hay unas historias de largo aliento, es decir, proyectos periodísticos que le toman semanas o meses de trabajo al equipo, debido al volumen de datos por analizar y visualizar.

Sea cual sea el camino que el equipo periodístico transite, hay seis pasos básicos que deben seguirse.

1. La planeación, punto de partida 

La planeación es particularmente clave en el periodismo de datos porque facilitará las etapas futuras, que implicarán mucha dedicación para recolectar, limpiar, analizar, contextualizar y visualizar los datos. También porque esta etapa de la metodología exige tener claros los datos que se analizarán y los elementos narrativos que incluirá la historia.

Antes de empezar cualquier proyecto periodístico, es clave delimitar la idea de investigación. Para ello, una herramienta aliada es la matriz Data Racker, diseñada por la maestra Morelo para Consejo de Redacción, organización de periodismo colombiano de la cual es cofundadora. 

El nombre de la matriz, que significa auscultar entre los datos, es un juego de palabras inspirado en los muckrakers o rastrilladores de basura o estiércol, como el presidente de los Estados Unidos Theodore Roosevelt llamaba a los periodistas de investigación por excavar hasta lo más subterráneo de la sociedad.

La matriz busca que el equipo periodístico sea capaz de:

  • Sustentar su historia en una oración completa porque sin hipótesis no hay un punto de partida sólido para investigar. “Cuando pensamos en datos, al igual que en cualquier otro trabajo periodístico, debemos plantear quién hace qué a quiénes”, aconsejó la maestra.

  • Responder cuál es la pregunta principal que la historia busca resolver.

  • Responder preguntas secundarias que se desprenden del interrogante central de la investigación.

  • Cruzar datos para generar nuevas pistas investigativas.

  • Identificar las fuentes a las que acudirán los reporteros. Y para ello, la matriz plantea una tipología, basada en The Art and Craft of Feature Writing, de William Blundell. Es decir:

  • Consultar a un experto, una persona que ha estudiado el tema y se ha especializado en entenderlo por completo.

  • Consultar a un sabio, una persona que es experta en el tema investigado porque está en el territorio viviendo ese asunto o fenómeno.

  • Consultar a un señor o a una señora de los documentos, una persona que tiene acceso a las bases de datos porque las alimenta por trabajo o interés académico. De esta categoría también forman parte las bases de datos en sí mismas o la documentación (digitalizada o no) que exista sobre el tema en cuestión.

  • Consultar a los protagonistas y/o antagonistas, es decir, a quienes vivieron los hechos o fueron testigos de ellos.

  • Identificar las bases de datos a consultar durante la reportería.

  • Proyectar los formatos narrativos para contar la historia (podcast, comic, reportaje escrito, etc).

  • Identificar las barreras de la investigación y las posibles soluciones para garantizar que la historia terminará en puerto seguro.

  • Identificar las herramientas para visualizar la historia.

2. Minería de datos

El segundo de los seis pasos de esta metodología periodística consiste en identificar dónde están los datos y cómo pueden recopilarse.

En esta etapa, la maestra Morelo les recomendó a los reporteros colombianos preguntarse:

  • ¿De qué datos partirán para investigar? 

  • ¿Cómo conseguirán los datos para su investigación? 

  • ¿Qué datos les permitirán detectar patrones que se convertirán en el foco de sus historias?

  • ¿Hay bases de datos sobre el tema que quieren investigar o deben construirlas desde cero?

  • ¿Cómo y para qué fueron hechas las bases de datos que están disponibles?

  • ¿Están los datos en un sitio web oficial? 

  • ¿Deben pedir la información faltante a través de la Ley de Transparencia?

  • Si la base de datos para sus historias está en la web, ¿es descargable? ¿Cómo la podrán descargar?

Como esta etapa del proceso también puede ser abrumadora, Morelo les recordó a los talleristas, invocando al célebre reportero colombiano Germán Castro Caycedo, que un periodista no tiene que saberlo todo, pero tiene que saber a quién preguntarle la información que necesita.

“Tenemos que dedicar espacios para recabar datos porque no podemos quedarnos solamente con lo que está disponible”, aconsejó. 

Por eso recomendó dedicar al menos un día a la semana a la minería de datos, proceso que se facilita navegando la web con ojos críticos; consultando estudios, informes o encuestas, y formulando peticiones informativas estructuradas. Estas últimas son largos y detallados cuestionarios, que los periodistas pueden enviarles a las entidades públicas, amparados por la Ley de Transparencia. Con esas respuestas podrán construir sus bases de datos.

La maestra también compartió un listado de recursos que pueden ser útiles a los reporteros que quieran comenzar a recabar información para armar sus propias bases de datos.

3. Refinación de los datos

El tercero de los seis pasos de esta metodología periodística es la limpieza de datos, una etapa crucial para evitar errores en el futuro análisis. De esta manera, es aquí donde el equipo soluciona los posibles registros duplicados, casillas incompletas o palabras mal escritas que puedan tener las bases de datos.

Para ello hay software aliado, cuyo uso dependerá del grado de limpieza que exijan los datos. Es posible limpiar datos en un nivel básico con Excel o intermedio con Open Refine. El primero es un programa de Microsoft y exige licencia paga para su uso, mientras que el segundo es de libre descarga.

Para procesos de limpieza mucho más complejos, por la cantidad de datos a procesar o por el desafío que supone su organización, hay software más avanzado, que requiere de expertos en programación, como Mongo DB.

La refinación de los datos requiere total dedicación porque, resaltó la maestra Morelo, “un trabajo de datos con errores por falta de limpieza se cae rapidísimo”.

4. Análisis de datos

El cuarto de los seis pasos de esta metodología periodística es el análisis o interpretación de los datos, una etapa que le exige al equipo encontrar los patrones que, luego, deberán contextualizar para explicárselos a las audiencias en un lenguaje mucho más sencillo.

“Sin análisis no hay una buena historia. No hay un ángulo creativo nuevo, no hay visualización”, enfatizó Morelo.

En esta etapa los reporteros deben:

  • Relacionar

  • Comparar

  • Cruzar

  • Comprobar

  • Descartar

  • Interpretar

  • Verificar

Y para que este paso sea posible, Morelo recomendó:

  • Conocer todos los términos y variables que componen las bases de datos.

  • Entender cómo se recolectaron los datos.

  • Revisar la matriz Data Racker para recordar las preguntas que la investigación busca responder. De esa manera, se establecen categorías y los reporteros estarán seguros de que las preguntas que dispararon la investigación las están respondiendo.

A la hora de interpretar:

  • Hay que definir una técnica de análisis, que puede ser cuantitativa o cualitativa. Ambas permiten encontrar relaciones, tendencias, ordenar y filtrar la información según las preguntas formuladas en la fase de planeación de la historia. Los reporteros pueden combinar ambas posibilidades o darle prelación a una sobre la otra.

  • Hay que recordar que un cruce de datos permite establecer tendencias, patrones o procesos evolutivos en un periodo determinado de análisis.

  • Es clave no asumir más allá de lo que los datos muestran. Las bases de datos analizadas pueden retratar solamente una parte de un fenómeno. Por ejemplo, a partir de las estadísticas de denuncias de determinados delitos no puede inferirse que esos casos son los únicos en determinado contexto geográfico. Puede haber un subregistro por muchas razones, entre ellas la desconfianza ciudadana a las instituciones o el miedo de las víctimas a denunciar. 

  • Peras con peras; manzanas con manzanas. Si el equipo periodístico quiere cruzar datos para sacar patrones, debe tener la certeza de que compara información recolectada bajo las mismas características y que ésta cuenta o representa lo mismo. Recordar los principios básicos de matemáticas estudiados en la escuela, explicó Morelo, es clave para no mezclar peras con manzanas ni cimentar la investigación en análisis estadísticos errados. 

  • Los reporteros tampoco deben olvidar cuestionarse si hay alguna limitación o algún ángulo que no han considerado durante su análisis.

5. Trabajo de campo o reportería en calle

La base de datos es solo parte del proceso investigativo. La información que de ella sale debe contrastarse entrevistando a más fuentes y visitando los sitios que cada historia exija.

Si bien ejercer el periodismo de datos requiere mucho tiempo frente al computador, una capacidad glúteo-cerebral, según el galardonado periodista de investigación argentino Daniel Santoro, es una metodología que también necesita reportería tradicional en terreno.

6. Diseño, visualización y experiencia de usuario

El último paso del proceso de esta metodología le apuesta al diseño y desarrollo de los insumos que compondrán la historia, es decir, a los infográficos y visualizaciones que acompañarán el reportaje central de la investigación.

Es aquí donde el equipo construye los formatos a través de los cuales la audiencia consumirá la investigación. 

Especialmente a la hora de visualizar los datos, el diseñador Jorge Morelo recomendó:

  • Recordar que entre más sencillos sean los gráficos, más fácil será para la audiencia interpretarlos.

  • Si un gráfico necesita muchas instrucciones es porque no está bien visualizado y, por tanto, no será de fácil consumo para la audiencia.

  • Tener toda la información completa y los datos estructurados.

  • Limpiar los datos: no pueden haber columnas sin información o datos escritos de distintas formas. Por ejemplo, los nombres de las ciudades deben estar escritos de la misma manera (Barcelona y Madrid o BCN y MAD). Tampoco pueden haber celdas combinadas: cada dato debe estar en una celda. 

  • Saber qué se quiere contar, pues todas las infografías pueden ser visualizaciones, pero no todas las visualizaciones son infografías.

  • Es clave saber qué se quiere contar a través de la visualización porque hay algunas que sirven para explicar un tema y otras para explorar un tema.

  • Revisar la escritura de los decimales es clave, pues en algunas herramientas los decimales se escriben con punto y en otras con comas.

  • Todas las infografías deben tener título claro y conciso.

  • Los gráficos deben tener las proporciones según lo que cuentan y representan. Si la barra representa 250.000 lectores y la siguiente la mitad, el espacio entre una y otra debe mostrar eso; no pueden estar cercanas porque visualmente darían la impresión de que la diferencia es poca.  Si se visualiza así, se incurre en una mala práctica pues hay manipulación de los datos.

Para encontrar el enfoque de datos, la maestra Morelo recomendó:

  • El eje de datos debe estar claro desde la pre-reportería. 

El equipo periodístico interesado en abordar una historia con un componente de datos debe asegurarse desde la primera etapa del proceso, es decir, desde la pre-reportería, de que el proyecto no sólo contemplará investigación en terreno sino también interpretación de grandes cantidades de datos, a través de hojas de cálculo como Excel o Google Spreadsheet. 

El eje de datos en una investigación periodística puede implicar la recolección y estructuración de la información desde cero, en caso de que ésta no esté organizada ni pública, o la consulta de bases de datos elaboradas por instituciones oficiales o privadas. 

“Lo importante es que nos preguntemos qué conjuntos de datos nos ayudarán a responder nuestra historia”, insistió Morelo.

  • Determinar el alcance de las historias.

Con el enfoque de datos, las historias pueden desbordarse y sobrepasar al equipo de investigación. Una manera de delimitar el alcance, sugirió Morelo, es planteando preguntas concretas:

1. ¿Qué período se analizará?

2. ¿A quiénes se analizará? 

3. ¿Qué contexto geográfico se analizará?

4. ¿Qué patrones o características se analizarán?

  • Sin enfoque, no hay paraíso.

Para encontrar un enfoque periodístico a partir de los datos, es clave buscar patrones, es decir, detectar cuáles son las características que se repiten. Ese proceso es más fácil si:

1. Hay un periodo de análisis específico.

2. Hay una revisión de datos, tanto estructurados (bases de datos) como no estructurados (documentos en PDF, noticias, encuestas, estudios, etc), y una consulta de fuentes oficiales y no oficiales. Estas últimas son vitales porque la búsqueda no puede limitarse solo a las voces oficiales, pues allí es poco probable que aparezca todo lo novedoso y completo que los reporteros buscan.

3. El proceso también es más fácil si los reporteros entienden todas las variables que están interpretando en una base de datos. De haber dudas, es clave la lectura de un explicativo, es decir, un documento que amplíe la información, o una reunión con una persona que conozca a fondo esos datos, ya sea porque los recolectó o los estudió.

Sobre algunas destrezas básicas para ejercer el periodismo de datos

  • “Si algo tiene el periodismo de datos es que hay que conjugar el verbo cacharrear en todos sus tiempos”.

  • “El mundo de los datos nos da mayores posibilidades para nuevos ángulos”.

  • “Un periodista que tiene datos es incluso un periodista que tiene ritmo en la narración. El ritmo solo se consigue con los datos, decía Tomás Eloy Martínez”.

  • “Antes de comenzar la minería de datos es clave saber que los datos pueden aparecer en cualquier formato. Si a primera vista no conocemos un formato, no debemos descartarlos porque luego podremos descifrarlo”.

  • “Es clave leer el apartado metodológico que tienen los datos para tener la certeza de que nos servirán para nuestra investigación”.

Sobre la construcción de alianzas y búsqueda de perfiles diversos

  • “Uno debe beber de distintos ríos para poder generar un proceso narrativo más poderoso”.

  • “Debemos juntarnos con gente que nos ayude a pensar más en grande”.

  • “El periodismo solo va a subsistir si buscamos a otros y trabajos en grupos. Mejor si me junto con otros que piensan distinto a mí”.

  • “La riqueza de un buen equipo de periodismo de datos está en la suma de las disciplinas, que al final se complementan”.

  • Si son pocos los recursos económicos que un medio de comunicación o grupo de investigación tiene, Morelo recomienda trabajar en llave con estudiantes de últimos semestres de ingenierías y diseño, y buscar ayuda en los grupos de investigación universitarios para analizar y entender grandes cantidades de datos.

Caja básica de herramientas 

Herramientas de análisis de datos

  • Excel 

Si hay un aliado para el reportero que quiera explorar datos y contar historias a partir de ellos es la hoja de cálculo. La más popular es la desarrollada por Microsoft Excel, que permite realizar cálculos, visualizaciones y tablas dinámicas tan pronto se pague por su licencia de uso. 

En un nivel más avanzado, esta herramienta permite configurar macros a partir de un lenguaje de programación llamado Visual Basic para Aplicaciones.

Al igual que Excel, esta herramienta de Google es una hoja de cálculo que permite las mismas funciones.

Es aliada del reportero, explicó el periodista José Díaz, porque:

  • Es gratuita y de fácil acceso. Solo basta con tener una cuenta en Gmail para comenzar a usarla.

  • Facilita el trabajo colaborativo porque muchas personas pueden estar conectadas al mismo tiempo.

  • Facilita copiar y exportar los datos a programas de visualización en línea.

  • Facilita compartir contenido.

Herramientas de visualización 

Esta herramienta de visualización en línea, creada por desarrolladores alemanes, es una de las más populares entre los periodistas de datos. Permite de manera fácil e intuitiva visualizar los datos en gráficos, tablas o mapas. 

El programa permite visualizar a partir de plantillas gratuitas y personalizar los gráficos bajo suscripción.

Flourish es una herramienta gratuita que permite configurar visualizaciones de datos interactivas, como líneas, barras o diagramas de dispersión. Sus plantillas se adaptan a todos los tamaños de pantalla (móviles o de escritorio) y permiten configurar los datos según la función que cumplirán (valores, categorías, imágenes o etiquetas).

Flourish permite iniciar sesión con la cuenta de Google y permite embeber los gráficos a través de código HTML.

El laboratorio Knight de la Universidad de Northwestern desarrolla prototipos, proyectos y servicios que ayudan a mejorar la narración de las historias digitales.

Esta comunidad de diseñadores, desarrolladores, estudiantes y educadores ha creado herramientas de uso gratuito como:

 1. Juxtapose, para comparar dos imágenes y a través de ellas mostrar un antes y un después. 

2. Timeline, para configurar líneas de tiempo con los hitos de los procesos o la vida y obra de una persona,.

3. StoryMap para mapear un recorrido o puntos específicos con información.

Con este directorio de visualización en línea, los reporteros tienen un valioso insumo para saber qué gráficos pueden configurar según las posibilidades de plataformas como Tableau, Datawrapper o Flourish. 

Te puede interesar: 15 recursos para sumergirse en el periodismo de investigación y de datos

Sobre el taller ‘Periodismo de datos: buscando nuevas y buenas historias’

Desde el 9 de agosto y hasta el 27 de agosto, 15 periodistas del Caribe colombiano cursaron el taller ‘Periodismo de datos: buscando nuevas y buenas historias’, bajo la conducción de la periodista y maestra de la Fundación Gabo, Ginna Morelo, y la asesoría del ingeniero y diseñador gráfico, Jorge Daniel Morelo Martínez, y del periodista de investigación y datos, José Díaz Tovar. 

El taller se realizó en alianza con Interlink Academy y con el apoyo del Ministerio Federal para la Cooperación y el Desarrollo Económico de Alemania (BMZ).

©Fundación Gabo 2021 - Todos los derechos reservados.