Relatoría del taller ‘Periodismo de datos para cubrir y contar lo local’, con Ginna Morelo
25 de Octubre de 2021

Relatoría del taller ‘Periodismo de datos para cubrir y contar lo local’, con Ginna Morelo

La periodista y editora Ginna Morelo compartió, de forma virtual con 15 periodistas de Colombia, lecciones, consejos y recursos para analizar, procesar y visualizar datos que refuercen las historias periodísticas.

La presentación de cada participante del taller sirve para dejar clara la premisa –quizás, más importante– inicial: detrás de un número hay una gran historia. Después de que cada tallerista contara, usando una cifra, un relato con información importante, esencial para cada uno, comenzó el taller ‘Periodismo de datos para cubrir y contar lo local’, dirigido a periodistas de la región central de Colombia, y que se llevó a cabo entre el 13 de septiembre y el 1 de octubre de 2021.

La maestra Ginna Morelo comenzó la primera jornada explicando por qué nunca habían sido tan necesarios los datos en este momento, “en este escenario de mentiras o de posverdades. Siempre habían existido, pero no teníamos canales amplificadores tan grandes”. 

La cantidad de información y de desinformación camina tremendamente. Solo la desinformación facturó, en 2020, US $70 millones. El índice de desinformación global dice que las marcas más poderosas del mundo se están alimentando con recursos, sin saberlo, de esa desinformación. Para combatirlo, nada mejor que el periodismo de datos, sustentado en fuentes reales y concretas.

Pero… ¿De dónde viene el periodismo de datos? Philip Meyer insistía en que surge de la discusión sobre el método de la actividad periodística y la necesaria pero incipiente apropiación de los métodos de la investigación social. Los medios están llamados a crear nuevas áreas en las que los científicos sociales y los periodistas de investigación compartan formas de trabajar.

Un claro ejemplo de esto es Wikileaks, con grandes cantidades de información que logran acopiar Julian Assange y sus socios, y luego las muestran a los medios de comunicación. Ese es un buen comienzo para empezar a hablar de dónde viene este asunto.

“Cuando la información era escasa, la mayor parte de nuestros esfuerzos estaban dedicados a buscarla y recogerla. Ahora que hay información abundante, el procesamiento es más importante”: Philip Meyer. 

¿Qué es el periodismo de datos? Es, entonces, investigación en profundidad. Y esto conlleva cambios en la reportería. El reporteo al que hemos estado acostumbrados los periodistas empieza a cambiar desde el momento en que:

  • Deciden comenzar a procesar grandes cantidades de datos

  • Consideran los datos una fuente potencialmente poderosa

  • Analizan grandes cantidades de datos. Por lo que llegan a hallazgos sorprendentes.

Entonces la historia no es lo que diga el funcionario, sino lo que diga la base de datos: ‘entrevistar a los datos’, he ahí la cuestión.

¿Qué hace al periodismo de datos diferente?

  • Que combina el tradicional ‘olfato para las noticias’ y la capacidad de narrar una historia convincente, con la escala y alcance de la información digital disponible.

  • Acerca la información incomprensible que producen los gobiernos y las empresas que manejan nuestros intereses y recursos a los ciudadanos.

  • Plantea una nueva forma de narrar las historias a partir del periodismo para explicar.

Esta nueva narración, por ejemplo, se aplica a las hectáreas de cultivos ilícitos sembradas en determinado territorio. Un relato en el que prevalezca el periodismo de datos se preguntará qué significa ese número de hectáreas sembradas: ¿Equivalen al tamaño de Bogotá? ¿De Disneyworld?

¿Con qué fin se hace?

  • Ayuda al periodista a contar una historia convincente con una carga de datos alta. 

  • Ayuda al periodista a explicar cómo se relaciona una historia con un individuo, esto es con el ciudadano. Y quizá este aspecto es el más importante.


Ejemplo: 

Voces Vivas: la voz de 54 líderes sociales amenazados en Colombia 

Este trabajo buscó armar una base de datos de voces vivas para destacar y contar lo que hacen los líderes sociales, y no esperar a que los asesinaran para decir lo que hacían.


3 aspectos a tener en cuenta:

  1. Si en el periodismo de investigación somos curiosos, en el de datos auscultamos mucho más.

  2. En el periodismo de investigación consumimos enormes cantidades de documentos; en el de datos, todo lo que vamos revisando lo vamos procesando, administrándole una categoría de búsqueda que permita hacer usable y comprensible ese contenido.

  3. El periodismo de datos es el de la precisión, y cualquier error no solo tumba la historia, también su reputación.

Una cuestión de equipo…

  • Periodistas 

  • Ingenieros de sistemas

  • Diseñadores

  • Analistas de datos

La riqueza del periodismo de datos es la suma de disciplinas.


Ejemplo: 

Transnacionales de la fe 

Este proyecto, tanto cuantitativo como cualitativo, demostró cómo los grupos conservadores inciden grandemente en las políticas públicas nacionales y regionales en América Latina. Publicaciones de esta envergadura solo es posible si se combinan habilidades y disciplinas.


El proceso para hacer periodismo de datos

  1. Planeación de la matriz (DataRakers)

  2. Minería de datos (reportería o búsqueda de la información): De todo lo que hay ahí –en las bases de datos–, hallar qué es lo que brilla

  3. Refinación de datos (limpieza de datos con herramientas)

  4. Análisis de los datos (pensamiento crítico)

  5. Reportería de historias (trabajo de campo)

  6. Diseño, visualización y experiencia de usuario (diseño y desarrollo)

Hay que crear una rutina de búsqueda. Mirar la coyuntura para darle la vuelta a la pregunta, porque hay que interrogar a los datos.

Referentes del periodismo de datos en Hispanoamérica

Para entender algo, nada mejor que el ejemplo. Para inspirarse, lo mismo. Así que para hacerse una idea de lo mejor de algo y hallar casos que nos motiven a seguir esos pasos, nada como conocer los referentes en ese campo. En el caso del periodismo de datos e investigación en Hispanoamérica, hay nombres ineludibles para continuar este camino, paradas obligatorias que dan pistas sobre cómo seguir, además de darle aliento al viajero que se decide por este andar largo, pero fructífero.

La maestra Ginna Morelo mencionó estos 5 nombres que encontrarás a continuación, “personas que nos han abierto camino” en el arte de contar historias aplicando las técnicas de manejo y visualización de datos, utilizando todo su potencial y con resultados impactantes para todos los territorios de habla hispana, e incluso a nivel global:

La matriz de planeación, un paso ineludible

Intersección de datos: Tomar dos conjuntos y juntarlos, y la intersección marca una suerte de patrón. Hay que encontrar cruces e intersecciones que se convierten en patrones. 

Pregúntate por las fuentes: En los trabajos de datos, el número de fuentes es mayor, y estas son especializadas y diversas. Una buena idea de las fuentes que se necesitarán son:

  • Experto: Lo ha estudiado, tiene amplio conocimiento del tema

  • Sabio: No tiene conocimiento académico sino empírico

  • Señor de los documentos: Base de datos o persona que maneja la estadística

  • Antagonista y protagonista: Los vehículos con los que vamos a contar la historia

Para poder revisar las fuentes y sus posibles interrogantes, así como a los datos mismos, cada participante leyó su tema y su pregunta inicial, para escuchar los consejos de la maestra:

Se leyeron los temas propuestos por los alumnos, como el abstencionismo en la última elección de alcaldía de Duitama (Boyacá), que la maestra sugirió convertir en la tendencia del abstencionismo en las últimas elecciones, haciendo un análisis de datos no solo en la elección del alcalde, sino de los ediles, Juntas Administrativas Locales y otros escaños. 

Así, otras propuestas como la reconstrucción de las casas en San Andrés y Providencia luego del paso del huracán Iota, o los pacientes con el denominado 'COVID largo' que no cuentan con acceso a salud de primer nivel, o el trabajo que han desarrollado las entidades para la prevención del consumo de sustancias psicoactivas en estudiantes universitarios de Girardot (Cundinamarca), acabaron dando un giro de 180 grados desde su planteamiento inicial hasta la primera asesoría dada por la maestra Morelo.

Uno de los temas propuestos y que más llamó la atención de la mentora fue el “aumento del consumo de ciertos alimentos debido a la migración venezolana en Colombia”, propuesto por una participante basada en el aumento de publicidad de determinados productos. La maestra Morelo se detuvo en este tema particularmente para dejar claro que “no podemos saber o presumir cosas como el consumo de alimentos de cierta población a raíz de una publicidad”. El abordaje del mismo debe trazar una ruta que permita estudiar datos concretos sobre una tendencia real de consumo y no basado en una invitación a consumir/adquirir algo. 

Otras de las lecciones que dejó esta jornada del taller es que, como dijo la maestra: “Si yo quiero trabajar con datos, tengo que crear los mecanismos para obtenerlos, y estamos en Colombia, donde es más lo que se oculta que lo que se publica. Ustedes están detrás de datos públicos que van a buscar ser alterados”.

Refinar los datos, el siguiente paso

En toda base de datos puede haber errores. De hecho, suele haberlos: registros duplicados, casillas incompletas, palabras mal escritas. Hay que buscar herramientas para identificar estos problemas y erradicarlos.

Para lograrlo, hazte estas preguntas:

  • ¿Uso Excel?
  • ¿Uso OpenRefine?
  • ¿En qué caso usar gestores de más capacidad como MongoDB?

Si hemos usado bases de datos propias, que hemos construido, entonces es momento de hacernos otros interrogantes:

  • ¿Hay bases de datos sobre el tema?

  • ¿Cómo y para qué fueron hechas?

  • ¿Están en una web oficial o debo hacer un pedido de acceso e información?

  • ¿Si la base está en una web es descargable, cómo la puedo bajar?

Y entonces es hora del análisis de datos:

  • ¿Conozco todos los términos y variables que hay en las bases de datos?

  • ¿Son los mismos usados en las bases de datos similares?

  • Debo volver a las preguntas (matriz) que quiero resolver y establecer categorías. Esto, para comparar y comprobar cuáles son las categorías que le serán más útiles a mi base de datos, aquellas de las que creo que puedo obtener los mejores resultados.

Palabras claves en el análisis de datos, o verbos para no olvidar:

  • Relacionar

  • Comparar 

  • Cruzar

  • Comprobar

  • Descartar

  • Interpretar

  • Verificar 

Después de analizar, es momento de interpretar 

  • ¿Responden los datos a tu pregunta original?

  • ¿Los datos te ayudan a defender o contradecir algo ya estipulado?

  • ¿Hay alguna limitación, algún ángulo que no hayas considerado?

El cruce de datos permite establecer:

  • Tendencias

  • Patrones

  • Procesos evolutivos en un período determinado

Es este el resultado de una buena interpretación. 

El periodista de investigación, en su proceso de verificación, debe aplicar la metodología tradicional: ir a los lugares necesarios, entrevistar a las personas involucradas, revisar nuevos documentos para detectar debilidades y fortalezas de la base de datos.

Y debe hacerse nuevas preguntas una vez hecho lo anterior:

  • ¿Reflejan los datos la condición real de las personas?

  • ¿Con qué experto puedo validar la metodología del cruce?

  • ¿Es posible que el hallazgo sea correcto, pero admita más de una interpretación?

La gran enseñanza de esta jornada es: Los datos me muestran una realidad y yo no necesito forzar nada. 


Ejemplo: 

Tierra de Resistentes

 Este proyecto único, colaborativo y transnacional en América Latina, integra a 10 países, 21 medios de comunicación, 31 periodistas y un equipo de 45 personas entre editores, fotógrafos, productores, diseñadores y desarrolladores digitales en la investigación de las causas y consecuencias de la persecución a líderes ambientales. 


Visualización de la información: la experiencia de los usuarios

El proceso de preparación de datos incluye:

  • Recolección

  • Estructuración

  • Limpieza

  • Transformación

  • Visualización

Los datos son como el petróleo: si no se les hace una minería, no van a servir para nada. Es la limpieza, el refinamiento, lo que nos asegurará de que quede justo lo que necesitamos para nuestra investigación.

Para asegurarnos de que todo funcione, se requiere, por ejemplo, escribir siempre los datos de la misma forma, algo que será muy útil para la graficación, para que la herramienta que utilicemos tome los datos como un conjunto, como un todo.

Datawrapper y Flourish son herramientas de visualización que transforman datos numéricos de archivos PDF, CSV y fuentes web en cuadros y gráficos. Son las sugeridas por los maestros Jorge Daniel y Ginna Morelo. 

Antes de empezar a explorarlas, es importante tener algunos puntos en cuenta:

  • Los datos sin el diseño no serían nada. Entre más claros los gráficos, mejor. 

  • Aunque en algunos casos la línea divisoria es bastante difusa, la infografía nos ofrece un mayor componente de ilustración o fotografía, mientras que la visualización de datos se centra mucho más en estos, a partir de comparaciones. Eso sí: ambas sirven para representar datos.

  • Entre más comparaciones pueda haber, más utilidad le doy a la visualización

  • Ornamentación vs simplicidad: esta es una de las discusiones que más suelen darse en la decisión de la forma de visualizar los datos. Lo mejor siempre será lo que sea más claro para el lector.

5 claves para la visualización de datos

  1. Investigación

  2. Selección de datos

  3. Creación de un boceto

  4. Elaboración

  5. Percepción y conocimiento

Para tener en cuenta:

  • Se debería estar en capacidad de hacer un boceto de cómo imaginamos el/los gráficos antes del resultado final. El boceto es un esquema previo a la elaboración.

  • En la elaboración se debe seleccionar la herramienta más adecuada para la visualización. Es importante tener claro que no todos los modelos sirven siempre. 

Aquí se entrelaza otro punto, tal vez el más importante de esta etapa: ¿Cómo hacer para que el diseño de la visualización dé respuesta a la pregunta que el periodista tiene?

Desde que el periodista tiene esa idea en su cabeza, debe contarle al diseñador para que también se lo imagine. El cómo lo hará el diseñador. Cuando llegue el periodista con los datos, el diseñador debe tener ya esa respuesta. Entre otras cosas, el texto no debería superar el espacio que ocupan las imágenes y viceversa. Algo que necesite muchas instrucciones que no sirve, porque nadie lee las instrucciones. Entre más claro, mejor.

Después de que cada participante creó su cuenta e inició sesión en DataWrapper –la primera de las herramientas utilizadas–, la navegó y la exploró, el maestro Morelo llegó a estas conclusiones:

  • No es recomendable traducir la página porque los botones y comandos pierden las propiedades

  • Nunca dejar celdas vacías

  • Siempre, en la primera fila de un Excel, debe estar el título de las columnas. ¡Siempre! Este es el formato ideal 

  • Utilicemos el color con un propósito. No es porque me gusta, no es porque se ve bonito. Es que nos ayude a contar algo, tanto como los mismos datos.

  • El ojo detecta la continuidad, los cambios de color, de forma, de serie. Cualquier cambio abrupto, cualquier cosa que no esté puesta en su sitio, será percibida. 

  • Nunca olvidar la importancia de la memoria sensorial, la capacidad del cerebro de captar la información mejor organizada y distribuida

  • Haz ejercicios para diagnosticar qué gráficos son más fáciles de entender y establecer su nivel de complejidad, de acuerdo a lo requerido. En algunos casos requerirás visualizaciones sencillas; otras necesitarán algo más avanzado.

El Conde Contar: las hojas de cálculo

¿Qué es una hoja de cálculo? Una herramienta que permite recopilar, organizar, contar, analizar y administrar datos de varias formas.

Seguramente todos hemos visto una, pero difícilmente se haya interactuado con la infinidad de posibilidades que ofrecen gracias a sus funciones y fórmulas integradas, opciones de formato y edición. Todas, además, tienen la capacidad de generar gráficos y diagramas basados en los datos que poseen.

Usan varios tipos de datos:

  • Numérico: 481838383

  • Alfabético: Periquito Fruna

  • Alfanumérico: Calle 36A 78-90

  • Lógico: VERDADERO, FALSO; 1,0;

  • Tipo de fecha: 31/12/2021

  • Hora: 01:00 AM

  • Ubicación: 7.629050

¿Con cuál se recomienda trabajar? Con Google Spreadsheets, por varias razones

  1. Es gratuita y de fácil acceso

  2. Tiene funciones análogas a otros softwares

  3. Puede realizarse trabajo colaborativo, es decir, varias personas pueden estar trabajando sobre la misma base de datos simultáneamente

  4. Muchos de los servicios de visualización de datos en línea permiten enlazar las tablas de las hojas de cálculo directamente con sus sistemas

Y Excel, porque es el más utilizado

Las sesiones de este módulo, dictadas por José Díaz, se dedicaron a explorar y cacharrear las hojas de cálculo, los campos, las tablas dinámicas y el modo de hacer conversar, dialogar, contrastar y complementarse. A través de ejercicios propuestos, cada participante propuso categorías y las cruzó, para obtener un primer diálogo entre ellas, y resultados que ofrecieran tendencias. 

Después de esta exploración, basada en el listado de funciones de Excel, sin las cuales sería imposible sacarle el mayor provecho, el maestro resaltó dos recomendaciones:

  • Esta biblioteca es casi una Biblia. Busca en esta la sintaxis de la función, y luego copiar y pegar en la tabla. Así comenzarás a familiarizarte con Excel sin necesidad de saber de memoria las funciones, y te permitirá elegir la más adecuada según sea el caso.

  • Copia las funciones que vas utilizando en Word y ponle tu propia descripción. Esto te permitirá, a medida que vas trabajando, desarrollar tu propia biblioteca de funciones, lo cual servirá posteriormente, en cualquier momento.

Conclusiones generales 

Antes de finalizar el taller, la maestra Ginna Morelo compartió, a modo de conclusiones, estas 5 enseñanzas, claves para potenciar el uso del periodismo de datos y aplicarlo en el ejercicio diario:

1. Las matemáticas son necesarias. Morelo recomendó el curso de Sandra Crucianelli en el Knight Center: ‘Matemáticas para periodistas’. “No es para que se abrumen, pero esto es periodismo de precisión”.

2. Es importante aprender a maniobrar una inicial caja de herramientas para la visualización de los datos. No tienen que ser un montón de herramientas, pero sí deben ser unas básicas. También hay que tener en cuenta que no todas las visualizaciones tienen que ser mapas. Las líneas de tiempo, de otro lado, son una gran alternativa: “Si hay algo que un lector aplaude es el paso a paso de un proceso”. 

3. Cultivar amistades en el mundo de la economía hará que, más adelante, estas se conviertan en las personas que puedan dar la mano en los datos y puedan llevarte del escenario pequeño al escenario grande. También con ingenieros, para la programación. “Aprender a entrevistar la data es una cosa fascinante. Tener el conjunto de datos y tener la respuesta ahí, eso es increíble”.

4. Que la palabra ‘colaboración’ sea su bandera. “Es cierto esto de que nunca antes había sido tan chévere hacer periodismo por la cantidad de herramientas, pero nunca había sido tan doloroso por la crisis que están atravesando los medios”. Ante la escasez de recursos, la colaboración es la vía. Esto, enmarcado en el periodismo de datos. “No tienes que saberlo todo, pero sí quien lo sabe, como decía Germán Castro Caycedo”. Estas alianzas te darán la posibilidad de generar piezas más robustas, contundentes, con análisis precisos, con análisis incontrovertibles y que no tiene nadie más, lo que es muy valioso.

5. El periodismo de datos es un ejercicio que coadyuva a generar espacios de credibilidad cuando los castillos de naipes de los medios se empiezan a derrumbar. La investigación periodística soportada en el ejercicio de los datos es una manera de capturar audiencias y permitirnos recuperar esa credibilidad que hemos ido perdiendo. 

Sobre Ginna Morelo

Reportera y editora. Fundó la Unidad de Datos del diario El Tiempo (Colombia) y cofundó el Consejo de Redacción, la organización que promueve el periodismo de investigación en Colombia. Dirigió La Liga Contra el Silencio y ahora está a cargo de la Maestría de Periodismo Científico de la Pontificia Universidad Javeriana.

Su pasión por el oficio y lo acucioso de su trabajo periodístico la ha hecho merecedora de múltiples reconocimientos. En 2018, recibió el premio Gabo por su trabajo “Venezuela a la Fuga” y fue reconocida como la periodista del año por el Premio Nacional de Periodismo Simón Bolívar. Ganó el Ortega y Gasset en dos oportunidades (2016 y 2020). Recientemente obtuvo el Premio a la Excelencia Periodística de la Sociedad Interamericana de Prensa (SIP).

Es autora y coautora de seis libros sobre conflicto, memoria, narrativas de paz y medio ambiente. Ha impartido múltiples talleres nacionales e internacionales.

Sobre el taller ‘Periodismo de datos para cubrir y contar lo local’

Este taller, conducido por la periodista y maestra de la Fundación Gabo, Ginna Morelo (Colombia), reúne del del 13 de septiembre al 1 de octubre de 2021, de forma virtual, a 15 periodistas de la Región Andina de Colombia interesados en analizar, procesar y visualizar datos que refuercen sus historias periodísticas. La actividad es convocada por la Fundación Gabo en alianza con Interlink Academy y con el apoyo del Ministerio Federal para la Cooperación y el Desarrollo Económico de Alemania (BMZ). 

©Fundación Gabo 2021 - Todos los derechos reservados.