Tres herramientas de inteligencia artificial que están impulsando el periodismo de medios en español

Laboratorios de periodismo innovador

6 de Diciembre de 2020

Tres herramientas de inteligencia artificial que están impulsando el periodismo de medios en español

Expertos coinciden en que la inteligencia artificial ayudará a crear un periodismo aumentado en sus capacidades, por lo que cada vez son más los medios que apuestan por alguna forma de automatización en sus procesos.

La inteligencia artificial podría crear un periodismo mejorado y aumentado en sus capacidades.
César López Linares

Cuando se habla de inteligencia artificial suele pensarse en tecnologías del futuro. Sin embargo, estas herramientas ya son parte de la realidad de muchas industrias, y el periodismo es una de ellas.

Las empresas de medios de comunicación poco a poco van sumando tecnologías de inteligencia artificial a las distintas etapas del proceso periodístico, al tiempo que los expertos apuestan a que en el futuro, el periodista humano trabajará muy de cerca con máquinas y algoritmos para informar a las audiencias.

Estas herramientas son en su mayoría costosas y requieren de conocimientos que no todos los comunicadores dominan. Pero cada vez son más las iniciativas que buscan acercar a los medios a tecnologías que prometen facilitar y eficientar el trabajo de los periodistas. 

La implementación de sistemas automatizados es visto por un sector de la industria como una amenaza a los empleos de periodistas, aunque los desarrolladores de estas tecnologías y muchos editores coinciden en que estas herramientas pueden ayudar a crear un periodismo mejorado y aumentado en sus capacidades.

Aunque a un ritmo menor que en los países desarrollados, los medios de América Latina poco a poco se van sumando a apostar por alguna forma de automatización en sus procesos. A continuación, tres casos del uso de herramientas de inteligencia artificial para optimizar el trabajo de medios hispanoparlantes.

Pinpoint, la herramienta que potencializa las búsquedas

La conferencia de prensa que ofrece todas las mañanas el Presidente de México, Andrés Manuel López Obrador, desde que asumió el poder en diciembre de 2018 se ha convertido en el principal instrumento de comunicación del gobierno de ese país.

Varios medios de comunicación se han dado a la tarea de verificar la veracidad de los dichos del mandatario. El sitio especializado en fact-checking Verificado abrió una sección dedicada exclusivamente a verificar los mensajes de López Obrador en su rueda de prensa -conocida entre los periodistas como “La Mañanera”- y ha encontrado que un porcentaje significativo de estos son falsos o engañosos.

 
 
 
 

 
 
 
 
 
 
 
 
 
 
 

A post shared by Verificado (@verificado_mx)

El medio mexicano solía hacer la verificación de forma manual, pero desde julio de 2020 incorporó a su proceso de trabajo a Pinpoint, la nueva herramienta de búsqueda de datos basada en inteligencia artificial de Google que le permite a los periodistas encontrar más fácilmente información en enormes cantidades de bases de datos.

Verificado usa un método de verificación similar al de pioneros del fact-checking como Chequeado de Argentina, en el que primero revisan los discursos de los funcionarios para extraer frases verificables, que luego contrastan con documentos oficiales y con otras fuentes. Posteriormente los ponen en contexto y finalmente les otorgan una calificación, ya sea falso, verdadero o engañoso.

Si bien Pinpoint no es capaz de hacer verificaciones de hechos, sí ayuda a las redacciones a ahorrar mucho tiempo en búsquedas de criterios específicos. Los periodistas de Verificado suben a la plataforma los documentos que generan a partir de cada “Mañanera” y la herramienta les ayuda a crear un índice al que después pueden recurrir para ejecutar las verificaciones.

“Pasas de un proceso muy artesanal a uno un poco más sistemático. (Pinpoint) Nos ha ayudado con las reiteraciones, cuántas veces se mencionan ciertas cosas, ciertos nombres, ciertas personas, ciertos casos, y poder agilizar muchísimo el trabajo que realizamos”, dijo a Fundación Gabo Daniela Mendoza, directora y fundadora de Verificado. “Ya no te gastas tanto los ojos leyendo todo y encontrando similitudes. Puedes poner palabras clave y saber dónde buscar”.

Verificado fue uno de los medios seleccionados para probar Pinpoint desde su fase beta. La herramienta, que forma parte del Journalist Studio -la colección de herramientas de Google para eficientar el trabajo de los periodistas- fue creada en colaboración con redacciones de varios países, como parte del Google News Lab.

“Ha sido un trabajo de varios meses trabajando colaborativamente con gente que tiene experiencia en investigación, a quienes les pedimos mucha retroalimentación”, dijo a Fundación Gabo David Dieudonné, líder de Google News Lab en Francia, España e Italia. “Pinpoint es una herramienta muy sencilla que te permite buscar en un enorme número de documentos de cualquier tipo, incluso escritos a mano y en diferentes idiomas”.

La nueva herramienta, que fue lanzada en octubre de 2020, tiene la ventaja que es gratuita. Los medios que quieran acceder a ella tienen únicamente que solicitarla a Google News Lab y contar con una cuenta de Gmail.

“Es la cosa más sencilla del planeta, no es una herramienta que necesite capacitación de tipo específica o técnica, realmente es una aplicación super amigable”, dijo Mendoza. “Es como tener tu propio Google”. 

Las cuatro periodistas que conforman la redacción fija de Verificado tomaron en marzo la capacitación sobre Pinpoint que ofreció Google News Lab, al igual que algunos de los estudiantes voluntarios que trabajan con el medio.

Adicionalmente, Pinpoint facilitó a Verificado analizar los dichos del presidente México sobre el manejo de la crisis por coronavirus. El medio encontró que los mensajes de López Obrador sobre la situación de la pandemia en México son en gran parte falsos o engañosos.

 
 
 
 

 
 
 
 
 
 
 
 
 
 
 

A post shared by Verificado (@verificado_mx)

“Quisimos analizar el discurso del presidente con respecto al COVID-19. Pudimos más fácilmente recabar toda esa información de 10 meses, compendiar y comprobar que evidentemente había un discurso muy impreciso en algunos casos, engañoso en otros”, agregó Mendoza.

La herramienta es capaz de buscar los criterios solicitados en siete idiomas, además de que muestra los sinónimos. Incluye también la función de transcribir archivos de audio y video y guardar esa información en formato PDF, aunque esta característica aún no está disponible en español.

“El machine learning puede ayudar a incrementar la eficiencia de las redacciones”, dijo Dieudonné. “Ese es el propósito de Pinpoint: reduces el tiempo que pasas revisando cantidades enormes de documentos, por tanto el periodismo investigativo se hace más rápido y se agrega el valor que solo los periodistas pueden agregar a la búsqueda de documentos”.

La herramienta en corto

Nombre: Pinpoint

Tipo: Motor de búsqueda y reconocimiento óptico de caracteres

Costo: Gratuito para quienes se registren con Google News Lab

Principal función en periodismo: Búsqueda y organización de información

Etapa del proceso periodístico: Reportería

Valor agregado: Incluye 115 GB de almacenamiento para cada cuenta

Desventajas: Algunas funciones no están disponibles en español

Funes, el algoritmo contra la corrupción

La inteligencia artificial como herramienta para el análisis de grandes cantidades de datos ha probado tener gran potencial en las investigaciones periodísticas sobre corrupción.

El medio peruano de periodismo investigativo Ojo Público, que ha participado en importantes proyectos de periodismo de datos sobre casos de corrupción como los Panama Papers y el caso Lava Jato, se dio a la tarea de desarrollar su propia herramienta de inteligencia artificial para facilitar el análisis de datos en busca de posibles casos de corrupción.

Tras 15 meses de trabajo con un equipo multidisciplinario que incluyó a periodistas, programadores, estadísticos y científicos sociales, nació Funes, un algoritmo que utiliza indicadores de riesgo para encontrar posibles rastros de corrupción en contrataciones públicas.

Funes, bautizada en honor al protagonista del cuento “Funes, el Memorioso”, de Jorge Luis Borges, analiza millones de datos de enormes bases de datos que Ojo Público ha construido a lo largo de sus investigaciones sobre corrupción en Perú. El algoritmo identifica relaciones políticas y financieras, y partir de ello arroja un score de riesgo que indica en qué contratos hay más probabilidad de hallar corrupción. 

“Funes tiene el propósito de convertirse en una herramienta útil para el equipo periodístico de Ojo Público y otros reporteros en la medida que pueden identificar riesgos de corrupción a un contrato, a alguna entidad, a algún proceso e incluso a una empresa”, dijo Nelly Luna, editora y cofundadora del medio, a Fundación Gabo. “Bajo esos parámetros se identifican los riesgos y ayuda como insumo inicial para continuar investigando ya con métodos más tradicionales”.

En sus primeros resultados, Funes arrojó que al menos 40 por ciento de las contrataciones en Perú tenían riesgo corrupción. Eso no significa que esas contrataciones fueran corruptas, sino que el score de riesgo que les asignó el algoritmo era alto, aclaró Luna.

Ante las diversas y muy sofisticadas formas de corrupción que existen en contratos públicos, Ojo Público tuvo que “enseñar” al algoritmo a delimitar el tipo de corrupción a detectar. Funes fue programado para hallar rastros de colusión, que es cuando un funcionario público está vinculado a una empresa y usa su influencia para hacerla ganar un concurso público.

“(El financiamiento) nos permitió durante 15 meses dedicarnos al desarrollo de este algoritmo”, dijo Luna. “Más de la mitad de esos 15 meses nos tomó producir la información y los siguientes siete u ocho meses fueron básicamente para el desarrollo del algoritmo”.

Ojo Público creó un micrositio que contiene las investigaciones más relevantes derivadas de los hallazgos de su algoritmo, además de que incluye un buscador para acceder a la información relacionada con contratos públicos de decenas de empresas y entidades.

Para el equipo de Ojo Público, Funes significó la oportunidad de aprender otras técnicas de análisis de datos y de familiarizarse con herramientas de programación y de inteligencia artificial, como el lenguaje R, utilizado por el medio para el análisis de los datos y en la construcción de los indicadores de riesgo para el algoritmo. 

“Hasta antes de Funes, el equipo trabajaba con spreadsheets, con hojas de cálculo, con Excel, pero nunca habíamos trabajado con R”, explicó. “Ese conocimiento adquirido nos permite, por ejemplo, analizar permanentemente grandes volúmenes de información mientras otros medios no lo pueden hacer”.

Gracias a Funes, Ojo Público fue galardonado con el premio a la innovación en pequeñas salas de redacción en los Sigma Data Journalism Awards 2020.

En una segunda etapa de su proyecto, programada para principios de 2021, el sitio planea liberar el código de su herramienta para que otros periodistas puedan reproducirla y adaptarla en sus redacciones, con sus propios datos y estándares.

“La idea en esta segunda etapa es hacer que el score de riesgo sea de dominio público en una interfaz amigable y que permita a los ciudadanos entender dónde se encuentran esos riesgos de corrupción y en qué contratos y entidades hay que ponerle el ojo”, dijo Luna.

La herramienta en corto

Nombre: Funes

Tipo: Algoritmo

Costo: Fue desarrollado con apoyo del Fondo de Innovación de la Alianza Latinoamericana para la Tecnología Cívica (Altec)

Principal función en periodismo: Análisis de datos

Etapa del proceso periodístico: Reportería

Valor agregado: Permite corregir y ajustar criterios de acuerdo a cada caso

Desventajas: Requiere un equipo experto multidisciplinario y una fuerte inversión

Gabriele, el robot que redacta noticias en segundos

Además de analizar datos y optimizar búsquedas, una función de la inteligencia artificial que está cada vez más presente en los medios es la creación automática de contenidos.

La tecnología de generación de lenguaje natural (NLG, por sus siglas en inglés) consiste en herramientas que transforman datos estructurados en lenguaje tal y como el de los seres humanos, ya sea oral o escrito.

En los medios de comunicación, la generación de lenguaje natural se utiliza desde hace algunos años para redactar noticias, sobre todo aquellas tienen como fuente datos duros como encuentros deportivos, información meteorológica y reportes financieros.

La empresa española especializada en generación de lenguaje natural Narrativa, fundada en 2015, se ha convertido en una especie de agencia de noticias basada en inteligencia artificial. En lugar de tener reporteros que generen información, la compañía con sede en Madrid creó a Gabriele, un robot capaz de redactar en cuestión de segundos notas periodísticas que luego son distribuidas a medios de comunicación. 

Gabriele, bautizado en honor a la primera máquina de escribir eléctrica, parte de diversas fuentes de datos que la empresa adquiere según el contenido a generar. El robot procesa esos datos, elige los más relevantes y genera un texto que después adapta al estilo de los diferentes medios a los que sirve.

“Tomamos un corpus de noticias que ha generado cada medio y nuestro sistema de inteligencia artificial es capaz de imitar ese estilo de escritura”, explicó a Fundación Gabo Sofía Sánchez, vocera de Narrativa. “A través de nuestros algoritmos y del machine learning, Gabriele aprende cómo debe escribir, y puede generar textos muy parecidos a los que generan los redactores humanos”.

Esta tecnología no es nueva en el periodismo. Agencias de noticias como The Associated Press y Reuters ya generan gran parte de su contenido con herramientas automatizadas. The Washington Post cuenta con su propio robot redactor, Heliograf, mientras que Bloomberg tiene uno similar de nombre Cyborg

Por su parte, la Agencia de Prensa de Reino Unido (PA, por sus siglas en inglés) desarrolló con apoyo de Google el proyecto RADAR (Reporters And Data And Robots), que genera con inteligencia artificial miles de piezas para medios regionales.

Los medios hispanohablantes, sin embargo, no están aún muy familiarizados con esta tecnología, en parte por los grandes recursos económicos y humanos que supone. Empresas como Narrativa pueden ser una opción para pequeñas redacciones que no tienen los medios para crear sus propios algoritmos y cuyo personal no es suficiente para generar todos los contenidos.

“Entendemos que algunas empresas no son tan pujantes como los grandes medios”, dijo Sánchez. “A nivel de presupuesto, podemos adaptarnos a cualquier empresa que quiera lanzar este tipo de servicio. Queremos facilitar ante todo que el cliente pueda recibir rápidamente las narrativas y que se centre solo en su labor periodística”.

Gabriele genera contenido para al menos 20 medios de comunicación, la mayoría de ellos en España, como RTVE, 20 Minutos y El Periódico. En América Latina, solo dos medios cuentan con el servicio hasta el momento: el sitio Infobae, de Argentina, y el periódico En Cancha, de Chile.

Si bien, algunos medios publican las noticias tal cual son generadas por Gabriele u otros robots creadores de contenido, otros las usan como borradores para después enriquecerlas o transformarlas en otros productos.

“La Inteligencia Artificial es una herramienta de apoyo, no de sustitución al periodista,” dijo Sánchez. “Es para apoyar a que el periodista pueda dedicarse a tareas de un valor importante. Una inteligencia artificial no te puede hacer un análisis de la realidad, está claro”.

La herramienta en corto

Nombre de la herramienta: Gabriele

Tipo: Robot

Costo: La empresa ofrece diferentes planes, según el presupuesto de cada medio

Principal función en periodismo: Generación de contenido

Etapa del proceso periodístico: Producción

Valor agregado: Además de texto, genera gráficos y visualizaciones a partir de bases de datos

Desventajas: Es un servicio externo fuera del control de los medios

Sobre este proyecto

La Fundación Gabo en alianza con Google News Initiative buscan descubrir, analizar y presentar las más valiosas iniciativas de innovación periodística que se están produciendo en Iberoamérica.

Puedes conocer más sobre esta iniciativa y compartir tus casos de innovación a través de este formulario

La selección de casos que se publican en este espacio está a cargo de Ismael Nafría (España), director de la revista National Geographic España, y Olga Lucía Lozano (Colombia), directora de En Modo P. La coordinación del proyecto desde la Fundación Gabo está a cargo de Karen De la Hoz, directora de comunicaciones.

 

©Fundación Gabo 2019 - Todos los derechos reservados.