Barranquilla, 5 y 6 de julio de 2014
Convocan: FNPI y PROMIGAS
Relator: Alfredo Baldovino Barrios
Introducción
Fue Marshal MacLuhan quien dijo que el nacimiento de la informática, no solamente representaría la evolución de los medios de comunicación y el florecimiento de la aldea global, sino también una transformación en la manera de sentir y entender el mundo. El periodismo no podía mantenerse ajeno a esos cambios. El paso de la información de formatos escritos, que limitaban la difusión de la misma, a formatos digitales, abrió la posibilidad de que esos datos pudieran ser almacenados en grandes plataformas y vistos de manera simultánea por un número indeterminado de lectores. Los recursos digitales, habilitados para aprender a desenvolverse en el nuevo campo de trabajo, permitieron simplificar procesos de análisis que en el pasado eran engorrosos y replantearon la manera de llevar a cabo una investigación periodística.
Y si bien es cierto que el periodismo de fuentes orales sigue teniendo vigencia, no es un secreto para nadieque hay una inmensa cantidad de información a la que solo puede accederse con el uso de fuentes digitales. La ecuación es sencilla: o el periodista asume el reto impuesto por internet, adquiriendo los conocimientos necesarios para obtener información, procesarla y convertirla en un producto con interés para los lectores, o, sencillamente, termina cambiando de empleo con el paso del tiempo.
Durante los días 5 y 6 de julio de 2014, 31 periodistas de distintos lugares del Caribe colombiano, asistieron alTaller sobre herramientas digitales para fuentes locales, conducido por Sandra Crucianelli, y organizado por la FNPI, con el patrocinio de Promigas, cuyo propósito fue impartir las pautas básicas para incursionar en el periodismo digital y alcanzar visibilidad en el medio local, mediante el hallazgo de primicias rastreadas de manera sistemática en los niveles profundos de la web.
Herramientas básicas para el periodismo digital
“En la carrera en que andan los periodistas debe haber un minuto de silencio para reflexionar sobre la enorme responsabilidad que tienen”. Con esta cita de Gabriel García Márquez comienza el taller de la maestra Sandra Crucianelli. Porque ningún periodista, añade, puede evadir ese compromiso. En el caso de los asistentes, ese minuto será un poco largo: durará día y medio y servirá para que cada quién se pregunte dónde está parado con relación a los cambios que se están produciendo actualmente en el medio.
El nuevo modelo de investigación que genera la informática, afirma la maestra, deviene en el nacimiento de un tipo de periodismo que puede desarrollarse de manera independiente al de las fuentes orales. Se trata del periodismo de base de datos, o periodismo de datos. No es que el primero rivalice con el segundo en un desesperado intento por sacarlo del camino e imponer una nueva y única manera de hacer periodismo, sino que ambos coexisten pacíficamente, con objetos propios de análisis, en un proceso de retroalimentación mutua.
Precisión, profundidad, lícito acceso a documentos públicos que, por una razón u otra, se le vedan al investigador, práctica conversión de números en primicias de alto impacto social, son algunas de las bondades que brinda el periodismo de datos. De allí la importancia de manejar un kit básico de herramientas, que no solamente nos permitan conseguir información en la web, sino también extraer datos de formatos cerrados, convertirlos en textos inteligibles y significativos a los intereses de la opinión pública, y, en suma, crear una red de colaboración recíproca mediante la cual unos periodistas puedan utilizar las fuentes de sus colegas para darle mayor consistencia a sus investigaciones.
La Alianza para el Gobierno Abierto: El que nada debe, nada teme
A diferencia del pasado, en el que las naciones ocultaban celosamente la información administrativa de las miradas de sus pobladores, hoy día se ha creado la Alianza para el Gobierno Abierto u Open Goverment, revela la maestra Crucianelli. La plataforma se estrenó en 2011 con 8 países, pero en la actualidad cuenta con 63.
“Esta tendencia de Gobierno Abierto —afirma— se sustenta en la convicción de que un país que muestra sus datos al mundo, apuesta por la transparencia y honestidad con sus habitantes”.
Países como Estados Unidos, México y Brasil, que obtuvieron su membresía en 2009, ya van por el segundo ciclo del proceso. Colombia y Perú, suscritos en 2012, por el primero. Lo más interesante del caso, enfatiza la maestra, es que todos esos datos se pueden descargar. Aunque inmediatamente surge una pregunta: qué hacer con ese volumen de información (tablas y tablas de estadísticas), de qué instrumentos debemos valernos para encontrar las variables y transformar esa montaña de números en información de interés.
“A partir de los portales de Gobiernos Abiertos —prosigue Crucianelli—, los periodistas deben aprender a trabajar con las hojas de cálculo, ya sea Excel o una hoja de cálculo de un sowtfare libre como el Open Office. Aquí se va a trazar una línea muy grande entre los periodistas que saben cómo descargar esos datos, cómo procesarlos y encontrar noticias a partir esos datos, y aquellos que no”.
He allí la razón de por qué es cada vez mayor el número de periodistas interesados en la Alianza para el Gobierno Abierto. La maestra está convencida de que en dos o tres años los periodistas colombianos hallarán en el portal una cantidad invaluable de datos para sus pesquisas. Por otro lado, existen también en la web bases de datos abiertos. Si uno necesita datos del Banco Mundial, ejemplifica, puede utilizar un catálogo de datos que se llama Finance:
“Si ustedes quieren saber cómo evolucionó el pago de la deuda pública a los organismos internacionales, entran a la página del banco, delimitan el país, filtran la columna y listo”.
Otras veces, prosigue, uno se queja de que no hay información en línea. Y puede que sea cierto. O puede que esa información no esté todavía procesada o que esté esperando por nosotros en otro lugar. Hay que ser persistentes en ese tipo de circunstancias. Ingeniosos, recursivos. Entender que aquella información que no se puede hallar en bases de datos locales, se puede localizar en otras de carácter internacional:
“Pongamos un caso. Ustedes quieren averiguar cómo estuvo el nivel de exportaciones entre Estados Unidos y Colombia, y no encuentran nada en la base de datos de su país ¿Qué sería lo más recomendable entonces?: mirar en la base de datos de los Estados Unidos cuál fue el nivel de importaciones que sostuvo con Colombia y descargar las tablas a su computador”.
Caza de herrero, cuchillo de palo: de cómo el periodismo de datos puso al descubierto las irregularidades de la oficina de tránsito en Bahía Blanca
Una de las características del periodismo de datos, sostiene Crucianelli, es que está regido por el principio de la incertidumbre: te sientas ante la pantalla del computador, pero no sabes con qué vas a encontrarte al final del camino. Sencillamente, se puede empezar con una sospecha, se descargan tablas con datos de una página y se formula una hipótesis, pero puede ocurrir que, en algún momento, el asunto dé un giro inesperado y termines encontrándote con una noticia de gran impacto entre los lectores. O puede que ocurra lo contrario: que inviertas un número determinado de horas siguiéndole el rastro a una noticia y resulte que al final no había nada. Para ilustrar lo que está diciendo sobre el principio de incertidumbre, Crucianelli menciona su propia experiencia en el portal de noticias con bases de datos, Sololocal.info.
Ella y su esposo se dieron a la tarea de descargar información de la oficina del tránsito de su ciudad, previendo que algunos funcionarios podían ser deudores del sistema. Cruzaron dos bases de datos: la de la declaración patrimonial donde estaba el número del documento nacional de identidad de los funcionarios con la base de datos del tribunal de faltas. ¿Quién podía ser el infractor? ¿El secretario privado del intendente? ¿El director de parques? Los datos los fueron llevando en una dirección y luego en otra, descartando, de paso, a los principales sospechosos que tenían en la lista hasta que, finalmente, los números les mostraron lo impensable: ¡el mayor infractor era el mismo director del tránsito! Tenía 48 multas desde 2006 y todas sin pagar.
Alguien levantó la mano en el fondo del salón. Era un tallerista que quería saber si la noticia fue difundida en el portal de noticias sin que se hubiera efectuado de manera correlativa el trabajo con las fuentes orales. Esta pregunta da lugar a una respuesta que respalda la idea de solidaridad entre el periodismo de datos y el de fuentes orales: Sololocal.info se limitó a publicar lo que revelaban las tablas de datos. Otros medios de Bahía Blanca, teniendo como referencia los documentos de Sololocal.info, hicieron el resto: contactar al funcionario y preguntarle qué tenía que decir frente a lo que aparecía en los registros.
“Es algo que también se le debe al periodismo de datos: el nacimiento de un nuevo tipo de periodismo, mucho más colaborativo, en el que todos trabajan para todos”.
Rastreo sistemático de información: Cómo atrapar el pez gordo de la primicia con la búsqueda avanzada de Google
En internet existen niveles superficiales y profundos de información, explica Crucianelli. También están la Internet oscura, esa zona impenetrable a la que no se puede acceder sin hacerse acreedor a algún tipo de penalización. En el nivel más somero está toda la información comercial y de alto tráfico. Todo aquello que aparece en la pantalla, sin ofrecer la más mínima resistencia, cuando se escribe una palabra o frase en el buscador de Google.
Franquear el umbral de la “web profunda” ya es otra cosa. Pero es posible gracias al rastreo sistemático de información que el periodista puede llevar a cabo con la búsqueda avanzada de Google. Este tipo de búsqueda es geolocalizada: se realiza en un perímetro determinado, como el de una ciudad o población cualquiera. El primer paso, orienta la maestra, es escribir el nombre del pueblo o ciudad entre comillas en el buscador para que no se confunda con un producto comercial o algo por el estilo. Para el caso que compete a los asistentes, se utilizará el nombre de “Ciudad de Barranquilla”.
Cuando aparezca la lista de resultados, deberá buscarse un ícono en forma de rueda dentada en la parte superior derecha de la pantalla o, en su defecto, escribir directamente en el buscador: búsqueda avanzada de Google. En la casilla correspondiente a todas estas palabras se redactará nuevamente el lugar entre comillas, y luego, en sitio o dominio, la dirección gubernamental que nos interesa. La sugerida por un tallerista será .gov.co. Después de cliquear Búsqueda avanzada se regresa a la página inicial de búsqueda de Google. Se cliquea enHerramientas y, seguidamente, se especifica la fecha. Esto debe hacerse cada 24 horas, por 10 o 15 minutos. Google va arrojando primero la información de la superficie, y luego la que se oculta en los niveles más recónditos.
“Hagamos de cuenta de que internet es un mar y que cada dato es un pez. Lo que hacemos con el rastreo sistemático de información es tender una red que revisamos diariamente para ver cuántos peces han mordido el señuelo. Al cabo de 10, 15 días, o un poco más, empiezan a aparecer las primicias. Otras se encuentran en formatos cerrados, como el de las ostras. Entonces toca bucear hasta el fondo y aprender a extraer la perla para llevarla hasta la superficie”.
La práctica hace al maestro
Para cerciorarse de que ningún periodista se quede sin entender los tejemanejes de la herramienta, la maestra propone un ejercicio: buscar información potencial para una primicia en los lugares de procedencia de cada uno de los asistentes. Los de Barranquilla en “ciudad de Barranquilla”, los de Cartagena en “ciudad de Cartagena” y así. Por la novedad del procedimiento, y acaso también por la misma superficialidad del nivel en que se encontraba la información, de acuerdo a lo indicado por Crucianelli, no hubo grandes sorpresas al respecto. Pero cuando ya se daba por descontado el hecho de que el ejercicio no surtiría un efecto más provechoso del que ya había logrado hasta ese momento, la maestra exploró ante todo el auditorio el sitio gubernamental de la ciudad de Santa Marta. Abrió un pdf cliqueando en caché y cuando se disponía a salir de la página alguien llamó la atención del auditorio sobre una parte del texto: era un informe de la contraloría sobre la contaminación de las playas de la bahía, que había sido borrado y recuperado a tiempo para ser leído por todos.
Una voz de mujer elevándose entre las otras voces que rumoreaban en la sala, en búsqueda de una respuesta. Quería saber cómo utilizar la búsqueda avanzada de Google en el caso de que se tratara de la búsqueda de información no gubernamental. Un ejemplo: la tasa de mujeres afectadas por cáncer de mama en determinada ciudad o departamento. Crucianelli sugirió la utilización del Google académico. En el Google académico pueden encontrarse los estudios hechos por universitarios y académicos que no figuran en otras bases de datos. Dos consejos adicionales: tener siempre a la mano una lista con los sitios gubernamentales más importantes, y mirar tutoriales por Youtube sobre el uso de esta herramienta, para despejar cualquier duda que pudiera tenerse sobre el tema.
Afinar el instrumento…
Hay detalles que, por elementales, no dejan de ser necesarios subrayar, dice Crucianelli. Si la computadora es el instrumento de trabajo del periodista digital, como el piano para el concertista, es apenas comprensible que deba tenerla al día con todas las actualizaciones del caso, y que cuente con los programas adecuados para emprender la caza de la primicia. Debe navegar en Google Chrome, que es compatible con todos los productos de Google, y tener instalado el Java. Debe tener una cuenta en Google Drive a través de Gmail, pues aparte de ser gratis, le brinda una cantidad de espacio inmejorable para almacenar todo tipo de documentos, desde hojas de cálculo en Excel hasta tablas de datos con Google Tablas dinámicas. Mantener la documentacion al resguardo de los demás o, por el contrario, visualizarla de manera interactiva. Todo eso lo permite Google Drive.
Las maravillas de DocumentCloud
La maestra Crucianelli no oculta en ningún momento su maravillado entusiasmo, su sincera admiración y gratitud, por las utilidades de DocumentCloud. La herramienta surge una y otra vez en sus explicaciones, a lo largo del taller, en distintos contextos, pero siempre dando una nueva luz sobre sus múltiples aplicaciones.DocumentCloud es un catálogo de fuentes primarias que “permite anotar, organizar y publicar documentos en la web (…) Siempre y cuando la información no provenga de una imagen y el contenido de esa imagen no sea una tabla. En ese caso recupera el texto pero no ordena la tabla”. El único inconveniente es que DocumentCloud no acepta cuentas de personas que no estén ejerciendo el periodismo. Y que entre los periodistas que piden la membresía no aceptan a cualquiera. Se toma como requisito aportar las fuentes primarias de sus crónicas.
Free OCR, Zamzar.com y Tabula
Ese es el kit básico del periodista digital: saber buscar datos, saber extraerlos de formatos cerrados, y saber ponerlos en un contexto para darles un significado. Cuando lo que se quiere es hacer accesible la información de las imágenes escaneadas de un pdf se puede recurrir a Free OCR (OCR, por sus siglas en inglés: Reconocimiento Óptico de Caracteres), una herramienta sumamente sencilla de manejar. Zamzar.com, por su parte, funciona como conversor. No es necesario loguearse. Basta entrar a la página principal, subir el documento que se quiere convertir, especificar el formato y escribir una dirección de correo electrónico en el que, en cuestión de segundos, llegará un link donde podrá descargarse el documento convertido. Y si lo que se busca es liberar una tabla de un pdf, la mejor solución es Tabula. Para trabajar con Tabula se deben seguir las siguientes indicaciones:
Descargar Tabula e instalarlo en el computador
Subir el pdf sobre el cual se quiere trabajar
Cliquear Autodetectar tablas
Seleccionar el archivo
Oprimir Submit
Enviar al sistema y esperar a que cargue.
Cómo visualizar datos con Datawrapper y Many Eyes
“Sin una adecuada visualización que acompañe el análisis de los datos, sería imposible visualizar de manera sencilla las variables que se ponen en estudio” dice Crucianelli. Si el periodista quiere hacer un gráfico con unas estadísticas y no sabe cómo, Datawrapper le ofrece una solución sencilla: solamente hay que entrar a la página de la herramienta y loguearse. Luego se copia el documento y se pega. Nada más. Es probable que los primeros gráficos resulten ser un fiasco, pero la clave está en insistir. Otra herramienta efectiva de visualización de datos es Many Eyes. Con ella se pueden hacer gráficos de tortas o de barras, o elaborar nubes de palabras con un texto que se ha copiado con anticipación de un archivo. Ambas herramientas, una vez realizado el gráfico, generan un código de inserción que luego puede pegarse en cualquier plantilla HTML para su correcta visualización en Blogs o páginas Web.
Un ejemplo habla más que mil palabras
Una periodista del grupo comparte su experiencia con los demás, por petición de la maestra Crucianelli.
“El principal desafío que tiene uno como periodista digital en una sala de redacción —comienza— es aprender a entenderse con los diseñadores e ingenieros”.
Es frecuente que en la sala de redacción de un periódico el periodista tenga una idea de lo que quiere hacer con unos documentos, y los programadores y diseñadores otra. O peor aún: que estos últimos se empecinen en demostrar la imposibilidad de un proyecto que el periodista sabe absolutamente hacedero. Para eso también hay que estar preparado. Ella trae su propio ejemplo. En las semanas previas a la elección de congresistas, representantes a la Cámara y Senado, empezó a trabajar con la hipótesis de que algunos candidatos podían descollar por su ausentismo a las reuniones. Fue a las dependencias correspondientes a pedir la lista de asistencia y luego le propuso al programador armar una base de datos para buscar las variables. Le dijeron que no se podía. Buscó un programador por su cuenta, escaneó los documentos, armó una base de datos con el número de identificación de los inasistentes y sacó su artículo. Sus conclusiones vienen a reforzar lo dicho por la maestra, una y otra vez, como un leitmotiv: trabajar con fuentes digitales es cuestión de perseverancia y curiosidad. Al final, puntualiza, el periodista puede encontrarse en la disyuntiva de no saber si, para publicar un texto basado en estadísticas, debe utilizar una herramienta sofisticada u otra con menos bemoles:
“Mis mejores editores son la gente del común —concluye—. La señora del tinto, el mesero del restaurante. Si ellos no entienden lo que yo hice, significa que mis gráficos son demasiados complejos y que no funcionan. Por eso la mejor herramienta no es la más complicada, sino la que más se entiende”.
Wordle.net y las nubes de palabras
“Les voy a enseñar, para los que no saben, cómo se pueden hacer nubes de palabras —dice Crucianelli a continuación—. Supongamos que ustedes tienen un discurso y quieren analizar las palabras que lo componen en un orden jerárquico. Lo que hacemos es copiar el discurso y pegarlo en la página de Wordle.net. Inmediatamente aparecerán las palabras que más se repiten”. En Panamá, rememora, hicieron un ejercicio interesante con la nube de palabras. Analizaron los discursos de los candidatos a la presidencia de la república, y advirtieron que la palabra “transparencia” apenas aparecía, hecho que dejaba mucho que pensar sobre sus intenciones. Y lo mejor de todo es que no es necesario registrarse en Wordle.net.
Tips para hacer periodismo en redes sociales y blogs
Varios asistentes han hecho público su interés de recibir por parte de la maestra algunos consejos para administrar sus páginas. Estas son, grosso modo, las sugerencias entregadas por la maestra:
1. En lo referente al blog:
- Utilizar bastante contenido multimedia.
- Elaborar crónicas cortas.
- Evitar los textos farragosos.
2. En lo referente a las redes sociales:
- Abrir una página en Facebook dedicada exclusivamente al periodismo.
- No aceptar amigos en el perfil personal
- Tener en cuenta que en Twitter no es tan importante quién nos sigue, sino a quién seguimos.
- No seguir a demasiados usuarios
- Usar la búsqueda avanzada de Twitter
A manera de conclusión
La idea del uso de las fuentes digitales en el periodismo hiperlocal, subraya la maestra, es adquirir relevancia y visibilidad a través del hallazgo de primicias. Ella tiene abundantes pruebas. El portal de noticias con base de datos Sololocal.info, que trabaja con noticias que, en realidad, solo interesan a los miembros de una pequeña ciudad Argentina, ha recibido ofertas de compra y su modelo ha sido replicado en Honduras y Nicaragua. Qué no podrán hacer entonces los talleristas desde sus lugares de origen, se pregunta. Pero, por supuesto, no es cuestión de soplar y hacer botellas. Es preciso sumar “horas trasero”, hacer preguntas correctas para recibir respuestas correctas. Probar herramientas desconocidas y equivocarse. Probar nuevamente y volverse a equivocar, y seguir probando a continuación hasta adquirir el dominio de las mismas. Curiosidad. Perseverancia. Disciplina. He allí la clave para encontrar primicias.
“En la medida en que empezamos a tener primicias empezamos a tener prestigio. Pero no un prestigio amarillista —advierte Crucianelli—, sino primicias verdaderas. Primicias que importen a la sociedad, con lo cual ustedes puedan tener mayor visibilidad y negociar mejor su sueldo. No se necesita estar en CNN o en el New York Times para que la mirada de muchos se pose sobre ustedes. Ese es uno de los mensajes que yo quiero dejarles en este taller. Por supuesto que se requiere de mucha voluntad. Un tremendo desgaste emocional. Pero vale la pena. Yo puedo dar fe de que vale la pena”.