Qué dicen los datos

1.

Nate Silver se fue del New York Times para crear, con un equipo más robusto, FiveThirtyEight.com. Dejó atrás el popular blog de “predicciones” de resultados de elecciones que tantos beneficios en tráfico le trajo al Times, para seguir con sitio de tratamiento de datos que salió hace muy poquito tiempo bajo el ala de ESPN.

2.

El lugar que pensábamos vacío, ahora lo ocupa un nuevo blog: The Upshot. Tiene 2 focos: la interpretación de datos y el llamado periodismo-explicativo.

Esto último tal vez incorporado luego de conocerse de qué iba el sitio que comentaba hace unos días, Vox.com. Eso que llaman “explicativo” que sería algo así como  -según voy entendiendo-: bajar a tierra y explicar al gran público esos temas tan complejos que hablan en las primeras páginas del mismo medio.

Tres cosas interesantes de The Upshot:

a. Sus “predicciones” (un opuesto total a los días de Silver en la compañía) se mantienen y son de código abierto.

b. El equipo de 15 personas está integrada a la redacción general y hay profesionales de las 3 áreas fundamentales: diseñadores gráficos, desarrolladores y periodistas.

c. Lo dirige David Leonhardt, ganador de un Pulitzer que viene del Washington Post.

3.

El dato -al menos para mí- es que al parecer se necesitan mejores explicaciones de la realidad, bajar más a tierra lo que pasa en las primeras páginas de los diarios.

Leonhardt dice en el lanzamiento: “creemos que mucha gente no entiende las noticias como les gustaría”, entonces quieren llegar a una escritura directa y sencilla: “el mismo estilo que se utiliza cuando se escribe un correo electrónico a un amigo”.

Síntoma o tendencia.

Google Databoard

Google publicó ayer su Databoard, un espacio donde comparte estudios, datos e investigaciones que hizo la compañía en los últimos años. Por ahora está centrado en móviles y dentro de Estados Unidos. Todos se pueden descargar.

Pasen a ver el trabajo que tiene mucho de visualización de datos, que se pueden compartir y hasta crear infografías.

De paso, recomiendo una vez más Think Insights (también de Google). Quizá el único espacio de esta empresa donde se pueden encontrar artículos, informes y estudios relacionados a la industria que no son (necesariamente) autoreferenciales 😉

Enlace: Google Databoard | Vía

¿Cómo crea Quartz visualizaciones de datos tan rápido?

Alguien lo pregunta en Quora y el responsable de esa tarea le responde:

De 3 maneras:

  • Tienen creada una herramienta interna con el estilo del medio hecha en D3. Los periodistas pueden ingresar los datos y crear el o los gráficos ahí. Luego pueden hacer una captura de pantalla de eso o subirla al sitio. Tip: también sugiere el uso de D3 Generator.
  • Cuando ya saben que tendrán datos de algún tipo (ejemplo: los datos de empleo que se entregan cada comienzo de mes), ya tienen una herramienta preparada. Un scraper hecho en Python más los gráficos de D3.
  • Y la última opción, para salir de apuros dicen, es con FactSet (un servicio de pago) que también recoge los datos y los muestra en gráficos. No de la manera que en Quartz gustan mostrar, pero funciona de todos modos.

Verán la importancia que le dan a D3, y no son el único medio que analizó lo mismo. Por si interesa: tutorial 1, 2 y 3 para aprender a usarlo. Están en inglés, no encontré otros…

(Vía: Nieman)

Visualización de datos: cantidad de peatones en las calles de Melbourne

¿Fin de la paranoia? En Melbourne instalaron unos sensores en algunas de sus calles para medir la cantidad de peatones. En total son 18 sensores que detectan el paso de las personas y evitan los falsos positivos (como un carro de compras). Esos datos son procesados y el propio gobierno decidió armar un sitio web para poder explorarlo.

El resultado es este gran sitio donde poder mirar la densidad de personas en determinado día y a determinada hora. Según explican, la información les sirve para observar los comportamientos ante eventos especiales y poder modificarlos en el futuro. Además pusieron a disposición la data en CVS.

Aquí uno de los sensores:

Visualización de datos de Twitter #Euro2012 oficial

Twitter data viz

Visualización de ayer durante la final España – Italia

Twitter es el único que puede brindar estadísticas certeras sobre el uso de su herramienta. Según entiendo, los datos que comparten (vía API) siempre fueron limitados y las conclusiones que cualquier desarrollo puede obtener son, más que nada, una aproximación. De manera que es interesante cada vez que Twitter, de manera oficial, entrega datos de uso de su plataforma. Esta vez se trata de la Eurocopa 2012 que terminó ayer.

#Euro2012 muestra la cantidad de tweets que se publicaron según los distintos equipos que participaron en el torneo de fútbol. Están dividos por partido y detalla la cantidad de tweets minuto a minuto. Además de una visualización general de todo el periodo.

No hay muchos más detalles sobre cómo fue hecho (¿fueron analizados sólo los tweets con el hashtag?).

El desarrollo estuvo a cargo de @philogb. Pasen y vean: Euro2012.

 

Línea de Tiempo: Libros de Periodismo de Datos (1970-2012)

DataBlog del Guardian, publica esta línea de tiempo elaborada por Henk van Ess, un especialista en tecnología holandés, sobre los libros de Periodismo de Datos. Empezando por “Presicion Journalism” de 1970.

Seguro que algún libro falta, son sólo 17, ordenados cronológicamente según fecha de publicación. Más si tomamos aquellos del llamado “periodismo de precisión”. Una categoría o especialización que sí está en las Universidades como casos de estudio, al menos recuerdo haber realizado prácticas en mi época de estudiante de Comunicación.

Los dejo con la línea de tiempo (pueden visitarla en su sitio original si quieren) y sugerir otros libros si es que aquí no aparecen:

“Data Journalism Handbook”, el libro guía sobre periodismo de datos

La idea nació en el MozFest 2011 de Londres. Desde entonces, muchos periodistas colaboraron para la realización de The Data Journalism Handbook”. Una suerte de libro/guía que explica desde qué es el periodismo de datos hasta casos de estudio y algunos tips para trabajar en la material.

Está en inglés (aunque pondrán a disposición traductores para otros idiomas), es gratuito en la web y se actualiza de manera constante.

Desde Argentina colaboran: Mariana Berruezo, Mariano Blejman (entre otros de Hacks/Hackers Buenos Aires), Angélica Peralta Ramos (La Nación) y muchos otros periodistas de distintos medios de todo el mundo.

Los dejo con una infografía que explica de manera visual el contenido del libro:

La Nación apuesta por el periodismo de datos

Hace poco les contaba sobre la salida de LN Data, el blog que La Nación dedica a la temática de los datos y sus procesos para convertirlos en información digerible.

La iniciativa va un poco más allá con dos anuncios importantes. Por un lado, la puesta en marcha de “Data” una sección donde podrán encontrar varios gráficos con información actualizada, disponibles para su descarga y compartir en tu sitio y/o redes sociales. Según lo explican ellos, se trata de un “proyecto experimental” y fue elaborado en asociación con Junar, una plataforma creada por argentinos y de gran reconocimiento en su campo.

Open NewsEl otro anuncio importante es que La Nación formará parte del proyecto “Knight-Mozilla OpenNews”. El propósito es “producir la próxima generación de soluciones web para el mundo de las noticias, a través de la integración de las comunidades de desarrolladores y periodistas, y el apoyo para que trabajen en conjunto. El proyecto incluye un programa de becarios que trabajan en las organizaciones de noticias asociadas, para colaborar e innovar en las formas de hacer periodismo”. De manera que un programador orientado a los datos abiertos trabajará junto a la redacción del medio.

La Nación será el único medio de habla hispana que participará de la iniciativa junto a, nada menos, New York Times, ProPublica y Spiegel Online.

Ambos proyectos dan una buena señal hacia dónde dirige el medio su apuesta de experimentación digital. Precursores en Argentina y en medios de habla hispana, están dando algunas señales de un trabajo serio y a conciencia. Desde aquí lo festejamos y esperamos ansiosos las primeras producciones. Porque se trata de eso, de arriesgar.

Una sola crítica. Tal vez menor. La cuenta de Twitter dedicada al asunto, @LNData (es la única que sigo de este medio), es muy buena. Publican y distribuyen contenido sobre periodismo y datos que van desde noticias, trabajos realizados, cobertura de conferencias, opiniones y un interesante etcétera. Mi crítica, ahora sí, es que mucho de lo que se publica está en inglés. Entiendo que gran cantidad de contenido sobre el tema está en ese idioma, incluso sus referentes. Pero en mi silenciosa cruzada por defender nuestro idioma, me obliga a poner atención a esto, aunque pueda entender esa lengua. Me parece que una buena forma de incluir más adeptos y comenzar a salir del nicho es ser lo más claros posibles. Es mi opinión personal, claro.

5 artículos para leer el fin de semana

Foto publicada por el propio Mark Zuckerberg en Facebook.

Visualización: tres siglos de diarios de Estados Unidos

Visualización diarios EEUU

Impresionante trabajo de visualización de datos realizó la Universidad de Standford sobre más de 140 mil diarios de Estados Unidos desde 1690 hasta la actualidad.

Tiene mucho filtros para configurar las publicaciones: según lengua, frecuencia de publicación, fecha de su nacimiento, lugar de origen, entre otros.

Pasen y conozcan “Data Visualization: Journalism’s Voyage West“. | Vía: Onlain.

Un anuario hecho a partir de la API de NYTimes

Desde que New York Times hizo públicas las APIs de su sitio, aparecieron algunas experiencias interesantes de visualización. Ahora desde el blog Open darán a conocer algunos trabajos realizados por terceros con toda esa “materia prima”, con toda esa data. Pura data.

Una nueva lectura de las noticiases un trabajo realizado por Margaret McKenna. Tomó todas las noticias del 2010 de la sección “World” y se mandó con este sitio que permite recorrer por continente las noticias publicadas en NYTimes. Cada círculo representa una noticia (y su acceso para poder leerla). En el signo de interrogación (derecha, arriba) hay más datos sobre su realización.