Así es como INEGI mide tu felicidad cuando tuiteas

Actualidad -
El INEGI entró al análisis del Big Data. Foto: Archivo
El INEGI entró al análisis del Big Data. Foto: Archivo

CIUDAD DE MÉXICO.- El Instituto Nacional de Estadística y Geografía (INEGI) es el órgano de generar la mayoría de las estadísticas oficiales del país.

En el listado de sus publicaciones periódicas se encuentra el Producto Interno Bruto, la inflación, desempleo, etcétera. 

No obstante el INEGI también elabora estadísticas "experimentales" relacionadas al ciberacoso, el bienestar subjetivo y, desde el año pasado, el Estado de Ánimo de los Tuiteros en México.

Se calculó un índice que representa la relación de número de tuits positivos entre el número de tuits negativos y se representan tanto geográficamente como gráficamente", explica el INEGI en su documento metodológico.

¿Cómo lo hicieron?

El INEGI declaró que la información proveniente de sistemas en Internet y de dispositivos electrónicos conectados a esta red, puede contribuir en la producción de información estadística y geográfica,

Por ello reconocieron que cuando se lanza un tuit se tiene la alternativa de georreferenciarlos, etiquetando cada tuit con las coordenadas geográficas de su ubicación en el momento de publicarlo, por lo que se puede saber qué tuits se emitieron en México.

Mediante el uso de mecanismos que Twitter pone a disposición de cualquier usuario, el INEGI ha
recolectado tuits públicos y georreferenciados dentro del territorio nacional", explicaron.
Cada punto azul en el mapa representa un tuit en México.

¿Y el cálculo?

Desde febrero de 2014 hasta el 15 de mayo de 2015 el INEGI recolectó 125 millones de tuits, por lo que analizar individualmente cada texto para determinar si se refería a una situación positiva, negativa o neutral era sumamente complicado.

Para generar este subconjunto de tuits etiquetados, se realizó una colaboración con la Universidad Tec Milenio, en la que más de 5 000 estudiantes etiquetaron manualmente miles de tuits. En este ejercicio cada tuit se presentó múltiples veces a los estudiantes con la finalidad de que un solo tuit pueda ser etiquetado varias veces y de esta manera buscar un consenso en la etiqueta", mencionaron.

Después los resultados de los tuits "limpios" se analizaron con un algoritmo que utilizaba técnicas de "Machine Learning", un sistema que es capaz de "aprender" a etiquetar los tuits automáticamente.

Posteriormente se "normalizaron" los tuits, es decir se "usó un proceso de normalización que consiste en la ejecución de varios pasos como corrección de errores, anonimización de usuarios y de URLs, aprovechamiento de emoticones, identificación de la sintaxis de la oración y su negación", con el objetivo de obtener la información más representativa del tuit y poder hacer una valoración más concreta.

El resultado

Una vez que se tienen los tuits normalizados el proceso continúa con la validadación y la programación de un algoritmo capaz de clasificar una gran cantidad de tuits demanera automática.

Los resultados son presentados en forma de índice, en donde los tuits positivos son divididos entre los negativos. Estos números se insertan en un mapa para poder observar el estado de ánimo de los tuiteros en cada estado, que puede ser consultado en este enlace.

Te puede interesar:

 

El truco matemático que te ayudará a encontrar lugar en el estacionamiento

Lo caro que es rentar en la CDMX visto en un mapa del Metro

Así es como los latinos planean votar en Estados Unidos

DVR

Aclaración:
El contenido mostrado es responsabilidad del autor y refleja su punto de vista.
Tips para tus finanzas personales directo en tu correo.
Al registrarme acepto los términos y condiciones

  TAGS

Taboola
Icono de te puede interesar de en dineroenimagen

TAMBIÉN TE PUEDE INTERESAR