Si quiere tuitear sobre política y ganar visibilidad, que el mensaje sea negativo. Cuanto más lo sea, más probabilidades tiene de ser compartido en Twitter y, por tanto, de hacerse viral. Al mismo tiempo, se ha comprobado que el uso de la negatividad en un tuit aumenta la probabilidad de retuitear y que el lexicón iSOL es el que mejor determina la relación entre polaridad y viralidad. Por el contrario, los tuits con palabras positivas bajan la probabilidad de retuit.
Son los resultados más destacados de un estudio de la Universidad de Jaén (UJA), que ha tomado como banco de pruebas tanto la reciente campaña electoral madrileña como la campaña del referéndum de Cataluña de 2017. En el caso de los comicios a la Comunidad de Madrid, se han recopilado unos 7.000 mensajes vinculados con los hashtags oficiales y las cuentas de los principales candidatos que obtuvieron mayor votación. El 41% de ellos tenían un contenido negativo, casi el doble de los que presentaban una connotación positiva.
El estudio se ha llevado a cabo a partir de lo que los investigadores denominan análisis de sentimiento. Así, aplicando un modelo matemático y técnicas de inteligencia artificial (IA) basadas en procesamiento del lenguaje natural (PLN), se ha intentado comprobar si el nivel de positividad o negatividad de las palabras de un tuit influyen en su viralidad, aplicando la investigación a una situación política real. “El estudio nos ha permitido apreciar la polaridad que existe en el debate político, con multitud de mensajes cargados de negatividad y hasta de discursos de odio”, señala María Teresa Martín, catedrática de Lenguajes y Sistemas Informáticos de la Universidad de Jaén (UJA) y coatura del estudio. Entre las palabras negativas introducidas, dentro de los distintos recursos lingüísticos disponibles, prevalecen insultos y determinados verbos, según ha desvelado el trabajo de campo.
En el modelo matemático empleado en el estudio se han tenido en cuenta diversas variables y características del tuit, tanto a nivel del propio mensaje (cantidad de retuits, o cuántas palabras positivas o negativas emplea) como del usuario que lo publicó (número de tuits emitidos desde que se creó la cuenta, número de favoritos y listas, etcétera). Además, para determinar el número de palabras positivas y negativas se han empleado unos recursos lingüísticos denominados lexicones. “Los términos que expresan sentimientos afectan a la frecuencia de retuiteo, algo que hemos estudiado mediante un modelo de regresión que permite el análisis de diferentes variables, identificando cuáles de ellas influyen más directamente en la viralidad de un tuit”, ha señalado la profesora de la Universidad jienense Salud Jiménez Zafra, doctora en Informática y diplomada en Estadística. En el trabajo titulado ¿Cómo afectan los sentimientos a la viralidad en Twitter?, que ha sido publicado por la revista científica Royal Society Open Science, también colaboraron los profesores Antonio José Sáez Castillo y Antonio Conde Sánchez.
En los casos en los que los usuarios pueden ser considerados como un influencer, es decir, que tenga un gran número de seguidores, se han aplicado diferentes variables que han permitido probar que cuantas más palabras negativas haya en el mensaje, mayor probabilidad existe de que el tuit sea retuiteado.
Durante la campaña del referéndum de Cataluña se recogieron unos 50.000 tuits de unos 25.000 usuarios distintos. Se tomaron todas aquellas publicaciones lanzadas en Twitter en los días previos al 1 de octubre de 2017 con los hashtag #ReferendumCatalan y #CatalanReferendum. En esas fechas los investigadores no solo se centraron en Cataluña, sino que también tomaron en cuenta tuits publicados por cualquier usuario de esta red social en todo el territorio español.
Noticias falsas
La inteligencia artificial también está detrás de la aplicación que determina la veracidad de las noticias con una altísima precisión. Un equipo de investigación de las universidades de Jaén y Alicante ha creado un sistema que testea la noticia en dos niveles detectando si existen incongruencias en el contenido y si la estructura coincide con la que cualquier publicación con rigor periodístico debe tener.
El sistema analiza la estructura de la noticia publicada atendiendo a las normas de periodismo clásicas: la regla de las 5W+H, conocida así por las siglas de las cuestiones en inglés, y la pirámide invertida. Estas guías se sustentan en que la noticia rigurosa debe contener información que responda a las seis preguntas básicas (¿qué?, ¿cuándo?, ¿dónde?, ¿quién?, ¿por qué? y ¿cómo?) y que se presente en gradación desde lo más importante hasta los detalles. “La estructura de una publicación nos da pistas de si hay base periodística o si, por el contrario, imita a una noticia real”, indica Miguel Ángel García, investigador de la Universidad de Jaén y coautor del trabajo.
A partir del análisis del lenguaje natural, los expertos desarrollan un algoritmo que detecta las informaciones que no responden a esta estructura. Estos cálculos se basan en técnicas de aprendizaje automático, también conocido como machine learning, de forma que el sistema va aprendiendo a medida que va acumulando datos.
Además, la máquina puede procesar en segundos miles de datos simultáneos, algo que una persona no podría hacer. “Así, los periodistas pueden contrastar fuentes, detectar estructuras incorrectas, viralizadas o que tengan incongruencias entre el titular y el cuerpo de manera inmediata y automática. También el usuario final puede tener evidencias de si la noticia que lee cumple con unos estándares o no”, añade Estela Saquete, investigadora de la Universidad de Alicante y coautora del estudio que realizó las pruebas a partir de unos 200 artículos centrados en temas sanitarios, de especial relevancia en la actualidad debido a las numerosas noticias falsas que circulan sobre la covid-19.
Puedes seguir a EL PAÍS TECNOLOGÍA en Facebook y Twitter.