Investigadores de Fraunhofer han desarrollado un sistema que analiza automáticamente las publicaciones en las redes sociales, filtrando deliberadamente las noticias falsas y la desinformación. La herramienta analiza el contenido y los metadatos, lo clasifica usando técnicas de aprendizaje automático y aprovechando la interacción del usuario para optimizar los resultados a medida que avanza.
Las noticias falsas están diseñadas para provocar una respuesta específica o incitar a la agitación contra un individuo o un grupo de personas. Su objetivo es influir y manipular la opinión pública sobre temas específicos del día.
Este tipo de noticias se propaga como un reguero de pólvora a través de Internet, particularmente en las redes sociales como Facebook o Twitter y su identificación puede ser una tarea difícil.
La herramienta de clasificación desarrollada por el Instituto Fraunhofer para la comunicación, el procesamiento de la información y la ergonomía FKIE, analiza automáticamente las publicaciones en las redes sociales procesando grandes cantidades de datos.
Además de procesar el texto, la herramienta también incluye los metadatos en su análisis y entrega sus hallazgos en forma visual. “Nuestro software se centra en Twitter y otros sitios web. Los tweets son donde se encuentran los enlaces que apuntan a las páginas web que contienen las verdaderas noticias falsas. En otras palabras, las redes sociales actúan como un disparador, si lo desea” explica el profesor Ulrich Schade de Fraunhofer FKIE, cuyo grupo de investigación desarrolló la herramienta.
“Las noticias falsas a menudo se alojan en sitios web diseñados para imitar la presencia en la web de las agencias de noticias y pueden ser difíciles de distinguir de los sitios reales. En muchos casos, se basarán en noticias oficiales, pero en las que se modificó la redacción” indico Schade.
Como inicia el proceso
Schade y su equipo comienzan el proceso construyendo bibliotecas compuestas por noticias serias y también textos que los usuarios han identificado como noticias falsas. Estos forman los conjuntos de aprendizaje utilizados para entrenar el sistema.
Para filtrar las noticias falsas, los investigadores emplean técnicas de aprendizaje automático que buscan automáticamente marcadores específicos en textos y metadatos. Por ejemplo, en un contexto político, podría tratarse de formulaciones o combinaciones de palabras que raramente aparecen en el lenguaje cotidiano o en los informes periodísticos, como "el actual canciller de Alemania".
Los errores lingüísticos también son una bandera roja. Esto es particularmente común cuando el autor de las noticias falsas estaba escribiendo en un idioma diferente al de su lengua materna. En tales casos, la puntuación incorrecta, la ortografía, las formas verbales o la estructura de la oración son advertencias de una posible noticia falsa.
“Cuando suministramos al sistema una serie de marcadores, la herramienta se enseñará a seleccionar los marcadores que funcionan. Otro factor decisivo es elegir el enfoque de aprendizaje automático que proporcionará los mejores resultados. Es un proceso que consume mucho tiempo, ya que tiene que ejecutar los distintos algoritmos con diferentes combinaciones de marcadores ”, dice Schade.
Los metadatos dan pistas vitales.
Los metadatos también se utilizan como marcador. De hecho, desempeñan un papel crucial en la diferenciación entre fuentes de información auténticas y noticias falsas: por ejemplo, ¿con qué frecuencia se publican las publicaciones, cuándo se programa un tweet y a qué hora?
Los investigadores explican que el momento de una publicación puede ser muy revelador. Por ejemplo, puede revelar el país y la zona horaria del autor de la noticia. Una alta frecuencia de envío sugiere bots, lo que aumenta la probabilidad de una noticia falsa. Los robots sociales envían sus enlaces a una gran cantidad de usuarios, por ejemplo, para difundir la incertidumbre entre el público.
Las conexiones y los seguidores de una cuenta también pueden ser un terreno fértil para los analistas. Esto se debe a que permite a los investigadores crear mapas de calor y gráficos de envío de datos, frecuencia de envío y redes de seguidores. Estas estructuras de red y sus nodos individuales se pueden usar para calcular qué nodo de la red hizo circular un artículo de noticias falsas o inició una campaña de noticias falsas.
Otra característica de la herramienta automatizada es su capacidad para detectar discursos de odio. Las publicaciones que se hacen pasar por noticias, pero también incluyen discursos de odio a menudo se vinculan con noticias falsas. “Lo importante es desarrollar un marcador capaz de identificar casos claros de discurso de odio. Los ejemplos incluyen expresiones tales como 'escoria política' o 'negro', dice el lingüista y matemático.
Los investigadores pueden adaptar su sistema a varios tipos de texto para clasificarlos. Tanto los organismos públicos como las empresas pueden usar la herramienta para identificar y combatir noticias falsas. “Nuestro software puede ser personalizado y capacitado para satisfacer las necesidades de cualquier cliente. Para los organismos públicos, puede ser un sistema útil de alerta temprana ”, finaliza Schade.
versión en ingles
https://www.fraunhofer.de/en/press/research-news/2019/february/software-that-can-automatically-detect-fake-news.html