Los secretos para detectar contenido basura en Twitter

4e8a0e1a0e378_896_607!.jpg?s=0a46f9e75f74ade61a70a3a2708cfa17&d=1575405984

Por Sección Ciencia y Tecnología 14 de junio de 2013 - 12:05

Que se utilicen los trending topic o temas más populares de Twitter para difundircontenido "basura" (spam) se ha convertido en una práctica bastante habitual. Para solventarlo, investigadores de la Universidad Nacional de Educación a Distancia (UNED)desarrollaron un método estadístico que permite detectar el contenido basura en esta conocida plataforma de microblogging. Para demostrar su eficacia, analizaron 20 millones de mensajes, 34.000 trending topics y seis millones de direcciones webs.

Los modelos del lenguaje utilizados por los investigadores son herramientas estadísticas que definen la estructura del lenguaje y que resultan muy útiles en aplicaciones con una sintaxis o semántica compleja, como ocurre con Twitter. Puesto que los trending topics tratan temas concretos, los investigadores han construido un modelo con los mensajes que se refieren a ese tema. De esta forma, podemos detectar aquellos nuevos mensajes que no se correspondan con ese modelo y, por tanto, sean spam, asegura Lourdes Araujo,coautora del estudio.

Para afinar más la herramienta, como algunos mensajes maliciosos tienen apariencia de válidos, el método analiza también el contenido de las páginas webs que se enlazan en el mensaje. Por ejemplo, si un tema popular es David Bowie, y el enlace de la página web de un tuit lleva a un portal de productos farmacéuticos, ese mensaje sería clasificado como spam.

El método puede ser implementado en tiempo real y de forma sencilla en los servidores de Twitter, algo a lo que están abiertos los investigadores, en el caso de que la compañía norteamericana quisiera incluir su algoritmo.

Fuente: 24 con

Los secretos para detectar contenido basura en Twitter

Muchos de ellos se camuflan bajo los famosos "trending topic" y "hashtags".

Las Más Leídas

La conducción de la UNCuyo cambia de manos: Adriana García fue electa rectora hasta 2030

Una camioneta cayó al Río Diamante y el conductor no logró salir con vida

Adriana García, nueva rectora: "Vamos a recuperar la esencia de la UNCuyo"

Se cayó la sesión por Adorni y expuso a los aliados: cómo votaron los diez diputados mendocinos

Tragedia en Hollywood: murió un reconocido actor de Superman en un voraz incendio junto a su esposa