Macrussmoderación automática de comentarios y reputación de usuarios en sitios web sociales
- de la Peña Sordo, Jorge
- Pablo García Bringas Director
- Igor Santos Grueiro Director/a
Universidad de defensa: Universidad de Deusto
Fecha de defensa: 24 de octubre de 2014
- Emilio Santiago Corchado Rodríguez Presidente/a
- Asier Perallos Ruiz Secretario
- Giuseppe Psaila Vocal
Tipo: Tesis
Resumen
La generación de contenidos por parte de los usuarios supone uno de los mayores valores que la era de la información, tal y como se la conoce hoy en día, aporta a la sociedad. De esta manera, los antiguos portales web, en los que existía un plantel de profesionales que generaba el contenido, se han convertido en plataformas de difusión de la creatividad de los usuarios, los cuales generan contenidos de forma cada vez más profesional. El crecimiento de este tipo de plataformas, organizado en torno a comunidades, es evidente. Prueba de ello es el crecimiento que distintas redes sociales y comunidades han sufrido últimamente. En particular, diversos sitios web sociales de noticias como Digg o Menéame son muy populares en este ámbito. Estos sitios trabajan de manera sencilla e intuitiva: los usuarios envían enlaces de artículos en línea, y otros usuarios de este sistema los valoran positiva o negativamente mediante votaciones. Los artículos más votados favorablemente aparecen, finalmente, en la portada. Esta tesis está enfocada en la web Menéame, la cual ya dispone de un método para moderar y así poder filtrar automáticamente comentarios y noticias; sin embargo, está basado en los votos de otros usuarios y, por lo tanto, no puede ser objetivo. Este hecho puede provocar la aparición de grupos de presión y usuarios o grupos trol que desvirtúen el sistema. En la misma línea, hay enfoques para filtrar spam en comentarios, donde se propone un método basado en diversas opiniones y características sintácticas para filtrar automáticamente mensajes de spam en comentarios, en el sitio web Amazon. Para evitar estos problemas, en el contexto de la categorización de usuarios, se han realizado diferentes trabajos empleando las características de las pulsaciones del usuario en el teclado o su actividad en los registros. Sin embargo, no existen trabajos específicos que se encarguen de la problemática de las noticias sociales y sus peculiaridades. Por ello, esta investigación busca mitigar el salto existente entre la plataforma y el usuario, ya que el volumen de contenido generado en ciertos sitios web no permite que se pueda hacer un control manual. Por lo tanto, proponemos un sistema de moderación automática y escalable que permita a la plataforma tener una mejor información sobre sus usuarios y sobre el uso que hacen de la plataforma. En el mismo sentido, los usuarios estarán más protegidos de agravios y vejaciones, lo que hará que su estancia en la plataforma sea más placentera. Para su realización hemos diferenciado 4 tareas principalmente. En primer lugar, el estudio de la problemática, en la cual contextualizaremos el problema. En segundo lugar, la categorización de comentarios: (i) entrenamiento y (ii) sistema de categorización. La clasificación de usuarios, en tercer lugar, que haciendo uso de las características de los perfiles de los usuarios y sus comentarios podremos realizar un sistema que los clasifique. Y por último, generaremos un sistema automático para controlar y predecir la reputación y el comportamiento de los usuarios en base a su actividad anterior.