Modelo inteligente para la clasificación de correos spam basado en el empleo de conjuntos aproximados

  1. Pérez Díaz, Noemí
Dirigida per:
  1. José Ramón Méndez Reboredo Director/a

Universitat de defensa: Universidade de Vigo

Fecha de defensa: 21 de d’octubre de 2016

Tribunal:
  1. Urko Zurutuza Ortega President
  2. Rosalía Laza Fidalgo Secretari/ària
  3. Jorge Fernández González Vocal

Tipus: Tesi

Teseo: 424451 DIALNET

Resum

La aparición de las tecnologías de la información e Internet han supuesto un gran impacto en el modo de vida de la sociedad actual y en el modo de comunicación de ésta. El enorme crecimiento de usuarios junto con la evolución de los terminales móviles, han propiciado que la sociedad se encuentre interconectada en todo momento. Esto ha supuesto una revolución en el modo de transferir información, destacando la importancia que ha cobrado el correo electrónico para tal fin. La instantaneidad de los mensajes electrónicos, su bajo coste y la ausencia de límites en los tipos de archivos que se pueden transmitir, han hecho del correo electrónico una herramienta indispensable en el ámbito empresarial y personal. A pesar de las ventajas, este medio también se ha aprovechado desde sus principios para difundir información no deseada en forma de spam. Se puede definir spam como el conjunto de mensajes no solicitados, no deseados y/o de remitente desconocido que millones de usuarios reciben en sus cuentas de correo electrónico o en otro medio de transmisión de información (foros, mensajería instantánea, blogs, etc). Estos correos tienen por finalidad realizar publicidad, la obtención de datos personales mediante phishing, estafas económicas a través del scam, introducción de virus o simplemente perjudicar al receptor. En este trabajo de investigación se presenta un estudio de la efectividad de distintas técnicas populares en el filtrado de correos spam teniendo en cuenta las características particulares de este dominio. Además, se ha realizado una adaptación de conjuntos aproximados para la detección de correos ilegítimos. Fruto de estas dos líneas de investigación se presenta un modelo para la clasificación de correos spam resultante de la combinación de conjuntos aproximados con técnicas de aprendizaje automático ya existentes para la mejora del filtrado.