Un método incremental para la clasificación automática y semántica de recursos en sistemas de etiquetado colaborativo

  1. Echarte Ayerra, Francisco
Dirigida per:
  1. Jesús Villadangos Alonso Director/a
  2. Alberto Córdoba Izaguirre Director/a

Universitat de defensa: Universidad Pública de Navarra

Fecha de defensa: 03 de de maig de 2011

Tribunal:
  1. Óscar Díaz García President/a
  2. Diego López de Ipiña González de Artaza Secretari
  3. Rafael Berlanga Vocal

Tipus: Tesi

Teseo: 334609 DIALNET

Resum

En esta Tesis Doctoral se propone un método de clasificación automática de recursos en sistemas de etiquetado colaborativo. Este tipo de sistemas se ha convertido en el estándar de facto en la Web 2.0 para clasificar la información, sin embargo tienen una serie de inconvenientes, relacionados con la representación del conocimiento y la recuperación de la información, que dificultan su uso. Previamente a la introducción del método, se presenta el estado del arte relativo a los sistemas de etiquetado colaborativo, describiendo sus características y las principales propuestas existentes hasta el momento en la bibliografía, orientadas a resolver algunos de sus inconvenientes. El método, de nombre ACoAR, tiene como objetivo mejorar la representación del conocimiento y la recuperación de información en los sistemas de etiquetado colaborativo, realizando una clasificación automática de los recursos bajo un conjunto de conceptos de clasificación. Esta clasificación se realiza comparando la semántica de los recursos con la semántica de los conceptos de clasificación, para lo cual la información semántica de los recursos se obtiene a partir de las anotaciones realizadas por los usuarios sobre los mismos, y la de los conceptos de clasificación a partir de los recursos que clasifican. Se utiliza únicamente un subconjunto de todas las etiquetas existentes para representar la semántica de los recursos y de los conceptos de clasificación. Esto hace que el método tenga un coste computacional significativamente menos en comparación a la utilización del conjunto total de etiquetas. ACoAR se utiliza en sistemas existentes creando automáticamente los conceptos de clasificación y clasificando los recursos disponibles en ese momento. También se aplica a la evolución de estos sistemas, procesando la nueva información generada y adaptando los conceptos y la clasificación a esta evolución. El método está basado en una arquitectura abierta de componentes que permite su aplicación a sistemas de etiquetado de diferentes características. La validación del método se realiza en varios pasos. Primero se valida la calidad de la clasificación del método, para lo cual se compara la clasificación de un conjunto de recursos proporcionada por el método con la clasificación de esos mismos recursos realizada por un conjunto de expertos humanos y con la proporcionada por otros métodos de clasificación existentes en la bibliografía. Tras validar la calidad de la clasificación del método, se analiza en qué medida afecta a esta clasficación y a su rendimiento, la reducción en el número de etiquetas utilizadas para representar la semántica de los recursos. Posteriormente, se valida la calidad del método cuando se aplica a sistemas de etiquetado colaborativo existentes y a su evolución, para lo cual se realiza una implementación del método y se simula un entorno distributivo en el que múltiples usuarios realizan anotaciones en el sistema concurrentemente. Por último, para validar las mejoras en la recuperación de información ofrecidas por el método, se ha creado un prototipo de navegación que ha sido evaluado por un conjunto de usuarios, verificando la validez del mismo.