Specification of a general linguistic annotation framework and its use in a real context

  1. Artola Zubillaga, Xabier
  2. Díaz de Ilarraza Sánchez, Arantza
  3. Sologaistoa Fresno, Aitor
  4. Soroa Etxabe, Aitor
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2007

Número: 39

Páginas: 157-164

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

AWA es una arquitectura general para representar información lingüística producida por procesadores lingüísticos. Nuestro objetivo es definir un esquema de representación coherente y flexible que sea la base del intercambio de información entre herramientas lingüísticas de cualquier tipo. Los análisis lingüísticos se representan por medio de estructuras de rasgos según las directrices de TEI-P4. Estas estructuras y su relación con los demás elementos que componen el análisis forman parte de un modelo de datos diseñado bajo el paradigma de orientación a objetos. AWA se encarga de la representación de la información dentro de una arquitectura más amplia para gestionar todo el proceso de análisis de un corpus. Como ejemplo de la utilidad del modelo presentado explicaremos cómo se ha aplicado dicho modelo en el procesamiento de dos corpus.