Construcción de un corpus etiquetado sintácticamente para el euskera

  1. Aduriz, Itziar
  2. Aldezabal Roteta, Izaskun
  3. Aranzabe Urruzola, María Jesús
  4. Arrieta Kortajarena, Bertol
  5. Arriola Egurrola, José María
  6. Atutxa Salazar, Aitziber
  7. Díaz de Ilarraza Sánchez, Arantza
  8. Gojenola Galletebeitia, Koldobika
  9. Oronoz Anchordoqui, Maite
  10. Sarasola Gabiola, Kepa
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2002

Título del ejemplar: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002

Número: 29

Páginas: 5-11

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El objetivo de este trabajo es la construcción de un corpus anotado sintácticamente para el euskera. En esta comunicación presentaremos, en primer lugar, las bases sobre las que se asienta nuestro etiquetado. Tras examinar diversas opciones se optó por el esquema presentado por (Carrol et al., 1998). Este esquema sigue los estándares EAGLES y se basa en la idea de añadir a cada frase del corpus una serie de relaciones gramaticales que especifican la dependencia existente entre el núcleo y sus modificadores. Una vez presentado el formalismo de etiquetado, se expondrán los problemas que hemos encontrado en nuestra tarea y las decisiones tomadas. Seguidamente se describirá un ejemplo concreto en el que se muestra la aplicación de dicho esquema sobre un corpus inicial. Finalmente, presentaremos las conclusiones sobre la idoneidad del esquema al euskera y trabajo futuro.