Construcción de un corpus etiquetado sintácticamente para el euskera
- Aduriz, Itziar
- Aldezabal Roteta, Izaskun
- Aranzabe Urruzola, María Jesús
- Arrieta Kortajarena, Bertol
- Arriola Egurrola, José María
- Atutxa Salazar, Aitziber
- Díaz de Ilarraza Sánchez, Arantza
- Gojenola Galletebeitia, Koldobika
- Oronoz Anchordoqui, Maite
- Sarasola Gabiola, Kepa
ISSN: 1135-5948
Año de publicación: 2002
Título del ejemplar: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002
Número: 29
Páginas: 5-11
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
El objetivo de este trabajo es la construcción de un corpus anotado sintácticamente para el euskera. En esta comunicación presentaremos, en primer lugar, las bases sobre las que se asienta nuestro etiquetado. Tras examinar diversas opciones se optó por el esquema presentado por (Carrol et al., 1998). Este esquema sigue los estándares EAGLES y se basa en la idea de añadir a cada frase del corpus una serie de relaciones gramaticales que especifican la dependencia existente entre el núcleo y sus modificadores. Una vez presentado el formalismo de etiquetado, se expondrán los problemas que hemos encontrado en nuestra tarea y las decisiones tomadas. Seguidamente se describirá un ejemplo concreto en el que se muestra la aplicación de dicho esquema sobre un corpus inicial. Finalmente, presentaremos las conclusiones sobre la idoneidad del esquema al euskera y trabajo futuro.