Extracción masiva de información sobre subcategorización verbal vasca a partir de corpus
- Goenaga Mendizabal, Patxi
- Aldezabal Roteta, Izaskun
- Atutxa Salazar, Aitziber
- Gojenola Galletebeitia, Koldobika
- Sarasola Sánchez-Castillo, Rafael
- Aranzabe Urruzola, María Jesús
ISSN: 1135-5948
Año de publicación: 2001
Título del ejemplar: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001
Número: 27
Páginas: 29-36
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
En este artículo presentamos el trabajo realizado en la extracción automática de información sobre la aparición de complementos y adjuntos para un conjunto de 1.400 verbos a partir de un corpus periodístico de un millón y medio de palabras. Los resultados han sido evaluados, obteniéndose una precisión y cobertura satisfactorias. Estos datos se usarán para la adquisición manual y automática de información sobre subcategorización verbal.