Extracción masiva de información sobre subcategorización verbal vasca a partir de corpus
- Goenaga Mendizabal, Patxi
- Aldezabal Roteta, Izaskun
- Atutxa Salazar, Aitziber
- Gojenola Galletebeitia, Koldobika
- Sarasola Sánchez-Castillo, Rafael
- Aranzabe Urruzola, María Jesús
ISSN: 1135-5948
Any de publicació: 2001
Títol de l'exemplar: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001
Número: 27
Pàgines: 29-36
Tipus: Article
Altres publicacions en: Procesamiento del lenguaje natural
Resum
En este artículo presentamos el trabajo realizado en la extracción automática de información sobre la aparición de complementos y adjuntos para un conjunto de 1.400 verbos a partir de un corpus periodístico de un millón y medio de palabras. Los resultados han sido evaluados, obteniéndose una precisión y cobertura satisfactorias. Estos datos se usarán para la adquisición manual y automática de información sobre subcategorización verbal.