Extracción masiva de información sobre subcategorización verbal vasca a partir de corpus
- Goenaga Mendizabal, Patxi
- Aldezabal Roteta, Izaskun
- Atutxa Salazar, Aitziber
- Gojenola Galletebeitia, Koldobika
- Sarasola Sánchez-Castillo, Rafael
- Aranzabe Urruzola, María Jesús
ISSN: 1135-5948
Datum der Publikation: 2001
Titel der Ausgabe: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001
Nummer: 27
Seiten: 29-36
Art: Artikel
Andere Publikationen in: Procesamiento del lenguaje natural
Zusammenfassung
En este artículo presentamos el trabajo realizado en la extracción automática de información sobre la aparición de complementos y adjuntos para un conjunto de 1.400 verbos a partir de un corpus periodístico de un millón y medio de palabras. Los resultados han sido evaluados, obteniéndose una precisión y cobertura satisfactorias. Estos datos se usarán para la adquisición manual y automática de información sobre subcategorización verbal.