Extracción masiva de información sobre subcategorización verbal vasca a partir de corpus
- Goenaga Mendizabal, Patxi
- Aldezabal Roteta, Izaskun
- Atutxa Salazar, Aitziber
- Gojenola Galletebeitia, Koldobika
- Sarasola Sánchez-Castillo, Rafael
- Aranzabe Urruzola, María Jesús
ISSN: 1135-5948
Argitalpen urtea: 2001
Zenbakien izenburua: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001
Zenbakia: 27
Orrialdeak: 29-36
Mota: Artikulua
Beste argitalpen batzuk: Procesamiento del lenguaje natural
Laburpena
En este artículo presentamos el trabajo realizado en la extracción automática de información sobre la aparición de complementos y adjuntos para un conjunto de 1.400 verbos a partir de un corpus periodístico de un millón y medio de palabras. Los resultados han sido evaluados, obteniéndose una precisión y cobertura satisfactorias. Estos datos se usarán para la adquisición manual y automática de información sobre subcategorización verbal.