Euskal hiztegia-ren azterketa eta egituratzea ezagutza lexikalaren eskuratze automatikoari begira. Aditz-adibideen analisia murriztapen-gramatika baliatuz, azpikategorizazioaren bidean
- Joseba Abaitua Directeur/trice
- Xabier Artola Zubillaga Co-directeur
Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 15 septembre 2000
- Patxi Goenaga Mendizabal President
- Xabier Arregi Iparragirre Secrétaire
- Fred Karlsson Rapporteur
- Beñat Oyharçabal Rapporteur
- Irene Castellón Masalles Rapporteur
Type: Thèses
Résumé
El resultado del trabajo de ivestigación realizado sobre el diccionario Euskal Hiztegia ha sido la obtención de una clasificación automática de los verbos del mismo, tomando como criterio la estructura argumental que ofrecen los ejemplos ilustrativos seleccionados por el lexicógrafo de un un corpus más amplio. Esta clasificación sirve como punto de partida para el estudio de la su categorización verbal en el corpus. Para la obtención de dicha clasificaión básica, se han tendio que desarrollar las siguientes tareas: estudio pormenorizado de la fuente léxica a tratar, etiquetado del diccionario, escribir la gramática que recoge la estructua de las entradas del diccionario, el análisis automático del diccionario y su psoterior adaptación a un modelo estándar. En concreto, hemos seguido los criterios propuestos por TEI (Text Encoding Initiative). El análisis y posterior etiquetado del diccionario siguiendolos criterios propuestos por TEI hacen posible el estudio por medio del ordenador de la maplia información léxica contenida en el mismo. A sí mismo, esta fuente léxica puede ser objeto de estudio para todo investigador que quiera profundizar en el conocimiento del euskara. Una vez llevado a cabo el proceso de preparación del diccionario, nuestro siguiente paso ha sido el desarrolar y aplicar una metodología que permita la obtención de información implícita en los ejemplos de un modo semiatuomático. Como parte indispensable para aplicar la metodología, hemos desarrollado y descrito computacionalmente una parte substancionalmente una parte substancial de la sintaxis vasca. Dicha descripción sintáctica se basa en el formalismo desarrollado en la Universidad de Helsinki: Constraint Grmmar Formalismo, CG (Karlsson, 1995). Basándose en el formalismo sintáctico de las gramáticas de restricciones (CG), hemos desarrollado el campo de la sintaxis paracial o superficail (shallow syntax). Entre las razones más importan