Aditz-azpikategorizazioaren azterketa sintaxi partzialetik sintaxi osorako bidean. 100 aditzen azterketa, Levin-en (1993) lana oinarri hartuta eta metodo automatikoak baliatuz
- Kepa Sarasola Gabiola Director
- Patxi Goenaga Mendizabal Director/a
Universitat de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 01 de d’abril de 2004
- Pello Salaburu Etxeberria President/a
- Igone Zabala Unzalu Secretària
- Xabier Artola Zubillaga Vocal
- Itziar Aduriz Vocal
- Mikel L. Forcada Zubizarreta Vocal
Tipus: Tesi
Resum
En esta tesis se hace una propuesta inicial de las características léxicas necesarias para la definición de la subcategorización de un verbo, tomando como punto de partida el trabajo de Levin (1993), y haciendo uso de métodos automáticos. La finalidad de este trabajo es enriquecer el léxico computacional y ofrecer una buena base para facilitar las diferentes tareas de realizar en otros niveles lingüísticos tales como la sintáxis, la semántica etc; centrándonos concretamente en las siguientes: desambiguación de casos y funciones, desambiguación de estructuras sintácticas, y establecimiento de los límites entre las oraciones. Se ha tomado como punto de partida el trabajo de Levin (1993) por considerarse su metodología la más adecuada para aplicarla desde una perspectiva computacional, ya que parte de las estructuras sintácticas para luego hacer grupos semánticamente coherentes basándose en éstas. Sin embargo, el trabajo de esta autora no carece de problemas. Así, antes las inconsistencias detectadas, se ha establecido un proceso de trabajo propio: se ha definido el concepto de alternancia, se han analizado las alternancias del trabajo de Levin (1993) para el euskera según dicha definición, y como conclusión se ha visto necesario definir lo que hemos denominado valores sintáctico/semánticos (vss) de cada verbo como realización subcategorial. Y para ello hemos realizado un estudio de 100 verbos vascos basándonos en corpus reales. En definitiva, la propuesta inicial que se hace en esta tesis es fruto de la combinación de los tres trabajos: los datos estadísticos proporcinados por las herramientas informáticas, el estudio teórico, y la casuistica y fenomenología encontrada en el trabajo descriptivo del corpus. Junto a ello, proponemos líneas de trabajo aplicables en la estracción de subcaterogrización, así como pautas a seguir en el estudio de más verbos.