Epec corpusa predikatu-mailan etiketatzeko oinarriakEPEC-RolSem, BVI ETA e-ROLda
- ESTARRONA IBARLOZA, AINARA
- Izaskun Aldezabal Roteta Directrice
Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 04 septembre 2014
- Itziar Laka Mugarza President
- Arantza Díaz de Ilarraza Sánchez Secrétaire
- Elisabete Pociello Irigoyen Rapporteur
- Elixabete Pérez Gaztelu Rapporteur
- Ricardo Etxepare Rapporteur
Type: Thèses
Résumé
Tesi-lan hau Hizkuntzaren Prozesamenduaren alorrean kokatzen da. Azkenaldian hain modan dagoen corpus based eta corpus driven linguistic delakoaren barnean sartzen da, eta, zehatzago, corpusetan oinarritutako lexikografian. Hala, EPEC (Euskararen Prozesamendurako Erreferentzia Corpusa) corpuseko aditzak adiera, balentzia eta rol semantikoekin (zenbaitetan, hautapen-murriztapenekin ere) etiketatu, eta izenburuan aipatzen diren oinarriak sortu dira: corpusa bera etiketatua (EPEC-RolSem), aditzen lexikoia PropBank-VerbNet ereduari jarraituta (Basque Verb Index (BVI)), eta, azkenik, horiek kontsultatzeko e-ROLda tresna (http://ixa2.si.ehu.es/e-rolda/bilatu.php).Corpusa etiketatzearen eta lexikoia osatzearen helburu nagusiak erdiesteko, tarteko bestelako ekarpenak ere aurkeztu ditugu, hala nola, corpusa predikatu-mailan etiketatzeko metodologia egokia eta etiketatze-lana aurrera eramateko irizpide argiak dituen eskuliburua.Aditzen etiketatze-lan honek hizkuntzaren hainbat fenomeno aztertzeko aukera eman digu. Alde batetik, ingeleserako sortutako eredu bat erabiltzeak, hizkuntzen arteko aldeak lantzeko bidea eman digu, eta, bestetik, euskarazko aditzen inguruan hainbat fenomeno aztertzeko aukera ere.