Epec corpusa predikatu-mailan etiketatzeko oinarriakEPEC-RolSem, BVI ETA e-ROLda

  1. ESTARRONA IBARLOZA, AINARA
Supervised by:
  1. Izaskun Aldezabal Roteta Director

Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 04 September 2014

Committee:
  1. Itziar Laka Mugarza Chair
  2. Arantza Díaz de Ilarraza Sánchez Secretary
  3. Elisabete Pociello Irigoyen Committee member
  4. Elixabete Pérez Gaztelu Committee member
  5. Ricardo Etxepare Committee member

Type: Thesis

Teseo: 117628 DIALNET

Abstract

Tesi-lan hau Hizkuntzaren Prozesamenduaren alorrean kokatzen da. Azkenaldian hain modan dagoen corpus based eta corpus driven linguistic delakoaren barnean sartzen da, eta, zehatzago, corpusetan oinarritutako lexikografian. Hala, EPEC (Euskararen Prozesamendurako Erreferentzia Corpusa) corpuseko aditzak adiera, balentzia eta rol semantikoekin (zenbaitetan, hautapen-murriztapenekin ere) etiketatu, eta izenburuan aipatzen diren oinarriak sortu dira: corpusa bera etiketatua (EPEC-RolSem), aditzen lexikoia PropBank-VerbNet ereduari jarraituta (Basque Verb Index (BVI)), eta, azkenik, horiek kontsultatzeko e-ROLda tresna (http://ixa2.si.ehu.es/e-rolda/bilatu.php).Corpusa etiketatzearen eta lexikoia osatzearen helburu nagusiak erdiesteko, tarteko bestelako ekarpenak ere aurkeztu ditugu, hala nola, corpusa predikatu-mailan etiketatzeko metodologia egokia eta etiketatze-lana aurrera eramateko irizpide argiak dituen eskuliburua.Aditzen etiketatze-lan honek hizkuntzaren hainbat fenomeno aztertzeko aukera eman digu. Alde batetik, ingeleserako sortutako eredu bat erabiltzeak, hizkuntzen arteko aldeak lantzeko bidea eman digu, eta, bestetik, euskarazko aditzen inguruan hainbat fenomeno aztertzeko aukera ere.