Epec corpusa predikatu-mailan etiketatzeko oinarriakEPEC-RolSem, BVI ETA e-ROLda

  1. ESTARRONA IBARLOZA, AINARA
Dirigée par:
  1. Izaskun Aldezabal Roteta Directrice

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 04 septembre 2014

Jury:
  1. Itziar Laka Mugarza President
  2. Arantza Díaz de Ilarraza Sánchez Secrétaire
  3. Elisabete Pociello Irigoyen Rapporteur
  4. Elixabete Pérez Gaztelu Rapporteur
  5. Ricardo Etxepare Rapporteur

Type: Thèses

Teseo: 117628 DIALNET

Résumé

Tesi-lan hau Hizkuntzaren Prozesamenduaren alorrean kokatzen da. Azkenaldian hain modan dagoen corpus based eta corpus driven linguistic delakoaren barnean sartzen da, eta, zehatzago, corpusetan oinarritutako lexikografian. Hala, EPEC (Euskararen Prozesamendurako Erreferentzia Corpusa) corpuseko aditzak adiera, balentzia eta rol semantikoekin (zenbaitetan, hautapen-murriztapenekin ere) etiketatu, eta izenburuan aipatzen diren oinarriak sortu dira: corpusa bera etiketatua (EPEC-RolSem), aditzen lexikoia PropBank-VerbNet ereduari jarraituta (Basque Verb Index (BVI)), eta, azkenik, horiek kontsultatzeko e-ROLda tresna (http://ixa2.si.ehu.es/e-rolda/bilatu.php).Corpusa etiketatzearen eta lexikoia osatzearen helburu nagusiak erdiesteko, tarteko bestelako ekarpenak ere aurkeztu ditugu, hala nola, corpusa predikatu-mailan etiketatzeko metodologia egokia eta etiketatze-lana aurrera eramateko irizpide argiak dituen eskuliburua.Aditzen etiketatze-lan honek hizkuntzaren hainbat fenomeno aztertzeko aukera eman digu. Alde batetik, ingeleserako sortutako eredu bat erabiltzeak, hizkuntzen arteko aldeak lantzeko bidea eman digu, eta, bestetik, euskarazko aditzen inguruan hainbat fenomeno aztertzeko aukera ere.