Ezagutza baseen aberasketa urruneko gainbegiraketaren bidezanalisiak eta hobekuntzak

  1. INTXAURRONDO GONZALEZ DE LANGARIKA, ANDER
Supervised by:
  1. Oier López de Lacalle Lecuona Director
  2. Eneko Agirre Bengoa Director

Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 13 May 2015

Committee:
  1. Arantza Díaz de Ilarraza Sánchez Chair
  2. Basilio Sierra Araujo Secretary
  3. Arkaitz Zubiaga Committee member
  4. Jordi Turmo Committee member
  5. Igor Leturia Azkarate Committee member

Type: Thesis

Teseo: 119294 DIALNET

Abstract

Informazio erauzketa testuetatik informazio egituratua eskuratzean datza. Informazio erauzketasistemak corpusetatik informazio garrantzitsua eskuratzen saiatzen dira, informazioa gizaki etakonputagailuentzat intuitiboa den eran itzuliz. Tesi honetan honen bi azpiatazatan jartzen duguarreta: erlazio erauzketan, entitateen arteko erlazioak antzemateko, eta gertaera erauzketan,testuetan gertaerak antzeman eta hauei buruzko informazio zehatz eta egituratua lortzeko.Urruneko gainbegiraketaren arabera, ezagutza base batek bi entitateren artean erlazio bat dagoelazehazten badu, eta bi entitate hauek esaldi berean agertzen badira, esaldi horrek erlazio horiadieraziko du nola edo hala. Urruneko gainbegiraketan oinarritutako teknika desberdinek benetakotuplen beharra dute aipamen zaratatsuak zuzentzeko, eta geroago teknika gainbegiratu tradizionalakentrenatzeko. Tesi honetan, aipamenetako zarataren iturburuak aztertu ditugu, eta aipamenzaratatsuak filtratzeko metodo desberdinak aztertu. Emaitzek erakusten dute gure heuristikoenkonbinaketak bi oinarri lerro trinko garaitzeko gai dela.Gainera, Twitterretik gertaera konplexuak erauzten dituen gertaera erauzketa sistema bat aurkeztendugu, urruneko gainbegiraketan oinarritutakoa. Ia denbora errealeko datu iturburu honek informaziozehatzgabea eta anbiguoa dakar, ebaluazioan eta erauzketa metodoetan eragina izanik. Ebaluazioerlaxatu bat diseinatu dugu, zeinek ezagutza baseko balioekiko antzekoak diren erauzitako balioeikreditu partziala ematen dien. Printzipio hau ere etiketatze prozesura eraman dugu, antzekoak direnbalioak ere aipamen positibotzat hartuz. Gure ekarpenak positiboki ebaluatzen ditugu lurrikarendomeinu konplexuan, 20 argumentu dituzten gertaerekin. Ezagutza basea, txio garrantzitsuak etaeskuz etiketatutako txioak publikoki eskuragarri daude.