Ezagutza baseen aberasketa urruneko gainbegiraketaren bidezanalisiak eta hobekuntzak

  1. INTXAURRONDO GONZALEZ DE LANGARIKA, ANDER
Dirigida per:
  1. Oier López de Lacalle Lecuona Director/a
  2. Eneko Agirre Bengoa Director

Universitat de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 13 de de maig de 2015

Tribunal:
  1. Arantza Díaz de Ilarraza Sánchez Presidenta
  2. Basilio Sierra Araujo Secretari
  3. Arkaitz Zubiaga Vocal
  4. Jordi Turmo Vocal
  5. Igor Leturia Azkarate Vocal

Tipus: Tesi

Teseo: 119294 DIALNET

Resum

Informazio erauzketa testuetatik informazio egituratua eskuratzean datza. Informazio erauzketasistemak corpusetatik informazio garrantzitsua eskuratzen saiatzen dira, informazioa gizaki etakonputagailuentzat intuitiboa den eran itzuliz. Tesi honetan honen bi azpiatazatan jartzen duguarreta: erlazio erauzketan, entitateen arteko erlazioak antzemateko, eta gertaera erauzketan,testuetan gertaerak antzeman eta hauei buruzko informazio zehatz eta egituratua lortzeko.Urruneko gainbegiraketaren arabera, ezagutza base batek bi entitateren artean erlazio bat dagoelazehazten badu, eta bi entitate hauek esaldi berean agertzen badira, esaldi horrek erlazio horiadieraziko du nola edo hala. Urruneko gainbegiraketan oinarritutako teknika desberdinek benetakotuplen beharra dute aipamen zaratatsuak zuzentzeko, eta geroago teknika gainbegiratu tradizionalakentrenatzeko. Tesi honetan, aipamenetako zarataren iturburuak aztertu ditugu, eta aipamenzaratatsuak filtratzeko metodo desberdinak aztertu. Emaitzek erakusten dute gure heuristikoenkonbinaketak bi oinarri lerro trinko garaitzeko gai dela.Gainera, Twitterretik gertaera konplexuak erauzten dituen gertaera erauzketa sistema bat aurkeztendugu, urruneko gainbegiraketan oinarritutakoa. Ia denbora errealeko datu iturburu honek informaziozehatzgabea eta anbiguoa dakar, ebaluazioan eta erauzketa metodoetan eragina izanik. Ebaluazioerlaxatu bat diseinatu dugu, zeinek ezagutza baseko balioekiko antzekoak diren erauzitako balioeikreditu partziala ematen dien. Printzipio hau ere etiketatze prozesura eraman dugu, antzekoak direnbalioak ere aipamen positibotzat hartuz. Gure ekarpenak positiboki ebaluatzen ditugu lurrikarendomeinu konplexuan, 20 argumentu dituzten gertaerekin. Ezagutza basea, txio garrantzitsuak etaeskuz etiketatutako txioak publikoki eskuragarri daude.