25.
mar
Zagovor diplomskega dela: Tilen Zelinka
ob 11:30

Naslov diplomskega dela: Vektorske vložitve za prepoznavanje slovenskih glagolskih idiomov

 

Povzetek:

Vektorske vložitve preslikajo besede v visokodimenzionalne vektorje realnih števil, pri čemer imajo besede s podobnimi pomeni podobne vektorje. Preučili smo problem avtomatske prepoznave slovenskih glagolskih idiomov z uporabo značilk, zgrajenih iz vektorskih vložitev skupin besed in vektorskih vložitev posameznih besed. V ta namen smo zgradili dve podatkovni množici, ki vsebujeta primere glagolskih idiomov in naključnih skupin besed, opisanih z zgrajenimi značilkami. Na teh množicah smo ocenili uspešnost klasifikacije glagolskih idiomov z metodo podpornih vektorjev, naključnih gozdov in logistične regresije. Vse tri metode so pri klasifikaciji dokaj uspešne, najbolje se je izkazala metoda naključnih gozdov. Zaradi časovne zahtevnosti in omejitev prepoznave na skupine besed, za katere so znane vektorske vložitve, pa bodo za praktično uporabo potrebne še dodatne izboljšave.

 

Termin zagovora: ponedeljek, 25. marec 2019 ob 11.30

 

Lokacija zagovora: Diplomska soba

 

Mentor: prof. dr. Marko Robnik Šikonja

 

Komisija za zagovor:

prof. dr. Igor Kononenko (predsednik),

prof. dr. Marko Robnik Šikonja (mentor),

doc. dr. Slavko Žitnik (član).