17.
jul
Zagovor diplomskega dela: Nina Kokalj
ob 12:00

Naslov diplomskega dela: Prilagajanje in vrednotenje jezikovnih modelov pri zamenjavah imenskih entitet za anonimizacijo besedil

 

Povzetek:

V diplomski nalogi raziskujemo uporabo velikih jezikovnih modelov za psevdonimizacijo imenskih entitet v različnih vrstah besedil z občutljivimi podatki. Osredotočimo se na generiranje ustreznih zamenjav, ki ohranjajo pomen in berljivost besedila brez razkritja osebnih podatkov. Primerjamo več odprtokodnih jezikovnih modelov različnih velikosti in jih vrednotimo z modelom GLiNER. Dodatno poskusimo izboljšati uspešnost dveh manjših modelov s pomočjo nadzorovanega prilagajanja in učenja v kontekstu. Rezultati pokažejo, da nekateri modeli že brez dodatnega prilagajanja uspešno generirajo zamenjave, prilagojeni manjši modeli pa predstavljajo obetavno rešitev za uporabo v okoljih z omejenimi viri.

 

Mentor: izr. prof. dr. Slavko Žitnik

Somentor: dr. Erik Novak

 

 

Komisija za zagovor:

doc. dr. Ciril Bohak (predsednik),

izr. prof. dr. Slavko Žitnik (mentor),

viš. pred. dr. Aljaž Zrnec (član).

 

Prostor: Diplomska soba