Naslov diplomskega dela: Prilagajanje in vrednotenje jezikovnih modelov pri zamenjavah imenskih entitet za anonimizacijo besedil
Povzetek:
V diplomski nalogi raziskujemo uporabo velikih jezikovnih modelov za psevdonimizacijo imenskih entitet v različnih vrstah besedil z občutljivimi podatki. Osredotočimo se na generiranje ustreznih zamenjav, ki ohranjajo pomen in berljivost besedila brez razkritja osebnih podatkov. Primerjamo več odprtokodnih jezikovnih modelov različnih velikosti in jih vrednotimo z modelom GLiNER. Dodatno poskusimo izboljšati uspešnost dveh manjših modelov s pomočjo nadzorovanega prilagajanja in učenja v kontekstu. Rezultati pokažejo, da nekateri modeli že brez dodatnega prilagajanja uspešno generirajo zamenjave, prilagojeni manjši modeli pa predstavljajo obetavno rešitev za uporabo v okoljih z omejenimi viri.
Mentor: izr. prof. dr. Slavko Žitnik
Somentor: dr. Erik Novak
Komisija za zagovor:
doc. dr. Ciril Bohak (predsednik),
izr. prof. dr. Slavko Žitnik (mentor),
viš. pred. dr. Aljaž Zrnec (član).
Prostor: Diplomska soba