14.
maj
Zagovor doktorske disertacije Aleš Papič
ob 14:00 v Velika sejna soba

Naslov doktorske disertacije: Bogatenje pozitivnih in neoznačenih podatkov z generativnimi nasprotniškimi mrežami (Augmentation of positive and unlabeled data using generative adversarial networks)

 

Povzetek: 

V obdobju hitrega tehnološkega napredka generativna umetna inteligenca postopoma postaja del potrošniške elektronike. Ker je ustvarjanje vsebin postalo lažje, hitro naraščanje podatkov prinaša pomembne izzive za obdelavo podatkov, ki se pogosto zanaša na človeško delo. Ta disertacija raziskuje pozitivno in neoznačeno učenje kot strategijo za olajšanje označevanja podatkov. Glavna prednost pozitivnega in neoznačenega učenja je njegova učinkovitost v primerih, ko negativni podatki bodisi niso na voljo ali so preveč raznoliki, da bi jih lahko neposredno označili. S kombiniranjem pozitivnih in neoznačenih podatkov pozitivno in neoznačeno učenje izkoristi vse razpoložljive informacije ter ponuja večjo robustnost in posplošljivost v primerjavi z metodami, ki temeljijo zgolj na pozitivnih podatkih. V tej disertaciji predlagamo novo ogrodje za pogojno generativno pozitivno in neoznačeno učenje (angl. Conditional Generative Positive and Unlabeled, CGenPU), ki nauči binarni klasifikator razlikovati med znanimi pozitivnimi in neznanimi negativnimi primeri. Da bi naučili klasifikator, moramo hkrati naučiti generator, da ustvari pozitivne in negativne učne primere za klasifikator. Ker obstoječe funkcije izgube zahtevajo označene primere iz vseh pomembnih razredov, smo razvili lastno funkcijo izgube, da bi odpravili to omejitev. Natančneje, da bi učinkovito razlikovali med pozitivnimi in negativnimi primeri, uvajamo novo pomožno funkcijo izgube, ki omogoča učenje iz pozitivnih in neoznačenih podatkovnih virov. Pravilnost našega pristopa pokažemo s teoretično analizo. Ogrodje CGenPU uporabljamo za naloge klasifikacije slik z uporabo več referenčnih podatkovnih virov, kot sta MNIST in CIFAR-10. Vrednotenje kaže boljšo zmogljivost pri prepoznavanju števk in klasifikaciji predmetov. Vendar pa šibek nadzor pomožne funkcije izgube nakazuje težave s stabilnostjo in pretiranim prileganjem učnim podatkom. Za reševanje omenjenih pomanjkljivosti predlagamo korak predprocesiranja, ki ga imenujemo pozitivno gosto uteževanje primerov (angl. Positively Dense Example Weighting, PosiDEW), za izračun uteži učnih primerov in jih uporabimo za izboljšanje uravnoteženosti razredov med vzorčenjem učnih paketov. Poleg tega razširimo pomožno funkcijo izgube z regularizacijskim členom, ki prepreči pretirano prileganje podatkom z upočasnitvijo učenja klasifikatorja. Vrednotenje pokaže, da predlagane izboljšave omogočajo ogrodju CGenPU učinkovitejše učenje porazdelitve pozitivnih in negativnih primerov. Poleg tega omenjene izboljšave ne vplivajo negativno na čas učenja, medtem ko znatno izboljšajo klasifikacijsko točnost. Predlagamo tudi nov postopek za detekcijo polipov na slikah za reševanje počasnega in napornega postopka označevanja. Ogrodje CGenPU nauči klasifikator za ustvarjanje segmentacijskih mask polipov, ki so nato nadalje obdelane za določitev lokacij polipov na sliki. Vrednotenje razkrije primerljivo zmogljivost z obstoječimi pristopi, čeprav še ne dosega ravni najsodobnejših tehnik.

 

Prostor zagovora/Termin zagovora: Velika sejna soba, sreda 14. 5. 2025 ob 14:00.

 

Komisija za zagovor doktorske disertacije:

  • izr. prof. dr. Mojca Ciglarič, predsednica
  • prof. dr. Danijel Skočaj, član
  • prof. dr. Mitja Luštrek, član
  • assoc. prof. Ruggero Gaetano Pensa, PhD, član

 

Mentor: prof. dr. Zoran Bosnić

Smoentor: prof. dr. Igor Kononenko

 

Povezava do video kanala, po katerem se bo prenašal zagovor in ga bo možno spremljati, bo dodana najkasneje na dan zagovora (predvidoma 30 minut pred terminom izvedbe zagovora) na spletni strani: https://ucilnica.fri.uni-lj.si/course/view.php?id=359