Vitjan Zavrtanik je doktorski študent in raziskovalec na področju detekcije anomalij. Kot član Laboratorija za umetne vizualne spoznavne sisteme se ukvarja z raziskavami na področju uporabe naprednih modelov za odkrivanje nenavadnih vzorcev v različnih vrstah podatkov. Na Dnevu FRI 2024 je za svoje raziskovalno delo prejel posebno priznanje za konferenčne prispevke, v katerih je predstavil metode za detekcijo anomalij v 3D podatkih, zvočnih posnetkih ter razvoj novih pristopov za izboljšanje kakovosti proizvodnih procesov.
Z Vitjanom smo se pogovarjali o njegovih izkušnjah z doktorskim študijem in raziskovalnem delu.
Kako je pri tebi dozorela odločitev za doktorski študij?
Po končani drugi stopnji programa na FRI sem pol leta delal v podjetju Amazon v eni izmed njihovih ekip za računalniški vid. To je le še utrdilo moje zanimanje za področje umetne inteligence, ki se je razvilo že med študentskim delom v laboratoriju LUVSS, katerega član sem še vedno.
Kaj je tvoje raziskovalno področje?
Moje glavno raziskovalno področje je detekcija anomalij v različnih vrstah podatkov. To raziskovalno področje je precej široko, saj je odkrivanje vzorcev, ki se v podatkih pojavljajo le redko, torej anomalij, zelo uporabno na področjih, kot so proizvodni procesi, medicina in fizika.
Cilj metod detekcije anomalij je učenje modela, ki opisuje porazdelitev podatkov. Tako je mogoče kakršnakoli odstopanja od te porazdelitve klasificirati kot anomalije. Preprost primer uporabe teh modelov je avtomatsko zagotavljanje kakovosti v proizvodnih procesih. Kamera na proizvodni liniji zajema slike proizvedenih objektov, metoda pa se na podlagi teh slik nauči natančnega modela videza izdelka. Z zaznavanjem odstopanj od tega modela je nato mogoče prepoznati morebitne napake na izdelku.
S čim se trenutno ukvarjaš?
Trenutno se ukvarjam z uporabo velikih multimodalnih modelov za splošno detekcijo anomalij za odkrivanje napak v proizvodnih procesih. Ljudje lahko pogledamo sliko nekega neznanega izdelka in z dokaj veliko gotovostjo zatrdimo ali je ta izdelek poškodovan ali ne, saj smo videli že veliko primerov poškodovanih objektov in objektov v dobrem stanju. Tako lahko zaznamo prisotnost pogostih poškodb kot so praske ali razpoke. Veliki multimodalni modeli se učijo na podlagi ogromne količine slik in njihovih opisov, zato se pri njih pojavlja neko razumevanje stanja objektov. V trenutnem projektu te velike multimodalne modele prilagajamo tako, da bi lahko posnemali to sposobnost ljudi in zaznali napake na izdelkih, katerih slike med učenjem niso bile na voljo.
V letu 2024 si na Dnevu FRI prejel posebno priznanje oz. nagrado za raziskovalno delo za konferenčne prispevke z naslovom Keep draeming: discriminative #D anomaly detection through anomaly simulation, Anomalous sound detection by feature-level anomaly simulation, Cheating depth: enhancing 3D surface anomaly detection via depth simulation. Kaj so najbolj zanimivi zaključki teh prispevkov?
Glavni prispevek teh člankov je demonstracija uporabnosti diskriminativnih modelov detekcije anomalij za zaznavanje anomalij na različnih modalnostih. Diskriminativni modeli se učijo zaznavanja raznolikih umetno ustvarjenih anomalij, nato pa dobro zaznavajo tudi realne anomalije.
V članku ''Keep draeming: discriminative anomaly detection through anomaly simulation'' je predstavljena metoda, ki zaznava anomalije na podatkih 3D posnetkov objektov z uporabo različnih senzorjev. Metoda predstavlja nov način za simuliranja napak na izdelkih za modalnost 3D podatkov, kar je nujno za učenje diskriminativnih metod.
Članek “Cheating depth: enhancing 3D surface anomaly detection via depth simulation” opisuje prilagoditev diskriminativne metode, ki smo jo predstavili na konferenci ECCV2022, za detekcijo anomalij v 3D podatkih.
Članek “Anomalous sound detection by feature-level anomaly simulation” pa predstavi metodo za detekcijo anomalij v zvočnih posnetkih strojev. Na podlagi detekcije anomalij v zvočnih posnetkih strojev lahko namreč napovemo morebitno okvaro in preprečimo nadaljnje težave.
Koliko so rezultati uporabni v praksi?
Rezultati člankov so neposredno prenosljivi v prakso. Detekcija anomalij v 3D se pogosto uporablja kot del avtomatskega zagotavljanja kakovosti na proizvodnih linijah, medtem ko se detekcija anomalij v zvočnih posnetkih uporablja za spremljanje kakovosti strojev v industriji.
Na splošno so rezultati raziskav na področju detekcije anomalij široko uporabni v praksi, saj obstaja veliko problemov, pri katerih je treba odkriti nove, zanimive vzorce, ki odstopajo od normalnosti.
Kaj si želiš početi po študiju?
Področje umetne inteligence gre trenutno čez neke vrste revolucijo, zato zanimivih problemov in posledično tudi zaposlitvenih priložnosti ne manjka.
Kaj bi svetoval vsem, ki se odločajo o nadaljevanju študija na FRI na doktorski ravni?
Svetoval bi, da se vpišejo na doktorsko raven osebe, ki jih področje na katerem bi delali resnično zanima, saj je v svoje raziskovalno delo potrebno vložiti zelo veliko količino dela. To delo pa je bistveno lažje opravljati, če te področje resnično zanima.
Tudi vas zanima raziskovanje? Vabljeni, da se nam pridružite na Informativnem dnevu za doktorski študij Računalništvo in informatika, ki bo v sredo, 2. aprila 2025, ob 16.00 v predavalnici 19, Fakultete za računalništvo in informatiko, Večna pot 113, Ljubljana.