Razpoznavanje obrazov z interpretacijo notranjih mehanizmov modelov

Razpoznavanje obrazov z interpretacijo notranjih mehanizmov modelov

Novice

Odločitve, ki jih sprejemajo sodobni sistemi za prepoznavanje obrazov, so pogosto težko razumljive, kar odpira pomembna vprašanja glede odgovornosti ter skladnosti z regulativami, kot sta GDPR in EU AI Act.

To problematiko obravnava članek FaceMINT: A Library for Gaining Insights into Biometric Face Recognition via Mechanistic Interpretability, pri katerem so med avtorji dr. Peter Rot, Robert Jutreša in prof. dr. Peter Peer iz UL FRI. Članek je objavljen v reviji Image and Vision Computing.

V njem avtorji predstavljajo FaceMINT, prvo odprtokodno knjižnico, namenjeno razumevanju notranjih mehanizmov biometričnih modelov. FaceMINT raziskovalcem omogoča, da na enostaven in modularen način analizirajo, kako globoke nevronske mreže obdelujejo informacije o obrazih, pri čemer uporabljajo tehnike, kot so redki samokodirniki, maksimizacija aktivacij in različne parametrizacije vhodnih slik.

Na dveh vrhunskih modelih za prepoznavanje obrazov – AdaFace (CNN) in SwinFace (transformer) – avtorji pokažejo, da je mogoče pridobiti presenetljivo jasne interpretacije o tem, na katere lastnosti se modeli osredotočajo. Med drugim gre za koncepte, kot so pleša, brada, očala, starostne značilnosti obraza ter stil slike (npr. karikatura).

Raziskava tako predstavlja pomemben korak k bolj transparentnim in zanesljivim biometričnim sistemom ter odpira pot razvoju modelov, ki ne ocenjujejo le podobnosti med obrazi, temveč znajo tudi pojasniti, zakaj določeno odločitev sprejmejo.

Slika: Knjižnica FaceMINT

Več o raziskavi lahko preberete tukaj:

Rot, P., Jutreša, R., Peer, P., Struc, V., Scheirer, W., & Grm, K. (2025). Facemint: A Library for Gaining Insights into Biometric Face Recognition via Mechanistic Interpretability. https://doi.org/10.2139/ssrn.5209216