• Govorne tehnologije in slovenski jezikovni model
Novice

Laboratorij za podatkovne tehnologije je eden večjih laboratorijev na UL FRI in pokriva raznolika področja. Tokrat bomo predstavili delo članov laboratorija, ki pod vodstvom predstojnika prof. dr. Marka Bajca delujejo na področjih razvoja govornih in jezikovnih tehnologij, analize omrežij ter interneta stvari. Njihovo delo sega od razvoja rešitev za izobraževalni sistem do pametnih mest in inovativnih pristopov v medicini ter pravu. Povezovanje teh znanj pa omogoča izvajanje projektov, ki prinašajo konkretne rešitve za izzive v industriji.


Govorne tehnologije za boljši vsakdan

Velik del laboratorija se ukvarja z razvijanjem raznovrstnih govornih tehnologij, s katerimi poskušajo nasloviti izzive, ki jih prinaša vsakdan, in optimizirati administrativne procese.

V sklopu tega razvijajo projekt Online Notes (ON), sprva imenovan Tolmač, ki bo spremenil način, kako tuji študenti spremljajo predavanja. V sodelovanju z Univerzo v Ljubljani in Centrom za jezikovne vire in tehnologije so razvili sistem za avtomatizirano sprotno prevajanje slovenskih predavanj v tuje jezike. Glavni cilj je olajšati spremljanje predavanj tujim študentom in povečati dostopnost vsebin gluhim in naglušnim študentom. Sistem za avtomatizirano prevajanje prepozna slovenski govor in ga v živo prevede v angleški jezik, kar bo omogočalo spremljanje slovenskih predavanj tudi študentom, ki slovenskega jezika ne razumejo ali zaradi slušnih ovir težje spremljajo predavanja. Študentom bodo prepisi predavanj na voljo tudi prek posebnega portala. V naslednjih mesecih bo projekt vpeljan na petih članicah Univerze v Ljubljani, kar predstavlja pomemben korak k integraciji te novosti v vsakodnevno izobraževalno prakso.

Portal Online Notes

Podoben projekt v obliki spletne aplikacije, ki bo namenjena pomoči gluhim in naglušnim, trenutno znotraj laboratorija razvija študent Martin. Aplikacija bo delovala kot posrednik v medosebnih interakcijah, npr. gluha oseba lahko na banki uslužbencu poda mikrofon in vse povedano se bo v živo izpisalo na ekranu. V prihodnje bo razvita tudi podpora za sintezo odgovora: gluha oziroma naglušna oseba bo lahko na mobilno napravo napisala odgovor, ta pa ga bo »izgovorila« s pomočjo sintetizatorja govora, ki so ga prav tako razvili v laboratoriju. Gre za tehnologijo, ki besedilo spremeni v naravni govor, in je ključna, da lahko naprave pravilno izgovorijo besedilo, npr. navigacijski sistemi, ki nas usmerjajo pri vožnji.

 

Na področju govornih tehnologij razvijajo tudi rešitve za področje medicine. Eden od zanimivejših projektov je razvoj podpore za avtomatizirano pridobivanje anamneze prek pogovora med pacientom in zdravnikom, kar bo povečalo učinkovitost zdravstvenih storitev in zmanjšalo administrativno obremenitev zdravnikov. S področjem medicine se posredno ukvarja tudi mladi raziskovalec Timotej. V okviru doktorske disertacije raziskuje možnosti za avtomatsko ekstrakcijo časovnih relacij iz medicinske dokumentacije. Model v opisu dogajanja prepozna, kateri dogodki so se zgodili pred oziroma po drugih dogodkih. S tem se lahko oblikujejo časovnice celotnega dogajanja na podlagi nestrukturiranih opisov.

 

Razvoj slovenskega jezikovnega modela

Od vstopa velikih jezikovnih modelov v splošno rabo, do česar je prišlo v prejšnjem letu, se veliko govori o potrebi po slovenskem jezikovnem modelu. V LPT delajo tudi na tem, saj so vključeni v veliki raziskovalni projekt PoVeJMo, v okviru katerega bodo, skupaj z drugimi konzorcijskimi partnerji, razvili prvi veliki slovenski jezikovni model ter ga specializirali za različna industrijska podpodročja.

Pametno upravljanje zgradb

Že vrsto let se v LPT ukvarjajo tudi z internetom stvari (IoT), kjer trenutno svoje znanje in izkušnje uspešno prenašajo v prakso pri vzpostavljanju ekosistema za delovanje pametnih mest. Na ravni Evropske unije morajo države zagotoviti učinkovito energetsko upravljanje stavb, kar predstavlja izziv zaradi velikega števila stavb in različnih namembnosti. Na tem področju so v laboratoriju za državo razvili centralno platformo za zbiranje podatkov iz različnih senzorjev, kar je temelj za izvajanje energetskega upravljanja več kot 300 državnih stavb.

 

Interdisciplinarno sodelovanje

LPT daje velik poudarek interdisciplinarnemu sodelovanju z drugimi raziskovalnimi institucijami in gospodarstvom.

Primer tega je sodelovanje z Inštitutom za kriminologijo Pravne fakultete pri razvoju protokolov za dostop raziskovalcev do podatkov posebnih kategorij. Gre za iskanje ravnovesja med zaščito zasebnosti in koristjo javnosti. Raziskovalci ustvarjajo modele, ki bi lahko zaznali razna neskladja med zakoni in predlagali izboljšave, ne da bi razkrili občutljive podatke.

S Fakulteto za družbene vede sodelujejo na področju omrežne znanosti, kjer razvijajo algoritme za analizo velikih kompleksnih omrežij, kot so informacijska, tehnološka in tudi družbena omrežja. Nedavno so zaključili projekt s trgovskim podjetjem, pri katerem so se ukvarjali z napovedovanjem, kaj bodo potrošniki kupili prek spleta in v fizičnih trgovinah.

 

Priložnosti za študente

V Laboratoriju za podatkovne tehnologije ponujajo številne priložnosti za sodelovanje študentov, od sodelovanja na različnih raziskovalnih projektih do mentorstva pri zaključnih nalogah. Študente, ki vas zanima katero izmed omenjenih področij, vabijo, da se oglasite v laboratoriju ali pišete na marko.bajec@fri.uni-lj.si.