Slovenščina je z vidika razvoja jezikovnih tehnologij jezik, za katerega je na voljo malo digitalnih virov. Zaradi tega sta sodobno raziskovanje s perspektive računalniške znanosti in razvoj produktov, ki temeljijo okrog procesiranja naravnega jezika, bistveno počasnejša kot to velja za jezike z veliko digitalnimi viri. Za ustrezno pridobivanje jezikovnih virov in sekundarno uporabo slednjih v čimbolj naravni obliki, ki zaradi tega lahko vsebujejo tudi nekatere osebne podatke, pa je pomembno interpretiranje Splošne uredbe o varstvu podatkov (GDPR) in izjem prav za raziskovalne namene. Prav tovrstna odstopanja omogočajo doseganje posebnih namenov, na katere se veže tudi pričujoči ciljni raziskovalni projekt, ki bo prvikrat v slovenskem prostoru sistematično naslovil pridobivanje in obdelavo (osebnih) podatkov na način, ki so v interesu znanosti in tako prek apliciranja v obliki pilotnega projekta prispeval k razvoju slednje, kot tudi gospodarstva na podlagi novih spoznanj in praks.
Raziskovalni projekt bo združil, prepletel in poglobil znanje več različnih znanstvenih ved tako z družboslovnega kot tudi naravoslovnega in tehničnega področja ter humanistike. Tovrstno součinkovanje je ključno za zagotovitev, da se napredek v tehnološkem razvoju osmisli ter regulira tako, da se maksimira družbena korist in da se hkrati minimizirajo negativni učinki v obliki posegov v etične in pravne standarde ter človekove pravice. Tak vsestranski pristop je edini način, da koncept odprte znanosti zaživi kar v največji meri.
Ciljni raziskovalni projekt (CRP) financirata Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost RS (ARIS) in Ministrstvo za digitalno preobrazbo.