• BI-IN/22-24-015 - Medjezikovni prenosi znanja za analizo družbenih medijev v jezikih z manj viri v času epidemije COVID-19
Naročnik: Javna agencija za raziskovalno dejavnost RS ( BI-IN/22-24-015 )
Tip projekta: Bilaterarni projekti
Trajanje projekta: 2022 - 2024
  • Opis

Projekt naslavlja izboljšave procesiranja naravnega jezika s pomočjo medjezikovnega prenosa znanja. Na primer, napovedni modeli za odkrivanje sovražnega govora lahko uporabljajo angleščino za učenje, uporabljajo pa se tudi v hindujščini ali slovenščini. Naše dosedanje raziskave so pokazale, da je mogoče s kombiniranjem temeljnih jezikovnih virov iz več jezikov in angleščine ustvariti zelo uspešne medjezikovne modele tudi za jezike z manj jezikovnimi viri. Projekt bo omogočil pridobivanje koristnih informacij iz družbenih medijev, kot je npr. odnos ljudi do epidemioloških ukrepov, političnih situacij in uradnih oseb. Vključitev geolokacijskih metapodatkov v te analize omogoča tudi analizo po posameznih geografskih regijah. Delo bo osredotočeno na tri jezike, angleščino, kot jezik s številnimi jezikovnimi viri, pa tudi hindujščino in slovenščino, kamor bomo prenesli izdelane medjezikovne modele. Razvite temeljne tehnologije bodo izboljšale jezikovne in sociološke analize nestandardne komunikacije v družbenih medijih, koristile pa bodo tudi študijam digitalnih humanističnih ved.