• PoVeJMo - Prilagodljiva Obdelava naravnega jezika s pomočjo VElikih Jezikovnih MOdelov
Naročnik: Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost RS ( PoVeJMo )
Tip projekta: Ostali nacionalni projekti
Trajanje projekta: 2023 - 2026
  • Opis

izjemno veliki jezikovni modeli, kot sta ChatGPT in GPT-4, so za nekatere naloge pokazali izjemen

napredek in sprožili plaz razvoja aplikacij umetne inteligence. Žal so zaradi zaprtosti in

netransparentnosti, visokih računskih zahtev in visoke cene prilagoditev nedosegljivi za večino

raziskovalnih organizacij in podjetij. Po drugi strani so se v zadnjem času pojavili bistveno manjši,

odprtodostopni modeli, kot je LLaMA, ki jih je možno naučiti ali prilagoditi za posamezne naloge na

običajnih GPU računalnikih, in dosegajo (skoraj) enako kakovost delovanja.

V projektu bomo razvili več računsko učinkovitih odprtodostopnih velikih jezikovnih modelov.

Zgrajen odprtodostopen model SloLLaMa za slovenščino bo prvi tak model za morfološko bogat jezik

z malo viri. Pripravili bomo korpus za sledenje ukazom, ki bo osnova za nadaljne prilagoditve modela

SloLLaMa specifičnim potrebam aplikacij, na voljo pa bo tudi za širšo akademsko in industrijsko rabo.

V aplikativnih projektih bomo osnovni model SloLLaMa prilagajali na naslednje načine.

1) Za pripravo predstavitvenih gradiv in predstavitve podatkov v muzejski rabi ter za napredne

muzejske interaktivne aplikacije.

2) Za uporabo pri prepoznavanju in sintezi slovenskega govora, kjer bomo z računsko učinkovito

inačico modela SloLLaMa omogočili integracijo govornih tehnologij v napredne industrijske

aplikacije.

3) Za uporabo v medicini, kjer bomo model SloLLaMa prilagodili z medicinskimi besedili in ukazi s

področja klinične in ambulantne rabe.

4) Za uporabo pri generiranju infrastrukturne kode, kjer bomo tehnologije za računsko učinkovite

velike jezikovne modele in razvite cevovode za izgradnjo ukaznih in dialoških učnih množic uporabili

za generiranje opisa računalniške infrastrukture v programski kodi.

Poleg aplikacij bo projekt zgradil še temeljno infrastrukturo za aplikacije umetne inteligence v

slovenščini ter razvil rešitve, ki bodo koristne za druge jezike z malo viri.

  • Logo
Logo