Projekt bo podprl učitelje, ki popravljajo in ocenjujejo pisne izdelke učencev. Za razvoj pisne zmožnosti je treba pisanje vaditi, več šolskega pisanja pa pomeni tudi več dela za učitelje. Podajanje individualizirane, iterativne, ciljno usmerjen formativne povratne informacije, ki pri opismenjevanju dokazano vodi v najboljše rezultate, zahteva od učiteljev ogromno časa, pa tudi podprtost z ustreznimi opisniki, kazalniki in podatki o sodobni jezikovni rabi v različnih komunikacijskih situacijah. Za opismenjevanje v številnih jezikih, tudi slovenščini, ti pogoji niso zagotovljeni, zato je šolskega pisanja izrazito (pre)malo, povratna informacija pa je tipično usmerjena v odpravo površinskih težav, kot so slovnične napake.
K rešitvi bo projekt prispeval z digitalno podporo učiteljskemu delu, ki na eni strani vključuje strojno identifikacijo in vsebinsko kategorizacijo slovničnih napak, ki učitelje razbremeni rutinskih popravkov in jim zagotovi več časa za višje taksonomske cilje, na drugi pa digitalno zasnovan model za podajanje povratne informacije, ki vključuje empirično podprte kazalnike in opisnike, možnost za sodelovalno pripravo korektivnih učnih gradiv, edvrstniško ocenjevanje in dolgoročno spremljanje napredka.
Strm porast zmogljivosti na področju procesiranja naravnega jezika, strojnega učenja in korpusnega jezikoslovja zagotavlja dosegljivost teh ciljev, o čemer pričajo tudi raznovrstna Digitalna orodja, prototipi, portali, ki trenutno nastajajo v mednarodnem prostoru. Inovativni del projekta, ki zahteva interdisciplinarno sodelovanje, je zasnova rešitev na empiričnih podatkih o realnih učiteljskih praksah in potrebah na eni strani in realni, avtentični sodobni jezikovni rabi na drugi.
V projektu bomo s podatkovnimi luščenji ter analizami napredno označenih besedilnih korpusov zagotovili empirične podatke za razvojne kazalnike in opisnike za različne stopnje šolanja. Te podatke bomo uporabili za pripravo scenarijev povratne jezikoslovne informacije na ravni zapisa in črkovanja, oblikoslovja, besedišča in skladnje. V korpus šolskega pisanja bomo vključili tudi študentsko pisanje in empirično raziskali specifike podajanja povratne informacije na terciarni ravni izobraževanja. Nadalje, razvili bomo šolski situaciji prilagojeni avtomatski označevalnik jezikovnih
težav. Program bomo preizkusili tudi na drugih primerljivih učnih množicah in ga adaptirali v smer večje neodvisnosti za prenos metodologije na druge jezike.
Faze projekta:
1) Korpusne analize pisne produkcije na različnih stopnjah šolanja
Priprava korpusnih podatkov za jezikoslovne in strojne naloge
Priprava pilotskega korpusa študentskih besedil
Kvantitativne in kvalitativne jezikoslovne analize šolskega pisanja
Empirični podatki za razvojne kazalnike na ravni besedišča in skladnje
2) Na praksah temelječ model digitalno podprtega razvoja pisnih kompetenc
Anketna raziskava učiteljskih praks pri razvoju pisnih kompetenc
Snemanje popravljanja šolske produkcije in polstrukturirani intervjuji
Oblikovanje strategije digitalno podprtega razvoja pisnih kompetenc
3) Razvoj in evalvacija strojne identifikacije in kategorizacije jezikovnih težav
Izdelava modela za avtomatsko označevanje napak
Testiranje prenosljivosti metodologije na druge jezike
Jezikoslovna in učiteljska evalvacija avtomatskega označevanja besedil
4) Podajanje povratne informacije v digitalnem okolju
Razvoj modela za povezavo formativnega spremljanja in množičenja
Korpusno osnovani in stopenjski scenariji povratnih informacij
Testiranje povratnih informacij s ciljnimi uporabniškimi skupinami
Bibliografske reference:
Arhar Holdt, Š., Kosem, I., & Gantar, P. (2017). Corpus-based resources for L1 teaching: the case of Slovene. Handbook on digital learning for K-12 schools . Springer. 91-113.
Kosem, I., Stritar Kučuk, M., Može, S., Zwitter VIitez, A., Arhar Holdt, Š., Rozman, T., (2012). Analiza jezikovnih težav učencev: korpusni pristop . Ljubljana: Trojina, zavod za uporabno slovenistiko
Ulčar, M., & Robnik Šikonja, M. (2020a). FinEst BERT and CroSloEngual BERT. International Conference on Text, Speech, and Dialogue (TSD), 104-111.