• Avtomatizirana zaznava protislovij v slovenskem pravnem jeziku
Novice

Protislovja v zakonodaji in sodni praksi predstavljajo resen problem za pravno varnost, konsistentnost ter zanesljivo interpretacijo prava. Vzpostavitev sistema, ki bi avtomatsko zaznal potencialne protislovne kandidate, zato pomeni pomemben korak k učinkovitejši pravni analizi in razvoju naprednih pravnih informacijskih sistemov.


Veliki jezikovni modeli so že izkazali dobre zmogljivosti pri reševanju takšnih nalog v splošnih domenah. A v kompleksnejših domenah, kjer je pravilna uporaba jezika ključna in zelo specifična, pa se izkaže, da se tudi zelo sposobni modeli izkažejo za nezadostne. To poudarja potrebo po domensko prilagojenih modelih.  

 

V ta namen so v članku Zaznava protislovij v pravnih besedilih: Priprava korpusa in ekstrakcija nasprotij, objavljenem v zborniku Jezikovna dostopnost pravnih besedil: izzivi, metode in izvedba v praksi, Miha Malenšek, prof. dr. Marko Bajec in izr. prof. dr. Slavko Žitnik s Fakultete za računalništvo in informatiko UL skupaj z drugimi soavtorji predstavili največji javno dostopen korpus slovenskega pravnega jezika, ki obsega približno 1 milijardo besednih enot.

 

Korpus zajema celotno slovensko zakonodajo (1991-2025), odločbe Ustavnega sodišča Republike Slovenije, vse javno dostopne odločbe rednih sodišč (spletišče SodnaPraksa) in odločbe ter pravne akte objavljene v Uradnem listu Republike Slovenije. V celoti korpus zajema 547.799 dokumentov, objavljen pa je v repozitoriju CLARIN.

 

Slika: Na grafu so prikazane osnovne značilnosti pravnega korpusa: povprečne dolžine dokumentov ter količinska porazdelitev besed v celotnem korpusu.

 

Na osnovi korpusa so začeli tudi s pripravo slovenskega, pravni domeni prilagojenega jezikovnega modela PravniBERT, ki temelji na arhitekturi ModernBERT, optimizirani za obdelavo daljših besedil. Model trenutno še ni javno dostopen.

 

Več si lahko preberete tukaj:

  • Malenšek, M., Završnik, A., Krajnc, S., Križnar, P., Bajec, M., & Žitnik, S. (2025). Zaznava protislovij v pravnih besedilih: Priprava korpusa in ekstrakcija nasprotij. Slovenščina 2.0: Empirične, Aplikativne in Interdisciplinarne Raziskave13(2), 179-209. https://doi.org/10.4312/slo2.0.2025.2.179-209