Naslov diplomskega dela: Generiranje osnutkov novic iz javno dostopnih spletnih podatkov
Povzetek:
Cilj diplomske naloge je bil razviti sistem za avtomatizirano generiranje osnutkov novinarskih novic na podlagi javno dostopnih podatkov. Za dosego tega cilja so bile uporabljene metode spletnega strganja, kar je prikazano na primeru podatkov o brezposelnosti Zavoda za zaposlovanje Republike Slovenije in o nogometnih tekmah s spletne strani SofaScore.
Podatki so bili obdelani s tehnikami za čiščenje in transformacijo podatkov, nato pa so bili uporabljeni za generiranje osnutka v naravnem jeziku s pomočjo modela GPT-3.5-turbo iz knjižnice OpenAI. Osnutki novic so bili analizirani s pomočjo več metrik berljivosti kot so Flesch Reading Ease, Gunning Fog Index, Automated Readability Index, Läsbarhets Index,
Type-Token Ratio, analiza sentimenta VADER in leksikalna gostota. Poleg tega so bile pridobljene povratne informacije s strani Slovenske tiskovne agencije (STA), ki je prepoznala potencial sistema za uporabo v novinarskem delu. Sistem je bil razvit z uporabo programskega jezika Python in več knjižnic kot so Selenium WebDriver, Requests in xlrd. Rezultati so pokazali, da je avtomatizirano generiranje osnutkov novic možno in učinkovito,
ker lahko prihrani veliko časa novinarjem in zagotovi visoko stopnjo natančnosti ter razumljivosti besedil.
Mentor: viš. pred. dr. Igor Rožanc
Komisija za zagovor:
doc. dr. Luka Fürst (predsednik),
viš. pred. dr. Igor Rožanc (mentor),
doc. dr. Uroš Čibej (član).
Prostor: Predavalnica 19