• L2-3170 - Računska orodja za odkrivanje prognostičnih markerjev v analizi preživetja
Naročnik: Javna agencija za raziskovalno dejavnost RS ( L2-3170 )
Tip projekta: Raziskovalni projekti ARRS
Trajanje projekta: 2021 - 2024
  • Opis

V projektu bomo oblikovali in razvili interaktivne zbirke orodij za pomoč pri iskanju molekularnih prognostičnih bioloških označevalcev (biomarkerjev) iz molekularnih podatkov in podatkov preživetja, pridobljenih v kliničnih poskusih. Zasnovali bomo računske metode in metode strojnega učenja za iskanje biomarkerjev, jih vključil v interaktivne komponente z grafičnim uporabniškim vmesnikom in zasnovali vizualno programiranje za povezavo teh komponent v cevovode. Razvite metode in zbirka orodij bodo podpirale sodelovanje med podatkovnimi znanstveniki in strokovnjaki s področja razvoja bioloških označevalcev - zdravniki, biomedicinski ali farmacevtski raziskovalci. Z njimi bo možno preiskati podatke o molekularnih odzivih tisočih genov, da bi našli tiste, ki najbolj korelirajo s preživetjem. Predlagano orodje bo dostopalo do obstoječih modelov, ontologij in podatkovnih baz, da bi tako pospešilo interpretacijo in ponudilo polavtomatske razlage rezultatov. To je aplikativni projekt, pri katerem se povezujemo z Genialisom, specializiranim podjetjem za podatkovno znanost na področju k posamezniku usmerjene medicine.

Veda

Tehnika

Letni obseg

1,56 FTE

Sodelujoče raziskovalne organizacije

Genialis d.o.o.

Sestava projektne skupine

Blaž Zupan, Jaka Kokošar, Ela Praznik, Janez Demšar, Vesna Tanko, Marko Toplak

Faze projekta

Vzpostavitev sodelovalnega okolja. Pridobivanje in organizacija podatkov. Razvoj orodij podatkovnega rudarjenja in bioinformatike za odkrivanje prognostičnih biomarkerjev. Oblikovanje grafičnih vmesnikov za raziskovalno analizo podatkov o preživetju in odkrivanje biomarkerjev. Izvedba in integracija. Eksperimentalna validacija produkta. Razširjanje rezultatov.

Bibliografske reference projekta

Demšar J, Zupan B (2021) Hands-on training about overfitting, PLOS Computational Biology 17(3): e1008671.

Poličar PG, Stražar M, Zupan B (2021) Embedding to reference t-SNE space addresses batch effects in single-cell classification, Machine Learning.

Stražar M, Žagar L, Kokošar J, Tanko V, Erjavec A, Poličar P, Starič A, Demšar J, Shaulsky G, Menon V, Lamire A, Parikh A, and Zupan B (2019) scOrange - A Tool for Hands-On Training of Concepts from Single Cell Data Analytics, Bioinformatics 35(14):i4-i12.

Godec P, Pančur M, Ilenič N, Čopar A, Stražar M, Erjavec A, Pretnar A, Demšar J, Starič A, Toplak M, Žagar L, Hartman J, Wang H, Bellazzi R, Petrovič U, Garagna S, Zuccotti M, Park D, Shaulsky G, Zupan B (2019) Democratized image analytics by visual programming through integration of deep models and small-scale machine learning, Nature Communications 10(1):4551.

Štajdohar M, Rosengarten RD, Kokosar J, Jeran L, Blenkus D, Shaulsky G, Zupan B (2017) dictyExpress: a web-based platform for sequence data management and analytics in Dictyostelium and beyond, BMC Bioinformatics 18(1):291.

Financerji

Javna agencija za raziskovalno dejavnost Republike Slovenije