Lietuvoje pradeda veikti pirmoji atvira gamtos ir biomedicinos mokslų duomenų saugykla

Lietuvoje netrukus pradės veikti pirmoji atvira gamtos ir biomedicinos mokslų duomenų saugykla, kurioje bus ne tik kaupiami duomenys, bet ir sudarytos sąlygos atkartoti mokslinius tyrimus. Vilniaus universitete (VU) įdiegta 0,5 mln. eurų kainavusi duomenų saugojimo platforma bus atvira mokslininkams, studentams bei įmonėms ir startuolių kūrėjams. Tikimasi, kad ši infrastruktūra ypač pasitarnaus medicinos srityje. Vienas pirmųjų joje vystomų projektų – sprendimas, padėsiantis gydytojams lengviau atpažinti širdies ligas.

Naujoji duomenų saugykla įdiegta VU Duomenų centre, skirtame mašininiam mokymui ir kvantiniams skaičiavimams gamtos ir biomedicinos mokslų srityse. Saugykloje kaupiami įvairūs heterogeniniai duomenys: vaizdai, tekstai, eksperimentų rezultatai ir kita informacija su metaduomenimis, leidžiančiais atsekti jų kilmę ir atlikti paiešką.

Duomenys bus prieinami visiems norintiems pagal FAIR (angl. findable, accessible, interoperable, reusable) principus ir naudojami moksliniams tyrimams, mašininio mokymosi ir dirbtinio intelekto (DI) algoritmams kurti bei testuoti. Toks ir buvo prieš kelerius metus įkurto centro tikslas.

„Duomenų atvėrimas ir apskritai atviras mokslas šiandien tampa įprasta praktika visame pasaulyje, todėl Lietuvai svarbu judėti ta pačia kryptimi. Tai atveria galimybes pažangai medicinos diagnostikos, kristalografijos ir kitose su gyvybės mokslais susijusiose srityse kurti naujas technologijas ir ugdyti jaunąją tyrėjų kartą“, – sako VU Duomenų centro vadovė ir VU Matematikos ir informatikos fakulteto profesorė Jurgita Markevičiūtė.

Pasitelkus skaičiavimo resursus, duomenų centre bus galima visiškai atkartoti anksčiau atliktus tyrimus. Bus galima naudoti tuos pačius duomenis, paleisti savo modelius ir palyginti skirtingų tyrimų rezultatus.

„Tai labai svarbu atvirojo mokslo kontekste, nes leidžia įvertinti, ar tyrimų išvados yra patikimos ir tinkamos taikyti praktikoje. Iki šiol mūsų šalyje nebuvo tai leidžiančios padaryti infrastruktūros“, – kalba centro vadovė. Be to, saugykloje saugomi tiek patys duomenys, tiek jų kopijos, todėl atkartojus tyrimą, sudaromos sąlygos išsaugoti ir naują versiją.

Duomenų saugojimo platformą suprojektavo ir įdiegė technologijų bendrovė „3RTechnology”. Pasak bendrovės vadovo Rėdo Šimelio, projekte buvo naudojama „Dell“ įranga kaip modulinė, ant kurios buvo suprojektuota visa duomenų saugojimo ir skaičiavimo architektūra.

Platformoje integruoti keturi skirtingi serverių modeliai, skirti konkrečioms rolėms. Vienas jų – GPU akseleruotas serveris su keturiais NVIDIA H100 80 GB SXM5 akseleratoriais, naudojamais mašininiam mokymui, dideliems dirbtinio intelekto modeliams ir sudėtingiems skaičiavimams. Platforma paremta atvirojo kodo (angl. open-source) technologijomis ir numatyta taip, kad ateityje galėtų būti plečiama.

„Tai vienas iš nedaugelio tokių kompleksiškų projektų Lietuvoje, kai daugiau nei 1 PB talpos CEPH pagrindu veikianti greitoji saugykla, daugiau nei 1 PB archyvinė saugykla ir GPU akseleruota DI infrastruktūra buvo suprojektuotos kaip viena vientisa sistema”, – paaiškina R. Šimelis.

VU Matematikos ir informatikos fakulteto doktorantas Jonas Mindaugas Rimšelis teigia, kad naujoji duomenų saugykla iš esmės pakeis jo įgyvendinamo projekto, kuris orientuotas į širdies ligų diagnostiką, galimybes.

„Širdies ir kraujagyslių ligos yra viena dažniausių mirties priežasčių Europoje ir vienas iš būdų jas diagnozuoti yra taikant Holterio monitoravimo aparatą. Tačiau šiuo metodu užfiksuojami gana triukšmingi EKG signalai. Mes taikome difuzinius tikimybinius modelius siekdami pašalinti šiuos triukšmus, kad gydytojams būtų lengviau ir tiksliau identifikuoti širdies veiklos sutrikimus”, – tikina J.M. Rimšelis.

Pasak doktoranto, naudodamasis naująja duomenų saugykla jis galės dirbti su didesniais duomenų kiekiais ir užtikrinti, kad jo sukurti modeliai būtų lengvai patikrinami bei pakartojami kitų tyrėjų. Tai suteiks didesnį pasitikėjimą rezultatais ir sudarys sąlygas bendradarbiauti su kitais mokslininkais bei toliau tobulinti sprendimą.

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -