Duomenys – XXI amžiaus energetinė žaliava. Tačiau tam, kad jie virstų kuru sėkmingų inovacijų varikliui, būtinas tinkamas ir efektyvus jų surinkimas, apdorojimas ir panaudojimas. Visgi šiuose procesuose šiandien iškyla ne vienas iššūkis.
Šiais laikais virtualioje erdvėje ar įmonių elektroninių duomenų talpyklose sukaupti duomenų kiekiai išties milžiniški ir jie nuolatos auga. Didelės apimties duomenys ir jų analizė – labai svarbus šaltinis tiek valstybinėms, tiek privačioms įmonėms. Duomenimis grindžiamos inovacijos yra vienas iš pagrindinių rinkos augimo ir naujų technologijų plėtojimo veiksnių. Ne veltui šiemet patvirtinta Europos duomenų strategija siekiama, kad Europos Sąjunga (ES) taptų duomenimis grindžiamos visuomenės lydere.
Tobulėjant technologijoms ir analizės metodams organizacijos dabar gali realiuoju laiku sekti ir analizuoti duomenis iš įvairiausių šaltinių ir atitinkamai pritaikyti juos įvairiuose verslo procesuose. Tačiau kokios tendencijos labiausiai tikėtinos šioje srityje artimiausiu metu, pramonei vis labiau žengiant į dirbtinio intelekto amžių?
1. Dirbtinis intelektas žmogaus dar nepakeis
Pasak Kauno technologijos universiteto (KTU) Matematikos ir gamtos mokslų fakulteto (MGMF) Taikomosios matematikos katedros vedėjo Kęstučio Lukšio, pastaruoju metu tendencijos išlieka pastovios – vis daugiau dėmesio sulaukia dirbtinis intelektas (DI) ir mašininis mokymasis. Tačiau šios technologijos neturi pakeisti žmonių. Priešingai – jos turi padėti atlikti darbus greičiau, lengviau, geriau.
„Automatizuodami rutininius darbus, galime daugiau laiko skirti kūrybiškumui, naujų idėjų generavimui ir įgyvendinimui, be abejo, pasitelkiant ir šiuolaikines technologijas. Kompiuteriui visos idėjos yra geros ir visi sprendimai tinkami, todėl duomenų mokslininkai ir duomenų inžinieriai užtikrina, kad būtų siekiama norimo veiklos rezultato efektyviausiu įmanomu būdu“, – teigia K. Lukšys.
Taip pat sparčiai vystoma paaiškinamo dirbtinio intelekto (angl. explainable artificial intelligence) sritis, kuomet siekiama sudaryti tokius modelius, kurių veikimą suprastų ir žmogus.
„Be to, standartinių duomenų paruošimo ir analitikos veiksmų automatizavimas (papildyta analitika) leis platesniam verslo atstovų ir sprendimų priėmėjų ratui taikyti pažangius analitikos metodus, tačiau reikalaus ir didesnio duomenų inžinierių įsitraukimo užtikrinant duomenų prieinamumą ir kokybę“, – sako KTU MGFM lektorius.
2. Duomenų specialistų paklausa ir toliau augs
Numatoma, kad ES bendrojo vidaus produkto dalis, sukurta Europos duomenų rinkos, augs nuo 2,8 proc. 2019 m. iki daugiau kaip 4,2 proc. 2025 m. Didėjantis dėmesys duomenims ir augančios investicijos stiprina šią rinką, todėl didėja ir duomenų specialistų poreikis. Per pastaruosius 5 metus darbuotojų skaičius Europos duomenų rinkoje padidėjo 69 proc. Skaičiuojama, kad šiuo metu dar trūksta daugiau kaip 400 tūkst. duomenų specialistų, o ateities prognozės rodo, kad iki 2025 m. šių specialistų poreikis padidės daugiau nei 50 proc.
„Apklausos rodo, kad dauguma duomenų mokslininkų dabartinėse darbovietėse dirba ne ilgiau kaip metus. Tai reiškia, kad didelis specialistų poreikis skatina ir didelę darbuotojų kaitą, nes paklausūs specialistai nesunkiai gali susirasti naują darbo vietą ir pasirinkti ne tik didesnį darbo užmokestį, bet ir palankesnes darbo sąlygas“, – tikina K. Lukšys.
Lietuvoje duomenų specialistų poreikis taip pat ženkliai didėja. Ekonominio bendradarbiavimo ir plėtros organizacija (EBPO) prognozuoja, kad netolimoje ateityje dirbtinis intelektas palengvins atliekamas kasdienines funkcijas beveik 70 proc. visų darbų Lietuvoje.
Šiuo metu Lietuvos darbo rinkoje jau yra specialistų, gerai išmanančių matematikos ir informatikos dalykus. Tačiau stokojama specialistų, pasižyminčių analitinėmis žiniomis ir įgūdžiais bei gebančių siūlomus sprendimus diegti ir automatizuoti informacinėse sistemose, užtikrinant jų patikimumą, operatyvumą ir suderinamumą su verslo procesais.
„Universalūs duomenų specialistai, turintys duomenų inžinerijos ir duomenų mokslo įgūdžių, galintys savarankiškai valdyti visą informacinę sistemą bei efektyviai integruoti išmanias duomenų valdymo ir sprendimų priėmimo technologijas, yra puikus pasirinkimas smulkaus ir vidutinio verslo įmonėms, – pastebi KTU MGMF lektorius. – Didžiosiose įmonėse universalūs specialistai palengvina komunikavimą tarp analitikos ir informacinių technologijų skyrių“.
3. Keisis duomenų mokslininkų darbo specifika
Tradiciškai duomenų surinkimu užsiima specialistai, kurie savo darbą atlieka labai gerai ir efektyviai. Tačiau jų tikslas – tik surinkti, išsaugoti ir apsaugoti duomenis. Kiti specialistai užsiima duomenų analize, siekdami paversti surinktus duomenis naudingais.
„Čia prasideda rutininė duomenų mokslininko darbo dalis – remiantis apklausomis, duomenų mokslininkai iki 80 proc. laiko skiria duomenų paruošimui“, – tikina K. Lukšys.
Tačiau tai jau stengiamasi pakeisti. KTU naujos studijų programos Duomenų mokslas ir inžinerija programos absolventai, anot K. Lukšio, turėdami ir duomenų mokslo, ir duomenų inžinerijos įgūdžių, suprasdami ir planuodami kur, kodėl ir kada reikės atitinkamos informacijos, gebės kurti duomenų valdymo sistemas, kuriose šis paruošimo laikas galės būti sutrumpintas bent per pusę.
„Tokiu atveju bus galima daugiau laiko skirti duomenų analitikai, pažangių modelių kūrimui bei efektyvesniems ir tikslesniems savalaikiams sprendimams“, – sako K. Lukšys, studijų programos Duomenų mokslas ir inžinerija vadovas.
Duomenų mokslas ir inžinerija – pirmoji Lietuvoje tarpkryptė pirmos pakopos studijų programa, apjungianti taikomosios matematikos ir informacijos sistemų kryptis. Programa suteiks matematikos ir informatikos mokslų žinių bei išugdys gebėjimus jas taikyti tvarkant ir analizuojant duomenis informacijos sistemose.
„Ši programa orientuota į duomenų mokslo ir duomenų inžinerijos metodų taikymą įmonių informacinėse sistemose. Absolventai gebės valdyti visą duomenų gyvavimo ciklą: dirbti su įvairioje veikloje generuojamais duomenų masyvais pradedant nuo jų surinkimo, perdavimo, kaupimo bei valdymo iki pažangių matematinių metodų taikymo juos analizuojant, kuriant modelius, orientuotus į veiklos sprendimų priėmimą, bei šių metodų diegimo informacinėse sistemose“, – teigia K. Lukšys.
4. Reikalingas platus kompetencijų portfelis
Duomenų mokslininkai ir inžinieriai turi būti universalūs specialistai, kurie be analitinių ir inžinerinių žinių turi ir gerą nagrinėjamos veiklos supratimą.
„Be abejo, reikia turėti gerus matematikos ir statistikos įgūdžius, išmanyti mašininio mokymosi, modeliavimo, optimizavimo metodus bei mokėti programuoti ir naudotis įvairias paketais, tokiais kaip „Python“, „R“, „SAS“, taip suprasti duomenų bazes, tiek klasikines reliacines (SQL), tiek pažangias išskirstytas (NoSQL) duomenų bazes.
Itin reikalingi ir komunikavimo bei vizualizavimo įgūdžiai, kad būtų teisingai suprasta nagrinėjama problema, tinkamai perduoti gauti rezultatai bei sudaromos prielaidos duomenimis paremtas įžvalgas paversti sprendimais ir veiksmais“, – pastebi K. Lukšys, pridurdamas, kad viso to bus mokomi ir naujosios KTU MGMF programos studentai.
Nuolatos besikeičiant technologijoms, duomenų mokslininkai ir inžinieriai turi gebėti greitai jas įsisavinti. Todėl, KTU MGMF lektoriaus teigimu, mokėjimas dirbti vienu konkrečiu įrankiu jau nebėra toks svarbus: „Vis svarbesnis taps gebėjimas pasirinkti ir įsisavinti tinkamus įrankius turimai problemai spręsti“.
Informacinių sistemų, duomenų inžinerijos ir duomenų mokslo įgūdžių sinergijos reikalauja ne tik vis augantys duomenų masyvai, bet ir vis ryškėjančios tendencijos, susijusios su išmaniaisiais duomenimis (angl. smart data) ar mažaisiais duomenimis (angl. little data).
„Vien tik duomenų mokslo metodų efektyviam darbui užtikrinti nebepakanka. Reikalingos žinios ir gebėjimai, kurie padėtų besikaupiančius didelius duomenų kiekius paversti naudingais duomenimis jau informacinių sistemų lygmenyje, taip sumažinant kaupiamų duomenų kiekius ir tikslingai panaudojant svarbiausią informaciją“, – tikina K. Lukšys.
5. Ir toliau kils kibernetinio saugumo ir teisiniai iššūkiai
Šiandien organizacijoms vis dar kyla daugybė kibernetinio saugumo iššūkių. Tikėtina, kad tai yra būtent tas aspektas, kuris dirbant su duomenimis išliks ilgiau nei norėtume. Kadangi didieji duomenys tampa vis pelningesniu šaltiniu, bet kokio dydžio įmonės turės ieškoti patikimų kibernetinio saugumo programinės įrangos sprendimų ir investuoti į juos, kad apsaugotų vertingą verslo informaciją nuo kibernetinių grėsmių.
„Teisiniai ir etiniai klausimai taip pat išliks aktualūs – prie jų sprendimo turės prisidėti auganti duomenų mokslininkų bendruomenė“, – teigia K. Lukšys.
Kuriant naujus modelius ar informacines sistemas, šios profesijos atstovas turi gebėti vertinti atitikimą bendrojo duomenų apsaugos reglamento (BDAR) normoms, t. y. atliepiant šiuos reikalavimus, atitinkamai vykdyti informacinių sistemų specifikavimą, projektavimą ir jų plėtros projektų sudarymą. Diegiami dirbtinio intelekto modeliai turi atitikti ir apibrėžtas algoritminės etikos normas – skaidrumą, visų poreikių įtraukimą, šalių atsakomybę, nešališkumą, patikimumą, saugumą ir privatumo užtikrinimą.
6. Vis aktualesnė – blokų grandinių analitika
KTU MGMF lektoriaus teigimu, verta atkreipti dėmesį ir į blokų (angl. blockchain) analitiką. Pačios blokų grandinės, anot jo, šiomis dienomis minimos labai dažnai, bet kol kas jų platesnis pritaikymas apsiriboja daugiausiai kriptovaliutomis.
„Nepaisant to, technologija yra labai perspektyvi ir ateityje matysime vis daugiau produktų paremtų blokų grandinėmis. Dėl pačių grandinių atvirumo atsiranda naujos galimybės tyrinėti fiksuojamus procesus ir ryšius“, – sako K. Lukšys.
Blokų grandinės yra unikalus duomenų šaltinis ir suteikia galimybes analizuoti tiek statinę praeities informaciją, tiek ir realiu laiku vykstančius sandorius ar veiksmus. Čia jau vystomos kovos su sukčiavimu ir pinigų plovimu priemonės, taip pat analizuojamos ir tinklinės struktūros atsirandančios tarp bendraujančių šalių.