Med vse bolj iskanimi sodelavci v podjetjih, predvsem v večjih korporacijah, je tudi podatkovni rudar. Gre za neke vrste interdisciplinarnega strokovnjaka s področja računalniških znanosti, ki je sposoben urejati ogromne količine digitaliziranih podatkov, ki jih lahko upravlja in v končni fazi segmentira posamezne skupine podatkov glede na potrebe naročnika.

Uporaba tako obdelanih in prefiltriranih podatkov je praktično neizmerna in sega od optimizacije delovnih procesov, povečanja učinkovitosti in profitabilnosti prodaje do učinkovitega iskanja točno določenega besednega, slikovnega gradiva po spletu, napovedovanja najrazličnejših smernic, do napovedovanja vremena ali tečajev na borzi.

Zato nekateri opozarjajo, da je izraz podatkovni rudar celo neprimeren, saj je naloga podatkovnega rudarja, da izmed vseh dostopnih podatkov predvsem izlušči potrebne podatke, in ne preprosto zbiranje podatkov. Zato menijo, da bi bil boljši izraz podatkovni raziskovalec, saj je neke vrste nadgradnja analitika. Raziskovalci, »bralci« (iz) podatkov so pogosto na neki način osebe v samem jedru podjetij, ki verjamejo, da je celoten svet eno samo polje raznolikih podatkov, oni pa znajo med njimi odbirati prave.

Iskanje vezi med vzroki in posledicami

Podatkovno rudarjenje nam omogoča avtomatizirano ali polavtomatizirano iskanje informacij v nepregledni kopici podatkov. Obstaja več metod podatkovnega rudarjenja, ki jih razdelimo lahko na testiranje in statistično analizo ter strojno učenje oziroma machine learning algorithms, kamor sodijo različne metode regresij, klasifikacij, razvrščanja, napovedi in optimizacij, kot so na primer umetne nevronske mreže, kNN, SVN, Markov model, odločitvena drevesa...

Cilj podatkovnega rudarjenja in separacije je najti pravila, vzorce, ki nam omogočijo najti trdnejšo povezavo med vzroki in posledicami. Na primer, napovedovanje nečesa, kar se bo zgodilo v prihodnosti na podlagi množice dejstev, zbranih o tem pojavu, dogajanju iz preteklosti. In prav v tem leži tudi največja past interpretacije, branja in kasneje uporabe tako pridobljenih podatkov ali celo trendov določenih procesov, dogajanj in podobno.

Odpira pa se tudi skorajda filozofsko vprašanje, ali povečevanje vpliva in moči v odločevalskih procesih na različnih ravneh na strani tovrstnih analiz in sklepov ne bo vodilo k dejanskemu določanju, predestinaciji prihodnjih dogodkov.

Ko vam bo vaš računalnik, potem ko ste prejšnji teden pregledovali spletne strani različnih ponudnikov denimo gorskih koles, sam od sebe ponudil različne proizvajalce vetrovk, vedite, da za tem stoji podatkovni rudar, ki redno prebira in interpretira vaša spletna raziskovanja. In vam vnaprej ponudi tisto, za kar morda še ne veste, da nujno potrebujete. Podatki torej postajajo pravo gorivo nove ekonomije in potrošništva, saj lahko s pomočjo dobrega podatkovnega rudarjenja bistveno izboljšamo prodajo in dostop do ciljnih skupin kupcev oziroma uporabnikov.

Sredi ogromne količine brezobličnih podatkov

Za ta poklic pri nas ni posebnega izobraževalnega programa, strokovnjaki pa potrebujejo izjemne sposobnosti navigiranja v oceanu podatkov. Imeti morajo močne kompetence na področju analiziranja in sinteze, sposobni morajo biti prepoznati in določiti strukturo ogromnim količinam brezobličnih podatkov ter jih pripraviti za nadaljnjo analizo in obdelavo, skratka, biti morajo dobro bralno pismeni na področju ogromnih količin podatkov.

Glede na smer študija in izobrazbo je v tem trenutku to poklic, ki je najbližji na primer računalničarjem, analitikom, matematikom, fizikom, elektrotehnikom, strojnikom. Povsem smiselno pa si je v tem poklicu zamisliti tudi na primer šolanega filozofa, ki mu je kibernetični svet domače dvorišče. Kajti ne gre le za strokovno, tehnično znanje, pomemben je način razmišljanja, holističen pristop k reševanju problemov in izzivov.

»Res pa je, da podjetja v vse manjši meri iščejo ljudi po izobrazbi, pač pa predvsem po pridobljenem znanju in razmišljanju, saj moraš prav pri projektih, kjer uporabljaš podatkovno rudarjenje, veliko narediti sam. Luka je na primer sam izdelal ustrezno kodo, da je iz baze več kot dva tisoč projektov na kickstarterju dobil podatke, ki smo jih potrebovali za našo kampanjo,« je pojasnil Martin Mikeln, vodja ekipe Bluejay, ki je nastala pod okriljem podjetja The Kiwi Factory, zadnja dva tedna pa po reorganizaciji deluje samostojno. »Podatkovnega rudarja namreč zanima, kaj je za celotno zgodbo, kaj je razlog in kaj posledica. Zato mora biti zelo zvedav. Analitik na primer tega ne počne, saj samo obdela podatke tako, kot mu naročijo,« poudarja Mikeln.

»Iz baze zajetih podatkov, ki pa je bistveno manjša od baze, ki jo na primer upravlja Facebook ali pa Google, kjer se količina podatkov meri v terabajtih, smo dobili odgovore na vsa naša ključna vprašanja, ki smo jih potrebovali pred začetkom kampanje: kako naj bo videti uspešna kickstarter kampanja, kdaj naj se začne in kako dolga naj bo, kaj potrebuje uporabnik oziroma potencialni podpornik kampanje, kakšen dizajn in barva izdelka bosta prodajno najuspešnejša, kakšna je optimalna cena,« je naštel Luka Perović, ki je študiral na FRI v Ljubljani, a ob tem zatrdil, da je glavnino potrebnega znanja pridobil z delom v projektih. Ob tem je tako kot njegova kolega Slobodan Cvijetić, industrijski oblikovalec, in Martin Mikeln, magistrski študent elektrotehnike, poudaril, da si vsak dan prizadeva naučiti se nekaj novega in da je znanje z drugih področij nujno.

»Tudi mi imamo v svoji ekipi podatkovne rudarje. V osnovi vedno iščemo kadre, ki so sposobni in so se pripravljeni učiti. Med poklici, ki so v vzponu, bi izpostavil DevOpse oziroma razvijalce in vzdrževalce sistemov, kot je openstack. Način razvoja, testiranja, namestitve in vzdrževanja aplikacij se je v zadnjem času bistveno spremenil, zato bo v prihodnje večja potreba po razvijalcih s širokim domenskim znanjem,« med drugim poudarja Gregor Pipan, eden od direktorjev podjetja Xlab.

Vse to samo potrjuje, da je izobraževanje le za določen poklic del minulega, industrijskega sveta in da smo vstopili v drugačne, manj karierno zamejene in z izhodiščno izobrazbo določene poklice.