Korpus, ki zadnje dni v skladu z odločbo pooblaščenke deluje z okrnjeno funkcionalnostjo, je s tem izgubil znaten del uporabnosti za svoje primarne uporabnike, jezikoslovce, literarne znanstvenike in druge profesionalne uporabnike jezika, denimo lektorje. "V trenutni cenzurirani obliki je Nova beseda neuporabna, tako za raziskovanje kot za druga poizvedovanja, saj je nezanemarljiv del besedišča iz osebnih imen. Tudi veliko občih imen je hkrati osebnih, npr. volk, rak, zajec, kos, robida, marjetica, grah, kolar, zidar, kovač ... Če se v iskalnem nizu nahaja katera od njih, se nam med zadetki ne pokaže nič," svoje težave pri uporabi korpusa opisuje literarni zgodovinar Miran Hladnik.

Korpus brez zlih namenov

Obsežni besedilni korpus sestavljajo primarno literarna, znanstvena in medijska besedila, na enem mestu pa so zbrana, da bi raziskovalcem pomagala pri pripravi vseh vrst slovarjev, pravopisa in raziskavah literature. Po veljavni zakonodaji je problematično, da korpus dovoljuje iskanje besedil z vnosom imena in/ali priimka posameznika, s čimer brez ustrezne pravne podlage ustvarja povsem novo zbirko osebnih podatkov. Upravitelju korpusa ne pomaga, da se pri informacijskem pooblaščencu sklicuje med drugim na namen, s katerim je korpus ustvaril. Kot znanstvenoraziskovalni zavod ima zakonsko podlago in pooblastilo, da zbrane osebne podatke obdeluje za zgodovinske, statistične in znanstveno-raziskovalne namene. Korpus pa služi izključno raziskovalnim in izobraževalnim namenom, kakor uporabnika eksplicitno obvešča tudi spletna stran. Informacijska pooblaščenka odgovarja, da bi se morali osebni podatki uporabniku posredovati v anonimizirani obliki, ta pa bi moral rezultate obdelave prav tako objaviti v anonimizirani obliki.

Preberite še komentar Trapast primer Nova beseda

Pooblaščenka priznala pretiravanje

"Proti tako neznansko bedasti odločbi glasno protestiram," pravi Miran Hladnik. Označuje jo za "mračnjaško, paranoično in civilizacijsko destruktivno", saj informiranost zatira, namesto da bi jo spodbujala. Sodeč po odzivih na spletnih forumih prizadeti raziskovalci mnenje delijo. Neživljenjskosti odločbe so se, kot kaže, zavedli tudi v uradu pooblaščenke. Prejšnji teden sta vpleteni strani podpisali izjavo, v kateri beremo, da se inštitut in pooblaščenka strinjata, "da način, na katerega je bila odločba najprej izvršena, ni optimalen z vidika uporabnosti besedilnega korpusa, z vidika varstva osebnih podatkov pa je pretiran". Skupaj iščejo rešitve, ki bi na eni strani ohranile uporabnost in poslanstvo korpusa, na drugi strani pa bi zagotovile varstvo osebnih podatkov.

Kakšna bo rešitev, za zdaj ni znano, poznavalci pa govorijo predvsem o možnosti, da se osebne podatke tako ali drugače anonimizira, kakor to zahteva pooblaščenka. Predstojnik inštituta Marko Snoj podrobnosti o rešitvah še ni bil pripravljen razkriti. "Dokler stvar z informacijsko pooblaščenko ni dorečena, podrobnosti raje ne bi navajal. A prihodnost besedilnega korpusa, v katerega je bilo vloženega več kot desetletje dela, je vsekakor odvisna od tega dogovora," se zaveda. Zadeva za inštitut v nobenem primeru ne bo "brezplačna", saj bo morebitna rešitev, ki bo odgovarjala tudi pooblaščenki, zahtevala dodatno delo in stroške na račun raziskovanja slovenskega jezika.

Bo naslednja na vrsti Fidaplus?

Uporabniki Nove besede so se zbali tudi za usodo primerljivega korpusa slovenskega jezika Fidaplus. Na urad smo zato naslovili vprašanje, ali je obdelava osebnih podatkov tudi v tem primeru v nasprotju z zakonodajo. Pojasnili so nam, da urad v zvezi s Fidaplus še ni vodil nobenega inšpekcijskega postopka, zaradi česar se ne more opredeliti do tega, ali je obdelava osebnih podatkov v okviru navedenega korpusa v skladu z veljavno zakonodajo. Ker Fidaplus prav tako omogoča iskanje po lastnih imenih, je verjetno, da bi bile ugotovitve pooblaščenke glede Fidaplus podobne tistim v odločbi o Novi besedi.

Zanimalo nas je še, kako se primer Nova beseda razlikuje od zbirk osebnih podatkov, kakršne ustvarjajo spletni iskalniki. Kot je pojasnil državni nadzornik za varstvo osebnih podatkov Jože Bogataj, je "bistvena razlika med besedilnim korpusom Nova beseda in spletnimi iskalniki ta, da gre v primeru prej omenjenega besedilnega korpusa za vzpostavitev nove zbirke podatkov, v primeru spletnih iskalnikov pa gre prvenstveno za omogočanje iskanja po podatkih, ki so javno dostopni po spletnih straneh." Pooblaščenka je v primerih, ko je ugotovila, da je s pomočjo spletnih iskalnikov mogoče priti do osebnih podatkov, ukrepala zoper upravljalca spletnih strani, ne pa iskalnikov.