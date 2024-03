Nekoliko presenetljivo se je v zakon vtaknila tudi Komisija za slovenski jezik v javnosti pri SAZU, ki se s svojimi večinoma bombastično in rahlo vzvišeno napisanimi izjavami oglaša o različno pomembnih temah, od venetščine in ženskih oblik do neslovenskega Applovega operacijskega sistema. Tokrat so s precej površno napisano in potencialno ksenofobno izjavo udarili dovolj mimo, da so v javnem pismu, objavljenem v Mladini, dobili odgovor kake stoterice univerzitetnih profesorjev in profesoric s sporočilom, da so zamudili dobro priložnost, da bi bili tiho, saj je oceno o škodi ali dobrobiti izvrševanja manjšinskih pravic bolje prepustiti tistim, ki so pravic deležni.

Prvopodpisana pod predlog spornega zakona sta poslanec Levice Matej Tašner Vatovec in poslanka Gibanja Svoboda Sandra Gazinovski. Za štos sem šel pogledat, kdaj sta bila rojena – ob osamosvojitvi sta bila stara osem oziroma tri leta in prave SFRJ verjetno nista več občutila ali ponotranjila. Če si zamislimo leto 1985 kot neko arbitrarno mejno letnico rojstva, ki pomeni, da ste bili ob osamosvojitvi stari šest let ali manj, danes pa ste stari skoraj štirideset let ali manj, je po statističnih podatkih danes takih postSFRJ državljanov in državljank Slovenije približno polovica. Za drugo polovico, v katero spadam sam, je med drugim značilno, da smo v petem razredu osnovne šole imeli predmet Srbsko hrvatski jezik (tako piše v spričevalu), vendar se tega jezika v šoli nismo naučili kaj dosti, razen da smo se prvič malo bolj sistematično soočili s cirilično pisavo. Po drugi strani se je precej bolj uspešna srbohrvaška jezikovna kopel dogajala ob gledanju televizije, branju stripov ali revij, poslušanju glasbe, ki je prihajala z raznih koncev Jugoslavije, in ob podobnih malo bolj zabavnih obšolskih dejavnostih. Na morju je morda padla vmes še kakšna naključna šund literatura ali celo resna knjiga.

Srbskohrvaške jezikovne variante so nam bile predstavljene kot en jezik, zato nismo znali preveč dobro ločevati med bodočo hrvaščino, srbščino, bosanščino ali črnogorščino. Vsekakor pa smo dalmatinščino zaradi jadranske obale in specifične popularne glasbe dojemali kot nekaj posebnega. Z makedonščino ali albanščino skoraj nismo imeli opravka, razen morda med služenjem vojaškega roka v Jugoslovanski ljudski armadi, kjer so kreatorji kovnice bratstva in enotnosti skupaj zmetali s testosteronom nabite najstnike in dvajsetletnike in se je bilo treba znajti v babilonskem kaosu jezikov in kultur.

Če se prestavimo kaki dve desetletji naprej od leta 1985, se spomnim, kako me je presenetilo, ko sem ugotovil, da se slovenski otroci pri stiku s hrvaškimi, bosanskimi ali srbskimi vrstniki (spet na dopustniškem morju, denimo) avtomatično prestavijo v angleščino, ki je obojim veliko bliže kot sicer soroden, a očitno že premalo razumljiv jezik. Skratka, samoumevno poznavanje jezika BCMS (bosanski-hrvaški-črnogorski-srbski), kot ga radi imenujejo v okoliščinah, ko je treba njegove pluricentrične variante zmašiti skupaj, denimo pri študiju jezika na evropskih ali ameriških univerzah, ni preživelo roka trajanja kraljeve in socialistične Jugoslavije.

Obstaja pa dimenzija, kjer so se ti jeziki zdaj ponovno srečali in se bodo verjetno v prihodnosti srečevali še bolj intenzivno: veliki jezikovni modeli. Kot sem že omenil v eni od kolumn, ima slovenščina težavo z zbiranjem zadostne količine slovenskih besedil za izdelavo velikih jezikovnih modelov. Obstaja pa tudi zdravilo: izkazuje se, da se jezikovni modeli precej dobro učijo iz podobnih podatkov, denimo če jim damo na voljo podatke sorodnih jezikov. Tak pristop so ubrali v Skandinaviji, ko so v švedski model vključili tudi podatke vseh drugih nordijskih jezikov.

Količina podatkov za jezike BCMS je glede na število govorcev verjetno približno desetkrat večja kot za slovenščino in pri učenju slovenskih jezikovnih modelov bo te podatke najbrž mogoče s pridom izkoristiti. Torej – še dobro, da obstajajo. Albanščina, denimo, te možnosti nima. Trenutno že obstaja jezikovni model, naučen s podatki jezikov BCMS, ki ga je eden od razvijalcev z dobro mero humorja poimenoval YugoGPT, in z njim se je mogoče poigrati na spletni strani Yugochat. Tako ali drugače zna priti prav tisti polovici državljanov in državljank Slovenije, ki se z jugočetom še znajo pomeniti. Skratka, vsaj z jezikovnotehnološkega stališča lahko rečemo: dobrodošli nazaj v varnem naročju širše skupine južnoslovanskih jezikov.

