Latvijas Universitātes Matemātikas un informātikas institūta Tīkla risinājumu daļa (NIC) sadarbībā ar Mākslīgā intelekta laboratoriju (AILab) ir izveidojusi pasaulē pirmo domēna vārdu izvēles palīgu, kas, ievērojot latviešu valodas īpatnības, piemeklē izvēlētajam domēna vārdam alternatīvas jeb “domenīmus”.
“Pasaulē jau sen ir pazīstami sinonīmi, antonīmi, homonīmi. Tagad tiem pievienojas arī DOMENĪMI (DOMĒna sinoNĪMI),“ tā ar jaunvārdu iepazīstina Katrīna Sataki, NIC vadītāja.
Bezmaksas rīks “domenimi.lv” apvieno domēna vārdu ģenerēšanu un mākslīgā intelekta iespējas, ar mērķi parādīt, ka latviešu valoda ir bagāta valoda, tādēļ lietotājiem nevajadzētu lieki pārdzīvot, ja reģistrācijai iecerētais vārds ir jau aizņemts. Tā kā tiek veikta vārdu pieejamības pārbaudi reālā laikā, lietotājam tiek piedāvāti tikai brīvie “.LV” domēna vārdi.
Rīks ir interesants ar to, ka izstrādāts, balstoties uz ikdienā lietoto valodu portālos, blogos, digitalizētās daiļliteratūras grāmatās, vārdnīcās un vārdu krājumos. Tieši šo avotu sarunvalodas stilistika ļauj tam izcelties uz citu pasaulē līdzīgu domēna vārdu ģeneratoru fona, un paver daudz plašākas pielietojuma iespējas. “Domenīmi” sniedz unikālu iespēju paraudzīties uz savu uzņēmuma, produkta vai pakalpojuma nosaukumu no cita skatpunkta, ļaujot ikvienam papildus savam radošajam un emocionālajam intelektam talkā ņemt arī mākslīgo intelektu! Piemēram, meklējot domēna vārdus “nauda.lv” vai “bizness.lv”, kuriem šobrīd jau ir savi lietotāji, jūs atradīsiet tādus “domenīmus”, kā, piemēram “piķis.lv”, “peļņa.lv”, “skanošais.lv”, “uzņēmums.lv”, “menedžments.lv”, “uzņēmējs.lv”.
Kodols visam ir vārdu līdzības mērīšanas metode, kura nāk no Tomaša Mikolova popularizētā “word2vec” risinājuma, kas ir pasaulē plaši pielietots arī citās teksta analīzes jomās. Lai to pielietotu, datoram tiek “iemācīta” latviešu valoda, tai raksturīgie locījumi un diakritiskās zīmes. Dators tika “apmācīts” ar tādu tekstu, kādu nu cilvēki internetā lieto. Tā nu tas līdz ar valodu iemācījās arī mūsu asociācijas un stereotipus: ja par kādu produktu vai jēdzienu blogos mēdz tikt lietoti neglaimojoši vārdi, tad rīks “nekautrējas” piedāvāt tieši tos kā adekvātu alternatīvu. Tāpēc viens no grūtākajiem uzdevumiem bija cīņa ar datora “rupjībām”, jo jaunieviestais rīks ir kā spogulis, kurā varam redzēt, kādi esam internetā. Grūtības sagādāja arī atsevišķu vārdu atpazīšana ievadītajā frāzē, jo domēna vārdi mēdz būt arī vairāku vārdu kombinācijas. Tomēr komanda, kas strādāja pie šī interesantā projekta, ir apmierināta ar rezultātu, jo tas uzskatāmi parāda, ka nebūt ne visi labie vārdi ir jau reģistrēti.
Ar mākslīgā intelekta humora izjūtu tagad var paspēlēties ikviens akcijas “#jancīgieDOMENIMI” dalībnieks. Katru nedēļu tie, kam izdosies no mākslīgā intelekta iegūt interesantākos “domenīmus”, tiks pie NIC “spic-balvas”. Projektu atbalsta vairākas “.LV” reģistratūras: “Mozello”, “SigmaNet”, “AmberBit”, “Media Partners” un “Stream Networks”, kas piedāvā savus pakalpojumus iegūto “domenīmu” reģistrēšanai un uzturēšanai.
Dana Ludviga
LU Matemātikas un informātikas institūta
Tīkla risinājuma daļas (NIC)
Sabiedrisko attiecību projektu vadītāja