Lietuviškas sinonimų žodynas – tūkstančiai žodžių našlaičių

Publikuota: 2011 m. lapkričio 21 d. pirmadienis

Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas ­– įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?

Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.

Kaip šias užduotis išsprendė sinonimų žodynas?

Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.

Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 proc. atvejų).

Kai sistemos administratorius prisijungia prie valdymo pulto, sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.

Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda sinonimų žodyne.

Tūkstančiai žodžių našlaičių

Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.

Šiuo metu sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.

Kiekvienas sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.

Sinonimų žodyno perspektyva

Kiekvieną dieną sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus – vieną dieną galbūt sinonimų žodyną papildys ir brolis antonimų žodynas.

Šaltinis: technologijos.lt
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Populiariausi straipsniai

Šiuolaikinio mokslininko portretas: griūvantys stereotipai ir galia nulemti ateitį

Šiuolaikinis mokslininkas, norėdamas sėkmingai konkuruoti savo srityje, privalo būti kūrybiškas, socialus ir nuolat ieškoti savo veiklos realizavimo galimybių. skaityti »

Tarp 50 geriausių regiono universitetų – dvi Lietuvos aukštosios mokyklos

Vėlyvą pirmadienio vakarą tarptautinio universitetų reitingo „QS World University Rankings“ sudarytojai paskelbė „Emerging Europe and Central Asia 2018“ universitetų reitingą. skaityti »

Robotai ir virtuali realybė: galimybės ar pavojus mokytojo profesijai?

Prognozuojama, kad jau netolimoje ateityje mokymosi procesas stipriai pasikeis, mat pedagogų vietą mokyklose žada pakeisti ne kas kitas, o robotai. skaityti »

Metų knygos rinkimai: skelbiami išskirtiniausių kūrinių penketukai

Akcija „Metų knygos rinkimai“ jau 13 kartą kviečia skaitytojus rinkti labiausiai patikusias lietuvių autorių knygas. skaityti »

Šiuolaikinis švietimas: kaip vaikus ugdo inovatyvios pasaulio mokyklos?

Kaip turėtų atrodyti šiuolaikinė mokykla? Pasidairius po pasaulį panašu, kad mokyklose nuo tradicinių mokymosi įrankių, tokių kaip knyga ir sąsiuvinis, pereinama prie skaitmeninių mokymosi metodų. skaityti »

Ar Lietuvoje vyrai dirba pradinukų mokytojais?

Neįprastą pradinio ugdymo specialybę pasirinkęs vaikinas šiemet mokys pirmaklasius mokslo paslapčių. skaityti »

Lietuvoje kuriamas pirmasis Baltijos regione informacinių technologijų kompetencijų centras

IKT kompetencijų centre, kuris vienys lietuvių ir švedų tyrėjus ir institucijas bus vystomos inovacijos daiktų interneto kibernetinio saugumo, sveikatos technologijų srityje. skaityti »

Kokios savybės padės neužleisti vietos robotui?

Retas įsivaizduojame savo darbo dieną be kompiuterio ar išmanaus telefono, tačiau ateityje technologijų įtaka didės dar labiau. skaityti »

Lietuvos vaikų finansinis raštingumas žemas

Nors finansinis raštingumas padeda užtikrinti sėkmingą ekonominį gyvenimą, tyrimų rezultatai rodo, jog Lietuvoje vaikų ir paauglių iki 15 m. finansinio raštingumo lygis yra gerokai žemesnis nei kitose šalyse. skaityti »

Gabiems magistrantams iš užsienio – parama studijoms Lietuvoje

Siekiant didinti studijų tarptautiškumą ir pritraukti į Lietuvą studijuoti gabius jaunuolius iš užsienio, valstybė skiria paramą užsieniečių magistrantūros studijoms. skaityti »