Lietuviškas sinonimų žodynas – tūkstančiai žodžių našlaičių

Publikuota: 2011 m. lapkričio 21 d. pirmadienis

Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas ­– įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?

Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.

Kaip šias užduotis išsprendė sinonimų žodynas?

Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.

Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 proc. atvejų).

Kai sistemos administratorius prisijungia prie valdymo pulto, sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.

Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda sinonimų žodyne.

Tūkstančiai žodžių našlaičių

Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.

Šiuo metu sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.

Kiekvienas sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.

Sinonimų žodyno perspektyva

Kiekvieną dieną sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus – vieną dieną galbūt sinonimų žodyną papildys ir brolis antonimų žodynas.

Šaltinis: technologijos.lt
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Populiariausi straipsniai

Inovatyvūs mokymo metodai: mokytojams pamokose siūlys pasitelkti vaizdo žaidimus

Vaizdo žaidimai gali būti ne tik laisvalaikio praleidimo forma, bet ir puiki mokymosi priemonė. skaityti »

Ateityje nanomedžiagos pakeis daugelį tradicinių medžiagų

Novatorius fizikas S. Tamulevičius teigia, kad ateityje nanomedžiagos pakeis daugelį tradicinių medžiagų, kurių ištekliai gamtoje mažėja. skaityti »

Penkios specialybės, kurių Lietuvos darbdaviai ieško dažniausiai

IT specialistus personalo atrankos ekspertai išskiria kaip pačius geidžiamiausius darbo rinkoje. skaityti »

Mokiniai sprendžia: kas svarbiausia kuriant ateities Europos Sąjungą?

Rusijos agresija, pabėgėlių krizė, teroristiniai išpuoliai – šie klausimai aktualūs ne tik ES politikos ekspertams, bet ir mokiniams. skaityti »

MITA patvirtino finansavimą 16 naujų projektų: bus kuriamos perspektyvios technologijos

Išmani apykaklė, apsauganti nuo nuskendimo, gintaro gaminių klasifikatorius, saulės kolektorius mažaenerginiams pastatams, sveikatos dienoraštis, mobili 12V baterija, antenų sistema nanopalydovams, plataus ruožo radaro prototipas – tai tik keletą inovacijų, kurios Lietuvoje bus vystomos 2018 metais. skaityti »

Skelbiama nauja atranka į programą „Renkuosi mokyti!“

Projektas „Renkuosi mokyti – mokyklų kaitai!“ skelbia naują mokyklų ir „Renkuosi mokyti!“ mokytojų atranką. skaityti »

Planuojama pertvarkyti vaikų socializacijos centrus

Per kelis ateinančius metus planuojama iš esmės pertvarkyti vaikų socializacijos centrus, sukuriant šiuolaikiškas įstaigas, kuriose būtų stiprinami socialiniai vaikų įgūdžiai. skaityti »

Ko galėtume pasimokyti iš Suomijos švietimo sistemos?

Suomijos švietimo sistema yra dažnai pateikiama kaip pavyzdys, kuriuo turėtų sekti kiekviena valstybė. skaityti »

XXI amžiaus švietimo sistema turi remtis kūrybiškumo ir atvirumo nesėkmei idėjomis

Mokyklos šiais laikais turi diegti ne tik konkrečios srities žinias, bet ir kūrybiškumą, plačias pažiūras, smalsumą. skaityti »

Programuotojai – pradinių klasių moksleiviai?

Programavimo specialistai įsitikinę, kad mokyti programavimo vaikus būtų tikslinga jau pradinėse klasėse. skaityti »