Lietuviškas sinonimų žodynas – tūkstančiai žodžių našlaičių

Publikuota: 2011 m. lapkričio 21 d. pirmadienis

Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas ­– įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?

Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.

Kaip šias užduotis išsprendė sinonimų žodynas?

Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.

Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 proc. atvejų).

Kai sistemos administratorius prisijungia prie valdymo pulto, sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.

Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda sinonimų žodyne.

Tūkstančiai žodžių našlaičių

Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.

Šiuo metu sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.

Kiekvienas sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.

Sinonimų žodyno perspektyva

Kiekvieną dieną sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus – vieną dieną galbūt sinonimų žodyną papildys ir brolis antonimų žodynas.

Šaltinis: technologijos.lt
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

susiję straipsniai

Populiariausi straipsniai

S. Kropas. Laimikiai tik po to, kai pasirūpinsime tinkamais įrankiais

Per pastarąjį dešimtmetį finansinis raštingumas tapo ne tik EBPO, bet ir G20 šalių prioritetinės politikos objektu. skaityti »

Vaizdo žaidimai – daugiau nei vien pramoga: kodėl naudinga žaisti?

Kiekvienas žaidimas gali pasitarnauti ir kaip edukacijos šaltinis, įsitikinusi žaidimų kūrėjų įmonės „SneakyBox“ verslo plėtros vadovė Eglė Čiuoderienė. Pasak specialistės, skirtingi žaidimai padeda ugdyti loginį, kritinį, strateginį mąstymą, lavina atmintį, kūrybiškumą ir dar daugiau. skaityti »

Lietuva kartu su Šveicarija įgyvendino 20 bendrų mokslo projektų

Sėkmingai įvykdyta bendra Lietuvos ir Šveicarijos 2011–2016 m. mokslinių tyrimų programa. Per ketverius metus vykdant šią programą finansuota 20 bendrų mokslo projektų. Tam iš viso skirta 10,649 Šveicarijos frankų. skaityti »

Šią vasarą – dar daugiau nemokamų užsiėmimų mokiniams

Daugiau kaip 200 įvairių įstaigų – mokyklų, profesinio rengimo centrų, bibliotekų – įsijungė į akciją „Atverk duris vasarai“ ir per mokinių atostogas siūlys įdomius nemokamus užsiėmimus vaikams. skaityti »

Projektas „Moksleiviai į Vyriausybę“ kviečia spręsti jaunimo emigracijos problemas

Kol jaunoji Lietuvos karta dar visiškai nepaniro į ilgųjų vasaros atostogų sūkurį, LR Vyriausybės kanceliarija kviečia moksleivius registruotis į rugpjūtį vyksiantį projektą „Moksleiviai į Vyriausybę“, kuris šiemet kvies spręsti jaunimo emigracijos problemas. skaityti »

VU mokslininkai tapo globalaus kosmoso tyrimų projekto dalimi

Iš Žemės į kosmosą vienas po kito kyla mažieji palydovai, skirti Žemės termosferos sluoksniui tyrinėti. Prie šio projekto prisideda ir lietuviai – Vilniaus universiteto (VU) mokslininkai paleis trečiąjį lietuvišką palydovą „Lituanica SAT-2“. skaityti »

Atviros universitetinės studijos internete: patogus būdas tobulėti

Vytauto Didžiojo universiteto Inovatyvių studijų institutas pristatė atviras elektronines studijas, leidžiančias visiems norintiems mokytis atskirų studijų dalykų nuotoliniu būdu. skaityti »

Martyno Mažvydo biblioteka atidaro Laisvalaikio skaityklą

Lietuvos nacionalinės Martyno Mažvydo biblioteka kviečia išsirinkti mėgstamiausią knygą, neštis ją į namus ir skaityti, skaityti, dar kartą skaityti... skaityti »

Paskelbti antrosios nacionalinės teisės žinių olimpiados nugalėtojai

Daugiau kaip 800 moksleivių. Virš 70 Lietuvos mokyklų ir gimnazijų. Tokia įspūdinga antrosios Nacionalinės teisės žinių olimpiados dalyvių statistika, o gegužės 18 dieną Teisingumo ministerijoje iškilmingai apdovanoti ir šių metų renginio nugalėtojai. skaityti »

Beveik 270 elektroninių knygų skaityklių pasieks savivaldybių bibliotekas

Vyriausybė pritarė Kultūros ministerijos siūlymui 268-ias elektroninių knygų skaitykles perduoti savivaldybių nuosavybėn. skaityti »