Sukurtas lietuvių kalbos žodžių semantinio tinklo prototipas

Publikuota: 2012 m. gegužės 21 d. pirmadienis

Lietuvoje baigtas kurti pirmasis lietuvių kalbos žodžių semantinių ryšių tinklo duomenų bazės prototipas. Sukurta bazė galės būti naudojama, kuriant naujas paieškos sistemas, sudarant sinonimų, antonimų, homonimų ar hiponimų žodynus, tobulinant mašininio vertimo sistemas, kurių populiarumas ir poreikis nuolatos auga.

Semantinio tinklo kūrimu rūpinosi kalbinių technologijų plėtojimu užsiimanti bendrovė „Tilde IT“ drauge su partneriais: Lietuvių kalbos institutu (LKI) ir UAB „CID Baltic“. Darbai truko šiek tiek daugiau nei vienus metus.

„Sakoma, kad kalba, kuri neįsitvirtins elektroninėje erdvėje bus pasmerkta išnykti iš kalbų žemėlapio. Mūsų, dirbančiųjų kalbinių technologijų srityje, misija yra pasirūpinti, kad su lietuvių kalba taip neatsitiktų, todėl stengiamės kurti įvairius šiuolaikinius produktus, kurie leistų greitai ir patogiai dirbti kompiuteriu lietuvių kalba“, − sako „Tilde IT“ direktorė Renata Špukienė.

Sukurtas semantinio tinklo prototipas nurodo ir atvaizduoja įvairių lietuvių kalbos žodžių tarpusavio ryšius. Pavyzdžiui, žodis „stalas“ gali būti susietas ne tik su žodžiais „staliukas“ ir „baldas“, bet ir su jį apibūdinančiais žodžiais: medinis, stiklinis, mažas, raudonmedžio, ąžuolinis ir t. t.

Semantinio tinklo duomenų bazės prototipas yra paruoštas tolesniems duomenų integravimo procesams ir praktiniam duomenų panaudojimui. „Artimiausiu metu šį prototipą ketiname panaudoti tobulinant savo sukurtą mašininio vertimo sistemą. Turbūt kiekvienas, kuris nors kartą naudojosi mašininio vertimo sistema, pastebėjo, kad automatiškai verčiant tekstus dažnai susiduriama su žodžių daugiaprasmiškumo problema. Ji gali būti sprendžiama pasitelkiant žodžių semantinių ryšių duomenų bazę, kuri, būdama mašininio vertimo įrankio dalimi, analizuotų visą verčiamo teksto kontekstą ir leistų išvengti įvairių kurioziškų situacijų, kai, pavyzdžiui, kulinariniame tekste žodis „oil“ išverčiamas ne kaip aliejus, o kaip nafta“, − ateities planais dalijasi R. Špukienė.    

Pasak „Tilde IT“ direktorės, svarstomos ir kitos prototipo panaudojimo galimybės. Kadangi „CID Baltic“ yra aktuali semantinė paieška, todėl planuojama drauge kurti tokios paieškos įrankį, kuris ieškotų ne visų, o tik tinkamame kontekste paminėtų raktinių žodžių. Su Lietuvių kalbos institutu „Tilde IT“ planuoja drauge parengti naujus elektroninius žodynus. 

Lietuviškų žodžių semantinių ryšių tinklo duomenų bazės prototipo sukūrimas buvo finansuotas  Europos Sąjungos struktūrinės paramos ir Lietuvos Respublikos lėšomis pagal Ekonomikos augimo veiksmų programos, 2.1 prioriteto „Ūkio konkurencingumui ir ekonomikos augimui skirti moksliniai tyrimai ir technologinė plėtra“ priemonę Intelektas LT. Projekto įgyvendinimui buvo skirta daugiau nei 500 tūkst. Lt Europos Sąjungos paramos. Projektas buvo įgyvendinamas nuo 2011 m. sausio iki 2012 balandžio mėn.

 

Šaltinis: pranešimas spaudai
Kopijuoti, platinti, skelbti bet kokią portalo News.lt informaciją be raštiško redakcijos sutikimo draudžiama.

facebook komentarai

Naujas komentaras


Captcha

Lietuvoje informacinių ir ryšio technologijų plėtra išlieka stabili (170)

Tarptautinės telekomunikacijų sąjungos duomenimis, Lietuva užima 41 vietą pagal informacinių ir ryšio technologijų plėtrą šalyje. skaityti »

Lapkričio 21 d.– Pasaulinė televizijos diena

Pirmoji televizija atsirado dar 1884 m., o kaip ji pasikeitė iki šiol? skaityti »

Vilnius pateko į klestinčių išmaniųjų miestų 100-uką

Švedų IT bendrovė „Easypark“ ištyrė 500 pasaulio miestų, iš kurių atrinko 100, atitinkančių aukštą technologinį lygį pagal žmogaus potencialo plėtros indeksą. skaityti »

Po sunkių traumų ligoniams atsigauti padeda ir virtuali realybė (20)

Virtualiosios realybės technologija nebėra inovacija, skirta vien tik pramogauti, ją įvertino ir medikai. skaityti »

Kas sukūrė pirmąją kompiuterio programą?

Pirmoji programuotoja gyveno laikais, kai kompiuteriai dar net neegzistavo skaityti »

JAV kuriamas dronas, kuris įvykdęs užduotį tiesiog išnyksta

JAV kuriamas dronas, kuris po užduoties įvykdymo tiesiog išnyksta - mokslinei fantastikai prilyginami reikalavimai buvo išpildyti skaityti »

5 neįtikėtinos inovacijos, greitai tapsiančios mums prieinama realybe

Naujausi technologijų gamintojų išradimai kuriami siekiant ne tik palengvinti žmonių kasdienybę, bet ir praturtinti jų gyvenimus. skaityti »

Holografinis kompiuteris „Microsoft HoloLens“ atkeliavo į Lietuvos rinką

Holografinis kompiuteris „Microsoft HoloLens“ nuo šiol tapo prieinamas dar 29 naujose šalyse. Inovatyviu technologiniu įrenginiu nuo šiol galės džiaugtis ir lietuviai. skaityti »

Ar žinote, kam dar naudojamas šviesolaidinis kabelis?

Šiais laikais išgirdęs žodį „šviesolaidis“ arba „optinis kabelis“ iš karto pagalvoji apie internetą. Tačiau, pasirodo, šviesolaidinis kabelis naudojamas ne tik interneto ryšiui užtikrinti. skaityti »

Lietuviai kurs sistemą, užkertančią neteisėtus ir kenkėjiškus bepiločių orlaivių veiksmus

Nepaisant spartaus plėtros tempo, dronai vis dar laikoma nauja technologija, todėl Europos Sąjungos mastu bepiločių orlaivių naudojimas iki šiol nėra vieningai reglamentuotas. skaityti »