Proveržis internete: lietuviškai kalbančio kompiuterio neatskirsite nuo žmogaus

Ignas Petrikonis

2021-03-19, 15:40 (atnaujinta 2021-05-13, 17:12)

0 komentarų
Proveržis internete: lietuviškai kalbančio kompiuterio neatskirsite nuo žmogaus

Internete neseniai atsirado naujas balsas – bet kokį lietuvišką tekstą jau dabar galima išgirsti perskaitytą sklandžia, natūraliai skambančia lietuvių kalba. Tačiau šis balsas yra ne žmogaus, o kompiuterio, kuris tekstus perskaito automatiškai. Pasitelkiant neuroninius tinklus ir kalbos technologijas, Vytauto Didžiojo universiteto (VDU) mokslininkai išvystė šnekos sintezės technologiją, kuri ne tik jau dabar yra taikoma universiteto tinklalapyje ir šalies naujienų portaluose, bet ir netrukus bus įdiegta Seimo interneto svetainėje.

Pasak šių technologijų vystymo projekto vadovo, VDU Informatikos fakulteto docento dr. Dariaus Amilevičiaus, universiteto informatikai ir humanitarai jau daug metų bendromis pastangomis vystė šnekos sintezės prototipą ir jam reikalingus papildomus sprendimus, pavyzdžiui, automatinį kirčiuoklį. Tačiau iki šiol nebuvo deramų sąlygų, rinkos poreikio ir finansavimo tam, kad šį technologinį sprendimą būtų galima paversti išbaigtu, tinkamu komerciniam taikymui.

„Panaudodami pažangiausias technologijas, projekte šį prototipą perkėlėme į naują lygmenį: suteikėme neuroninį balsą, kurio natūralumas jau mažai skiriasi nuo žmogaus. Šiuo metu kuriamas antrasis neuroninis balsas, tobulinamas santrumpų ir skaitmenų pavertimas tekstu. Planuojama įdiegti ir nelietuviškos rašybos žodžių sintezės metodus“, – vykdomus darbus pristato doc. dr. D. Amilevičius.

Lietuvių kalba – itin sudėtinga

Vieno iš pagrindinių šios technologijos kūrėjų, VDU Informatikos fakulteto profesoriaus Gailiaus Raškinio teigimu, vystant kalbos technologijas teko susidurti su įvairiais iššūkiais. Pastaruoju metu, žinoma, darbą apsunkino karantino sąlygos, kadangi reikėjo padaryti nemažai garso įrašų, o tai nebuvo paprasta dėl judėjimo ribojimų ir uždarytų patalpų. Tačiau ne ką mažesnis iššūkis buvo ir pačios kalbos kaip fenomeno sudėtingumas – ypač lietuvių.

„Bandant aprašyti kalbos reiškinius taisyklėmis, susiduriama su daugybe išimčių. Pavyzdžiui, tekste rašoma „Caritas“, bet tariama „Karitas“. Arba – trumpinys „gen.“ vienoje vietoje gali reikšti „generolas“, o kitoje – „generalinis“ ir taip toliau. Tai tik kalbinių problemų ledkalnio viršūnė“, – pasakoja VDU mokslininkas, papildydamas, jog nemažas iššūkis buvo ir didelių skaičiavimo pajėgumų, galingos kompiuterinės technikos poreikis, būdingas taikant giliojo mokymo technologijas. Pavyzdžiui, kai kurie giliojo mokymo eksperimentams reikalingi skaičiavimai trunka ne dieną ar dvi, o visą savaitę, 24 valandas per parą.

Nuo žmogaus pečių nuima rutininius darbus

Kalbos technologijas specialistai vysto naujame projekte, kurį Vytauto Didžiojo universitetas vykdo drauge su universiteto atžaline įmone „Intelektika“. Čia vystomos dvi pagrindinės technologijos: ne tik jau minėta šnekos sintezė, kai tekstas yra paverčiamas balsu, bet ir priešingas procesas – kalbos automatinis užrašymas tekstu. Doc. dr. D. Amilevičius pabrėžia, kad šios technologijos nuo žmogaus pečių nuima daug rutininių darbų, leidžia atpalaiduoti rankas nuo klaviatūros, o akis – nuo ekrano.

„Atsiveria virtualių asistentų, slaugos robotų, virtualių mokytojų, teisininkų, medicinos konsultantų ir kitos galimybės. Pavyzdžiui, medicinos sektoriuje jos gali atlaisvinti personalą nuo administracinio, duomenų suvedimo darbo, o sutaupytą laiką galima skirti pacientams. Juk gydytojo profesiją jaunuoliai ir jaunuolės renkasi tam, kad gelbėtų žmones, o ne tam, kad didelę laiko dalį suvedinėtų pacientų duomenis į informacinę sistemą“, – inovacijų privalumus įvardija mokslininkas.

Vaizdo konferencijų įrašus pavers į tekstą

Kalbos automatinis užrašymas tekstu buvo vystomas ir ankstesniame VDU projekte „Semantika-2“ – jo metu buvo sukurtas bazinis modelis, kurio pagrindu internete jau dabar teikiamos nemokamos viešosios paslaugos, įvairių garso įrašų automatinis transkribavimas.

„Bazinis modelis suteikė plačias galimybes tolesniam vystymui – tai ir daroma naujajame projekte. Tobuliname šį modelį, kad jis tinkamai atpažintų žemos kokybės signalus, pavyzdžiui, skambučių centrų telefoninius įrašus. Išvystytas sprendimas automatiškai tekstu pavers populiariausiomis platformomis („Zoom“ ir „Microsoft Teams“) organizuojamų vaizdo konferencijų įrašus“, – planus atskleidžia prof. G. Raškinis.

Lietuvių kalbai taikyti tokias technologijas nėra paprasta – lietuviškai kalba sąlyginai mažai žmonių pasaulyje, todėl mūsų kalba nėra komerciškai patraukli informacinių technologijų gigantams, tokiems kaip „Google“ ar „Microsoft“. Dėl šios priežasties, jei šioje srityje dirbantys mokslininkai nesulauktų reikiamos ES struktūrinių fondų ir šalies biudžeto paramos, apie lietuvių kalbos technologijų pažangą kalbėti būtų sunku arba neįmanoma.

Kalbos skaitmenizavimui – ypatingas dėmesys

Anot mokslininkų, žvelgiant į bendrą kontekstą, Lietuvos įdirbis į kalbos technologijas gali būti vertinamas gan teigiamai. „Jei lyginsimės su sprendimais anglų kalbai, atsiliekame kokybės, sprendimų tikslumo požiūriu. Tačiau jei lyginsimės su kitomis, mažiau kalbos išteklių turinčiomis kalbomis, neatsiliekame nuo bendro vidurkio – o kai kuriais atvejais netgi jį viršijame, ypač šnekos sintezės ir šnekos atpažinimo srityse“, – tikina VDU Informatikos fakulteto docentas D. Amilevičius. Jo teigimu, į ateitį galima žiūrėti optimistiškai – Lietuva ir dabartinė jos Vyriausybė planuoja skirti pakankamai daug dėmesio lietuvių kalbos skaitmeninimui ir skaitmenizavimui.

„Vytauto Didžiojo universitetas nuo pat atsikūrimo buvo lietuvių kalbos technologijų pionierius. Prieš dvidešimt metų profesorės Rūtos Petrauskaitės pasėta tekstynų lingvistikos ir kalbos technologijų tyrimų sėkla universitete rado tinkamą terpę. Todėl ji labai greitai prigijo ir jau duoda puikius vaisius – pirmiausia dėl VDU gilias tradicijas turinčio glaudaus bendradarbiavimo tarp informatikų ir humanitarų“, – primena doc. dr. D. Amilevičius.

VDU kalbos technologijų tyrimai savo laiku leido Lietuvai pralenkti „Google“ – universitetas įvykdė projektą, kurio metu buvo sukurta pirmoji mašininio vertimo sistema iš anglų į lietuvių kalbą.

Dabar kalbos technologijas Vytauto Didžiojo universitetas kartu su atžaline VDU įmone UAB „Intelektika“ vysto projekte „Dirbtinio intelekto ir giliojo mokymosi technologijomis grįstų kalbos technologijų MTEP rezultatų komercinimas (ASTRA)“ Nr. 01.2.2-MITA-K-702-09-0043, finansuojamame pagal 01.2.2-MITA-K-702 priemonę „MTEP rezultatų komercinimo ir tarptautiškumo skatinimas“.

0 komentarų

Rašyti komentarą

Prašome gerbti kitus komentatorius. Gerų diskusijų! Apsauga nuo robotų rūpinasi reCAPTCHA ir yra taikoma „Google“ privatumo politika ir naudojimosi sąlygos.

Taip pat skaitykite

Seimas svarstys pakeitimus, kurie patiks senų automobilių vairuotojams: už šį pažeidimą gali pavykti išsisukti su įspėjimu, sužinokite, kas svarstoma

Pranešimas spaudai

2024-04-19, 19:54

2 komentarai (-ų)

Seimas pradėjo svarstyti du Administracinių nusižengimų kodekso keitimo projektus, kuriais siekiama švelninti administracinę atsakomybę už automobilių keliamą taršą keliuose. Projektus parlamento posėdyje pristatė Seimo nariai Algirdas Stončaitis ir Aistė Gedvilienė.

Gaukite ‎100€ kuponų rinkinį ir 30% nuolaidą pirmam apsipirkimui „Temu“ parduotuvėje
Seimas svarstys pakeitimus, kurie patiks senų automobilių vairuotojams: už šį pažeidimą gali pavykti išsisukti su įspėjimu, sužinokite, kas svarstoma

Seimas pradėjo svarstyti du Administracinių nusižengimų kodekso keitimo projektus, kuriais siekiama švelninti administracinę atsakomybę už automobilių keliamą taršą keliuose. Projektus parlamento posėdyje pristatė Seimo nariai Algirdas Stončaitis ir Aistė Gedvilienė.

Gaukite ‎100€ kuponų rinkinį ir 30% nuolaidą pirmam apsipirkimui „Temu“ parduotuvėje

Šiuo metu už transporto priemonių, kurių į aplinkos orą išmetamų teršalų kiekis viršija nustatytus ribinius dydžius, ar su neveikiančia gamintojo numatyta išmetamųjų dujų neutralizavimo sistema eksploatavimą numatyta atsakomybė: asmenims – 100–300 eurų (už pakartotinį 300–500 eurų), juridinių asmenų vadovams ar kitiems atsakingiems asmenims – 300–500 eurų (už pakartotinį 600–900 eurų).

Abiem teikiamais projektais siūloma fiziniams asmenims nustatytą atsakomybę už transporto priemonių, kurių į aplinkos orą išmetamų teršalų kiekis viršija nustatytus ribinius dydžius, papildyti švelnesne nuobaudos rūšimi – įspėjimu.

„Įspėjimu siekiama, kad asmuo daugiau nenusižengtų ir galėtų pasitaisyti. Jis skiriamas, kai asmuo nusižengia pirmą kartą, supranta savo nusižengimo esmę, gailisi dėl savo padaryto teisės pažeidimo arba yra kitokių jo kaltę švelninančių aplinkybių ir yra netikslinga taikyti griežtesnę poveikio priemonę“, − pažymi projekto iniciatorius, Seimo narys A. Stončaitis aiškinamajame rašte.

Pasak jo, dažnu atveju transporto priemonės vairuotojas nežino, kad galimai daro pažeidimą, nes jo vairuojamas automobilis neišmeta matomų dūmų, o automobilio davikliai nerodo galimo gedimo.

Alternatyvaus projekto rengėja, Seimo narė A. Gedvilienė, pristatydama iniciatyvą dėl įspėjimo įteisinimo, tikino, kad 48 valandos tikrai nėra patogus laikas žmogui susitvarkyti automobilį, užsiregistruoti ir atlikti techninę jo apžiūrą. „Mūsų misija šiandien sumažinti įtampas visuomenėje, kad nebūtų žmonės gąsdinami, kad nebijotų, kad jų automobilis bus konfiskuotas, nes niekada tokio dalyko ir nebuvo siūloma teisės aktuose“, − teigė politikė Seimo posėdyje.

Seimas nuo šių metų pradžios aplinkos apsaugos valstybinės kontrolės pareigūnams yra suteikęs teisę stabdyti transporto priemones ir tikrinti jų į aplinką išmetamų teršalų atitiktį techniniams motorinių transporto priemonių ir jų priekabų reikalavimams, taip pat panaikinti motorinių transporto priemonių ir priekabų, kurių į aplinką išmetami teršalai neatitinka techninių reikalavimų, privalomosios techninės apžiūros dokumentų galiojimą.

Pritarus projektams (Nr. XIVP-3626, Nr. XIVP-3628) po pateikimo, toliau jie bus svarstomi pagrindiniu paskirtame Teisės ir teisėtvarkos komitete. Prie šio klausimo svarstymo Seimo posėdyje planuojama grįžti birželio 6 d.

2 komentarų

Lankytojas

Reziumė, neberinkite tų pasikartojančių veidų, kurie ištisus dešimtmečius suolus trina. Nerinkite tų, kurie išsineša po 140 skėčių ar po puse tonos kavos iš sandėlio, net be jokios sąžinės graužaties toliau lenda į ekranus. Neberinkite tų, kurie išgarsėjo per akciją "Skaidrinam", gal tik tada nebebus visokių nesamoningų priimtų nutarimų. Absurdo lygis pasiekęs visišką piką, toliau jau niekur...

Skaitytojas

Ponia Gedviliene tegul dar pagalvoja apie pakeitimų dėl nuomos kompensacijos, kuria atemė nuo ubagų ir invalidų.

Rašyti komentarą

Prašome gerbti kitus komentatorius. Gerų diskusijų! Apsauga nuo robotų rūpinasi reCAPTCHA ir yra taikoma „Google“ privatumo politika ir naudojimosi sąlygos.

Hey.lt - Nemokamas lankytojų skaitliukas