| Apie | Žurnalas | Archyvas | Mokslo įdomybės | Paieška |

2002 m. Nr. 4 turinys

· Tinklo plėtra 2002 metais

· Komutavimo protokolai
· 2002 metų lyderiai
· Laisvę telekomunikacijų verslui!
· Ar verta rinktis VDSL?

Elektronika
· Pokalbis su mašina
· Maksi displėjai ir mini projektoriai
· Patys mažiausi skaitliukai
· Gyvenimas be laikrodžių
· Žinutės
· Kišeninė "elektrinė"
· Blausi švytinčios elektronikos ateitis

Optinis ryšys
· Ne aukštos materijos, o žemiški dalykai
· Optinis regeneravimas
· Permatomas, pilkšvas, bet lazeriai mėlyni
· Žinutės

· Alcatel modernizuoja Lietuvos telekomo optinio ryšio tinklą

Mobilusis ryšys
· Žinutės
· "Galileo" - kas tai?
· UMTS ir ne tik
· 3G operatoriai privalo susirūpinti GSM keliama interferencija

Internetas
· Wi-Fi ryšio tinkli dygsta kaip grybai po lietaus
· Žinutės
· Plačiajuostis belaidis ryšys - dėžutėje
· Ko trūksta plačiajuosčio ryšio sistemoms?

Technikos istorija
· Laiko matavimo kronika
· Nuo radio lempos iki Sip

· Alvarix plačiajuostė daugiataškė bevielio ryšio sistema

Pokalbis su mašina

   Įsivaizduokite tradicinės išvaizdos prietaisą, panašų į vadinamąjį asmeninį skaitmeninį asistentą (ASA) - nedidelį nešiojamąjį kompiuterį. Tiesą sakant, Maxo Huango demonstruojamas prietaisas ir yra asmeninis skaitmeninis asistentas (Personal Digital Assistant - PDA) Compaq 3600 ir jei ne jo neįprasta paskirtis, ši dėžutė tikrai nekristų į akį. Bet šis prietaisas supranta, ką šnekate.

   Maxas Huangas ir jo kolegos iš Philipso kalbos tyrimo grupės Taipėjuje (Taivanas) patobulino kompanijos balso atpažinimo sistemą (toliau - BAS), kurią iš pradžių buvo numatyta integruoti į asmeninį kompiuterį, o ne į ASA. Pasak M.Huango, ši sistema - tik prototipas, bet ji jau atpažįsta 40 000 kinų kalbos žodžių ir nėra neįkandama Compaq aparatinės įrangos resursams. Turėdamas tokią "sekretorę" M.Huangas diktuodamas gali atsiversti kompiuteryje esančią adresų knygutę, sudaryti darbų ir susitikimų grafiką bei parašyti elektroninį laišką. Palyginkite šias prietaiso galimybes su įprastesne ASA teikiama paslauga - ant jo nedidelio displėjaus rašyti plonyte šviesplunksne - ir suprasite, kad jis yra kur kas patogesnis.

1 pav. Diktuoti yra žymiai patogiau, negu rašyti plonyte šviesplunksne.

   Rimčiau balso atpažinimo technologiją imta tobulinti pastarąjį dešimtmetį. Beje, nuo to laiko spėjo pasikeisti ir mūsų supratimas apie šios technologijos taikymo ribas. Anksčiau būtume manę, kad užtektų ir kompiuteriui diktuoti tekstą ar įsakyti rinkti norimą telefono numerį, o šiais laikais BAS pasirodė įmanoma panaudoti ir tokiems dalykams, apie kuriuos tada net nepagalvodavome: žaislams ir grotuvams, automobiliams ir pasilinksminimo sistemoms, mobiliesiems telefonams ir ASA. Nūdien turime tokią tobulą skaitmeninę techniką, kad BAS nesutrikdytų nei atsitiktiniai triukšmai, nei pasikeitusi balso intonacija. Be to, nuo to laiko pasirodė galingesni bei pigesni ir drauge kompaktiškesni procesoriai bei atminties lustai, todėl visa balso atpažinimo sistema gali tilpti į mažą dėžutę.

  Balso atpažinimo technologijos pasirodė visuotinės prietaisų miniatiūrizacijos laikotarpiu, kai visą technologiją įprasta integruoti į vieną lustą. "Mygtukams ir displėjams jau nebelieka vietos", - sako Erikas Soule'as, kompanijos Sensory Inc. (Santa Klara, Kalifornijos valstija) rinkodaros direktorius, įtaisytųjų balso sistemų programinės įrangos kūrėjas. Tarkim, turėdami balso sąsają, galėtume pasiklausyti muzikos vien ištarę dainos pavadinimą - valdymo įtaisais nereiktų jos ieškoti tarp įvairių meniu. "Manome, kad balso sąsaja yra labai svarus regimosios ir lytėjimo sąsajų papildymas", - teigia E.Soule'as.

   Ar vartotojai pirktų prietaisus su įtaisytomis BAS? Analitinės firmos Kelsey Group iš Prinstono (Niu Džersio valstija) darbuotojai, kurie stebi įtaisytosios kalbos technologijų paklausą, mano, kad taip. 2002 m. liepos mėn. firma savo leidinyje paskelbė, kad įtaisytosios kalbos apdorojimo programinės įrangos apyvarta, 2002 m. siekianti 8 mln. dol., per ketverius metus turėtų padidėti iki 277 mln. dol. Taigi, žinovai pranašauja sparčią balso technologijų rinkos plėtrą, nors šių technologijų verslas ir nėra lengva duona: 1999 m. žlugo Lernout & Hauspie - viena garsiausių šios srities kompanijų ir geriausių balso technologijų kūrėja.

   Visgi šiuo metu yra nemažai smulkių ir stambių šios srities įmonių. Tarp jų - garsiosios IBM ir Philips, kurios R&D (tyrimai ir plėtra) kompanijų šimtuke užima atitinkamai 5 ir 24 vietas. Abi kompanijos jau yra sukūrusios ne vieną balso atpažinimo įrenginį bei sukaupusios dešimtmečių patirtį. Yra ir smulkesnių įmonių: Sensory, Advanced Recognition Technology ir Voice Signal Technologies.

   Visos šios kompanijos tikisi, kad jų technologijos bus įvertintos ir daug kur pritaikytos. Kai kurios jų paslaugos, pvz., balsu valdomas telefono numerio rinkimas, jau turi savo vartotoją; kitos, tarkim, galimybė balso komanda įjungti šviesą ar televizorių, kol kas atrodo neįprastai; yra ir tokių, kurios numatomos dar labai negreit, kaip kad galimybė mobiliajam telefonui padiktuoti elektroninio pašto laišką ir pan.

Kas neapgaubta paslapties šydu

   Iš esmės balso atpažinimo technologija yra tarsi senas vynas naujuose buteliuose. Pagrindus šiai technologijai aštuntojo dešimtmečio pradžioje padėjo IBM korporacijos ir Carnegie Mellon universiteto mokslininkai. Nuo to laiko šią sritį ėmė plėtoti įvairių kompanijų ir universitetų tyrėjų grupės. Balso apdorojimo technologijos - tai tokia veiklos sritis, kuri apima įvairiausius mokslus: kompiuteriją, taikomąją matematiką, elektrotechniką, lingvistiką ir informatiką.

   Komercinių BAS kūrėjai vengia detaliau šnekėti apie savo sistemų veikimą. Tačiau apskritai visų šių sistemų balso atpažinimo principas yra gana paprastas, kad ir kam būtų diktuojama - asmeniniam kompiuteriui ar mobiliajam telefonui, kuris siųs laišką elektroniniu paštu.

   Kai žmogus šneka, mikrofonas garso bangas verčia analoginiu signalu, o šis keičiamas skaitmeniniu. Iš skaitmeninio signalo kas 10 ar 20 milisekundžių išrenkami informacijos freimai. Kiekvienas freimas turi būti toks trumpas, kad per jį nekistų informacijos dažninės savybės, ir toks ilgas, kad apimtų bent vieną dažnio periodą. Balso apdorojimo sistema iš kiekvieno freimo išrenka tik jai reikalingą spektrinės priklausomybės informaciją, o visa kita - atmeta.

   Toliau BAS gautus rezultatus palygina su bibliotekoje saugomų žodžių atitikmenimis. Teoriškai kalbos duomenis būtų galima lyginti su visų bibliotekos žodžių akustine duomenų baze, kurioje atsispindi netgi žodžių tarimo ypatybės - akcentas, tarmė ir t.t. Bet galop, kai bus rasti geriausi ištartų žodžių atitikmenys, pasirodys, kad toks žodžių atpažinimo būdas per lėtas, taigi šiuo būdu užduočių neįmanoma atlikti realiu laiku.


2 pav. Kaip atpažįstama kalba.

   Yra ir kitas atpažinimo principas. Pirmiausia BAS ištartą žodį lygina su kalbos fonemų ir alofonų (pozicinių fonemos variantų) akustine duomenų baze. Skaitytojams primename, kad fonema yra mažiausias kalbos garsinės sistemos vienetas, skiriantis tos kalbos žodžius. Pvz., išlavintos klausos žmogus pajaus, kad garsas "d" skirtingai tariamas anglų kalbos žodžiuose dog, and ir address. Anglų kalboje yra apie 40 fonemų ir keli tūkstančiai alofonų. Taigi, balso atpažinimo sistemos bibliotekos žodžiai gali būti pateikiami pagal fonemų ir alofonų visumą, t. y., pagal žodžių tarimą.

   Balso atpažinimo principas gali remtis ir kalbos modeliais, kurie žodžius jungia į frazes ar sakinius. Paprastesniame - gramatikos - kalbos modelyje sistema žodžius atpažįsta tik iš konteksto. Jei kalbėtojas klausiamas, koks jo pašto indeksas, sistema gali tikėtis išgirsti skaičių seką. Gramatinis modelis gerai veikia dialogo, įsakinėjimo ar valdymo atvejais. Jei nenorima, kad kalbėtojas būtų varžomas būtinybės kalbėti įsakmiai, kalbos modelis gali remtis statistiniais kalbos ypatumais - juk kai kurių žodžių junginiai yra dažnai vartojami. Jei sakoma Dow Jones Industrial, statistinio vidurkio artinį taikanti sistema šiuos žodžius atpažins išsyk.

   Balso sistemų veiksmingumas priklauso nuo to, kaip sudarytas atpažinimo algoritmas, ir nuo to, kaip tarpusavyje susiję atpažinimo metodai. Pradėti analizuoti balsą galima įvairiais būdais. Tarkim, sistema atpažino kelias fonemas. Toliau balsas gali būti analizuojamas tik tinkamiausiais artiniais. Kartais sistema identifikuoja žodį dar nepasibaigus tam skirtam laikui, nes nustatoma aukšta šio žodžio atpažinimo tikimybė. Kartais analizės pabaigoje sistema nusprendžia, kad identifikavimo tikimybė nėra didelė, arba randa kelis ištartų žodžių atitikmenis. Tokiais atvejais sistema gali paprašyti pakartoti sakinį.

Nuostabusis Markovas

   Beveik visos šiuo metu rinkoje siūlomos BAS remiasi slaptaisiais Markovo modeliais (Hidden Markov Models - HMM). Jais aprašoma fonemų ir alofonų tarimas bei šių tarimų trukmė. Markovo modeliai jau taikomi tris dešimtmečius, ir jų populiarumas tik didėja. "HMM artinys turi neginčijamų pranašumų. Matematikos požiūriu jis yra labai patogus, lengvai suprantamas ir įgyvendinamas", - tvirtina Masačusetso technologijos instituto kompiuterijos laboratorijos vadovas Viktoras Zue.

   Be abejo, esama ir kitų artinių. Kitos BAS kūrėjos - kompanijos Sensory ir Fonix (Solt Leik Sitis, Jutos valstija) pasiūlė vadinamųjų neuroninių tinklų veikimo principą. Neuroniniai tinklai geriau nei HMM atpažįsta atskirus žodžius, tik pirmiau juos reikia "pamokyti". Anot E.Soule'o, neuroniniam tinklui reikia "pasakyti", kokių žodžių jis turėtų ieškoti ir kokių neieškoti. Tik tuomet jis nustato esminius požymius, pagal kuriuos ieškomus žodžius galima atskirti nuo panašiai skambančiųjų.

   Kai reikia atpažinti ne pavienius žodžius, o sakinius ar skaičių sekas, slaptieji Markovo modeliai yra pranašesni už neuroninius tinklus. Dabartinė Sensory kalbos atpažinimo sistema Fluent Speech taiko hibridinį - neuroninių tinklų ir slaptųjų Markovo modelių - artinį.

   Kad būtų sukurta duomenų bazė, su kuria reiktų lyginti ištartus žodžius, HMM irgi reikia "pamokyti". Kai kurias užduotis atlikti sistemą moko pats kalbėtojas. Tuomet atpažinimo sistema mokės atpažinti būtent to žmogaus kalbą. Kitais atvejais kalbančiųjų gali būti daug. Tuomet sistemos kūrėjai parenka daugelio žmonių kalbos pavyzdžių ir sudaro mokymo duomenų vidurkį.

   "Jei BAS skirta naudoti automobilyje, balso pavyzdžius turime įrašyti automobilyje, kad duomenų bazėje būtų atsižvelgta į šios ribotos erdvės akustines charakteristikas", - aiškina Philipso kalbos apdorojimo centro Dalase (Teksaso valstija) vadovas Fadis Kaake. Iš tikrųjų parengti gerus sistemos mokymo duomenis yra taip pat svarbu, kaip ir parašyti veiksmingus žodžių paieškos algoritmus, todėl kompanijos visą su šiomis technologijomis susijusią informaciją laiko paslaptyje.

   Balso atpažinimo technologijų tobulinimo galimybės toli gražu nėra išsemtos. Mokslininkai tikisi šias sistemas papildyti regimąja informacija, kad žodžiai būtų atpažįstami iš lūpų, rankų ir plaštakų judesių. Šiuo metu kalbos atpažinimo sistemų kūrėjai tobulina kalbos modelius, kad į lustą įterpiamas žodynas atspindėtų žodžių semantikos ar sakinio struktūros ypatumus. Šios informacijos pagrindu būtų galima analizuoti ne tik 2 ar 3 žodžių, bet ir ilgesnio junginio žodžių ypatybes.

Kokia dabartinė padėtis?

   Kyla logiškas klausimas: jei kalbos atpažinimo procedūrai reikia tiek daug kompiuterinių išteklių, kaip šios sistemos kūrėjai ją sugebėjo integruoti į mobilųjį telefoną ar ASA?

   Pirmieji prietaisai buvo kuriami atsižvelgiant į esamus kompiuterinius išteklius. Šiuo metu rinkoje esančios galingiausios įtaisytosios kalbos atpažinimo sistemos, kurios įdiegtos Compaq iPad 3800 (200 MHz Intel procesorius ir 64 Mb talpos operatyvioji atmintis), gali atpažinti tik porą tūkstančių žodžių. Į garsą reaguojantys mobilieji telefonai, kurių skaitmeninių signalų procesoriai yra 16 skilčių, gali atpažinti ne daugiau kaip šimtą žodžių. (Palyginimui galima paminėti, kad IBM kompanijos sudaryta kompiuterio valdymo balso sąsaja programa skirta atpažinti 150 000 žodžių. Be to, šį žodyną vartotojas gali papildyti.)

   Trumpesniam žodynui reikia mažiau atminties, o sistema greičiau susiranda žodžius. Taigi, kol kas savo nešiojamajam kompiuteriui negalėtumėt padiktuoti romano "Karas ir taika". Tačiau jau dabar balso komandomis galėtume nurodyti pasirinkti reikalingą meniu ar išsirinkti adresą iš adresų knygutės.

   Įtaisytosios kalbos sistemos tobulėjo kartu su mikroprocesorine technika. Pirmuosiuose į balsą reaguojančiuose prietaisuose programinė įranga būdavo integruojama į specializuotus integrinius grandynus. Vėliau ją imta kurti esamų kompiuterių procesoriams ir atminties lustams. Nors ir nepritaikyti tokiai specifinei balso atpažinimo užduočiai, šie bendrosios paskirties lustai su ja susidorodavo visai neblogai. Maža to, skaitmeninių signalų procesorių skaičiavimo metodika idealiai tinka kalbos atpažinimo algoritmams valdyti. E.Soule'o teigimu, kai kurie rinkoje populiarūs procesorių/skaitmeninių signalų procesorių lustai, kaip kad Texas Instruments OMAP arba Intel ARM XScale, puikiai tinka mobiliųjų telefonų BAS taikomiesiems uždaviniams spręsti: "Procesoriuje galite išsikviesti užduoties kodą, o tame pačiame silicio luste turite skaitmeninių signalų procesorių, kuris valdo kalbos atpažinimo algoritmą bei apdoroja radijo ryšio bangų juostą."

   Paprasčiausi balsu valdomi prietaisai atpažįsta tik kelias pagrindines komandas, ištartas reikiama tvarka ir reikiamu tempu: "įžiebk šviesą", "grotuvas, aštuntas takelis" ir pan. Visi kiti žodžiai prietaisui tėra neįsidėmėtinas triukšmas. Panašiai reaguoja šunys, iš viso žodžių srauto išskiriantys tik jiems pažįstamus žodžius. Jei žodžiai bus ištarti kita tvarka ar per greitai, prietaisas jų nesupras.

   Kad prietaisas vykdytų sudėtingesnes užduotis, turi būti sukurta "pakantesnė" garso sąsaja, kuri vartotojui leistų šnekėti kaip žmogui, o ne kaip robotui, kad jam nereikėtų įsiminti ilgų, griežta tvarka tariamų komandų. Toks uždavinys yra gerokai sudėtingesnis, nes BAS turėtų ne tik šią kalbą atpažinti, bet ir ją suprasti.

   M.Huangas paaiškino, kaip toks prietaisas veikia. Jo kinų kalbos atpažinimo algoritmas yra integruotas į Compaq iPaq 3600 ASA ir naudoja tik 200 Kb atminties. Kalbos atpažinimo modeliai bei biblioteka užima 2 Mb atminties. Atpažinimo metu sistema papildomai naudoja 1 Mb operatyviosios atminties.

   "Tarkim, noriu į dienotvarkę įtraukti pasimatymą su asmeniu, kuris įrašytas į adresų knygą. Žinoma, šią informaciją galiu atspausdinti, bet galiu ir įsakyti žodžiu", - aiškina M.Huangas. Žodis "atspausdinti" reiškia šviesplunksne imituoti rašymą ant miniatiūrinio 2,3 x 3 colių displėjaus. Kinų kalba rašytos informacijos įvedimas yra itin varginantis darbas, nes kiekvienam hieroglifui įvesti reikia trijų keturių nuoseklių "rašiklio" pavingiavimų.

   Paspaudęs prietaiso mikrofono mygtuką, M.Huangas kiniškai sako: "Prašom man rasti Y.C.Chu". ASA paklūsta, ir minėtam asmeniui daro įvestį. (Y.C.Chu - Philipso kalbos grupės Taipėjuje vadovas.) Huangas komandą ištaria šiek tiek kitaip: "Surask Y.C.Chu". Prietaisas ir vėl atlieka teisingą įvestį.

   Abiem atvejais kalbos atpažinimo sistema pirmiausia atpažįsta sakinį, jį parašo displėjuje, paskui apmąsto komandą. Šiame pavyzdyje kiekvienas prietaiso žodynėlio žodis turi savąją paskirtį - "surask" yra paliepimas ieškoti žmogaus, Y.C.Chu yra ieškomas asmuo. (Tiesmukesnių komandų, kurių žodžiams nesuteiktos jokios papildomos ypatybės, žodynėliai išsiplečia iki įspūdingo 40 000 žodžių skaičiaus.) M.Huangas su ASA nešneka kokiu nors ypatingu būdu ir nei jis, nei kas kitas šios BAS nemoko; prietaisas atsiliepia į skirtingų žmonių kalbą.

   Toliau M.Huangas tikrina prietaiso "organizatoriaus" savybes. Jis sudaro pasimatymų tvarkaraštį, kai būna užpildytos prietaiso pateikiamos trumpos formos. Reaguodamas į trumpą komandą "naujas susitikimas", "organizatorius" pateikia tuščią formą. "Su Y.C.Chu", - diktuoja M.Huangas, kai pasirodo laukelis "Su kuo?". "Biure", - kai pasirodo laukelis "Kur?" ir t.t.

   "Dabar visą informaciją sutrauksiu į vieną sakinį, - pažadėjo M.Huangas ir tarė: - Rytoj 10 valandą su Lifen Yeh norėčiau pažiūrėti filmą". Po sekundės ar dviejų užpildoma forma, bet neužpildomas jos laukelis "Kur?". "Nesakiau, kur bus rodomas filmas, todėl prietaisas šį laukelį paliko tuščią", - paaiškino jis.

   Kad patvirtintų susitikimo komandą, M.Huangas iškvietė elektroninio pašto programą ištardamas "Nusiųsk jai laišką". BAS suprato, kad "jai" - tai Lifen Yeh.

   Ar pagrindinė įtaisytųjų BAS paskirtis bus trumpųjų žinučių diktavimas? Šiais laikais Europoje ir Azijoje, sykiu paėmus, kasdien išsiunčiama apie milijardą trumpųjų mobiliojo telefono žinučių. "Tai didžiulis informacijos srautas, nors mobiliųjų telefonų sąsaja trumpoms žinutėms siųsti yra pasibaisėtina", - sako Voice Signal Technologies vyriausiasis technologas Jordanas Cohenas.

   Žinučių diktavimas mobiliajam telefonui galėtų atrodyti neįveikiama užduotis, bet J.Cohenas pažymi, kad SMS žinučių riba tėra 160 ženklų. Voice Signal Technologies darbuotojai tikisi iki 2002 m. pabaigos parengti žinučių diktavimo technologiją, kuri būtų paklausi, nes Jungtinėse Valstijose ši belaidžio ryšio paslauga vis populiarėja. Masačutsetso technologijos instituto darbuotojas V. Zue, tobulinantis kompiuterio garso plokštę, pritaria teiginiui, kad diktuoti žinutes būtų gerokai patogiau, nei jas rinkti. "Taip siųsti žinutes atrodytų natūraliau ir būtų patogiau, bet ne visada. Net jei sistema veiktų ir be priekaištų, ar visuomet norėtume kalbėtis su mašina? - klausia V. Zue. - Įsivaizduokite, kad dalyvaujate konferencijoje. Savo nešiojamame kompiuteryje rinkdamas tekstą ir jį siųsdamas radijo bangomis niekam netrukdote. O garsiai šnekėti būtų tiesiog nepadoru. Be to, taip negalėtumėte išsaugoti konfidencialumo."

Kova su triukšmais

   Balso atpažinimo technologijos prašyte prašosi įdiegiamos automobiliuose. Tokią įrangą turintį automobilį vairuoti saugiau, nes vairuotojas mobiliajam telefonui gali diktuoti į jį net nepažiūrėjęs, be to, patogiau valdyti prietaiso skydelį bei orientuotis kelyje.

   Deja, automobilyje yra daugybė visokių triukšmo šaltinių: variklio ir vėjo gaudesys, išorės bei radijo imtuvo triukšmas, keleivių kalbos. Laimei, kaip aiškina BAS žinovė Judith Markowitz, triukšmo ir balso dažnius nesunku atskirti. Svarbiausia, nustatyti pašalinių garsų (tarp jų ir atsitiktinių žmogaus ištartų žodžių) ypatumus, pagal kuriuos būtų galima atskirti triukšmą nuo balso garsų ir jį filtruoti. Kai kuriuos triukšmus, pvz., įvairiu greičiu važiuojančio automobilio variklio ūžesį, galima išmatuoti iš anksto, kad vėliau būtų nesunku jų atsikratyti.

   Svarbi ir mikrofono padėtis automobilio salone. Dar geriau naudoti ne vieną mikrofoną, bet jų rinkinį. Vienas ar daugiau mikrofonų būtų atkreipti į vairuotoją, kiti fiksuotų triukšmą. Suprantama, kuo daugiau įrangos, tuo ji brangesnė. Papildomi mikrofonai, analoginiai skaitmeniniai keitikliai, skaitmeninių signalų procesoriai ir kita automobiliui pritaikyta įranga BAS gali pabranginti keliais šimtais ar net tūkstančiais dolerių.

   Nepaisydamos techninių sunkumų, kai kurios automobilių kompanijos kuria automobiliams skirtas balsu valdomas sistemas. General Motors (2 kompanijų šimtuko vieta) sukurta sistema OnStar vairuotojui ir keleiviams siūlo galimybę rinkti telefono numerį bei rašyti ir siųsti elektroninį laišką. Tuo tarpu DaimlerChrysler (4 vieta), kuri jau nuo 1996 m. Mercedes Benz limuzinams siūlo garso sąsajas, sukūrė bandomąją sistemą, leidžiančią vairuotojui susirasti ir rezervuoti viešbutį. 2002 m. rugsėjo mėn. Honda Motor Co. (21 vieta) pateikė sąvajį balso sąsajos Accord modelį (pačią BAS sukūrė IBM).

Balso atpažinimo technologijų ateitis

   Įdomu, po kiek laiko visi imsime šnekėtis su savo elektroniniais įrenginiais? Kad norėtume naudotis balso atpažinimo technologijomis, pirmiausia turėtume jas pripažinti. Šį barjerą tenka įveikti kiekvienai naujai technologijai. Vartotojų požiūriui turi įtakos ir kartų kaita: jaunesniems žmonėms balso valdomi prietaisai ir įrengimai yra priimtinesni. O mūsų jauniausioji karta jau senokai auga drauge su balso valdomais žaidimais ir žaislais.

   Tikimasi, kad visų rūšių BAS išpopuliarins Microsoft korporacija (12 vieta). Nors jos Redmondo (Vašingtono valstija) padalinys ir nepardavinėja įtaisytųjų BAS, bet nuolat ir visur šias technologijas platina - į jos sukurtą "Windows XP" operacinę sistemą yra įdiegta ir balso sąsaja, kuria vartotojas gali susisiekti su internetu. Daugiau kaip 100 žmonių turinti Redmondo ir Beijingo padalinių kalbos tyrimo grupė savo skaičiumi nusileidžia tik IBM korporacijai.

   Visuotinai paplitusios balso atpažinimo sistemos dar labiau įtvirtins kompiuterijos technologijas, kurios galiausiai apims bemaž visas mūsų gyvenimo sritis. Beje, kiekvienas žmogus ateitį mato savaip. Viena iš įkūnytų ateities vizijų - Masačusetso technologijos institute per trejus metus sukurtas eksperimentinis "intelektualiųjų technologijų kambarys" (projektas Oxygen), pilnas mikrofonų, vaizdo kamerų ir judesio detektorių. Čia vartotojo judesiai nuolat sekami; jis gali bendrauti su išoriniu pasauliu taip, kaip jam patogiau: balsu, gestais ir net piešiniais.

   Kai kurių specialistų nuomone, kitas šios technologijos etapas - sistema, kuri būtų ne nuolankus ir intelektu nepasižymintis tarnas, bet mus suprantantis ir padedantis gyventi patarėjas bei pašnekovas.

   Pabaigoje skaitytojui siūlome susipažinti su tuzinu stambiausių pasaulio kompanijų, gaminančių BAS (žr. lentelę).


El. p.: info@elektronika.lt