Įsivaizduokite tradicinės
išvaizdos prietaisą, panašų į vadinamąjį
asmeninį skaitmeninį asistentą (ASA)
- nedidelį nešiojamąjį kompiuterį.
Tiesą sakant, Maxo Huango demonstruojamas prietaisas ir yra asmeninis
skaitmeninis asistentas (Personal Digital
Assistant - PDA) Compaq 3600 ir jei ne jo neįprasta paskirtis, ši dėžutė
tikrai nekristų į akį. Bet šis prietaisas
supranta, ką šnekate.
Maxas Huangas ir jo kolegos iš
Philipso kalbos tyrimo grupės Taipėjuje (Taivanas) patobulino
kompanijos balso atpažinimo sistemą (toliau
- BAS), kurią iš pradžių buvo
numatyta integruoti į asmeninį kompiuterį,
o ne į ASA. Pasak M.Huango, ši sistema - tik prototipas, bet ji jau
atpažįsta 40 000 kinų kalbos žodžių ir
nėra neįkandama Compaq aparatinės
įrangos resursams. Turėdamas tokią
"sekretorę" M.Huangas diktuodamas
gali atsiversti kompiuteryje esančią
adresų knygutę, sudaryti darbų ir
susitikimų grafiką bei parašyti
elektroninį laišką. Palyginkite šias prietaiso
galimybes su įprastesne ASA teikiama paslauga - ant jo nedidelio displėjaus
rašyti plonyte šviesplunksne - ir suprasite, kad jis yra kur kas patogesnis.
1 pav. Diktuoti yra žymiai patogiau, negu rašyti plonyte šviesplunksne.
Rimčiau balso atpažinimo technologiją imta tobulinti pastarąjį
dešimtmetį. Beje, nuo to laiko spėjo
pasikeisti ir mūsų supratimas apie
šios technologijos taikymo ribas.
Anksčiau būtume manę, kad užtektų ir
kompiuteriui diktuoti tekstą ar įsakyti
rinkti norimą telefono numerį, o šiais
laikais BAS pasirodė įmanoma panaudoti
ir tokiems dalykams, apie kuriuos tada net nepagalvodavome: žaislams ir
grotuvams, automobiliams ir pasilinksminimo sistemoms, mobiliesiems
telefonams ir ASA. Nūdien turime tokią
tobulą skaitmeninę techniką, kad
BAS nesutrikdytų nei atsitiktiniai
triukšmai, nei pasikeitusi balso intonacija. Be to, nuo to laiko pasirodė
galingesni bei pigesni ir drauge kompaktiškesni procesoriai bei atminties lustai,
todėl visa balso atpažinimo sistema
gali tilpti į mažą dėžutę.
Balso atpažinimo technologijos pasirodė visuotinės prietaisų
miniatiūrizacijos laikotarpiu, kai visą
technologiją įprasta integruoti į vieną
lustą. "Mygtukams ir displėjams jau
nebelieka vietos", - sako Erikas Soule'as, kompanijos
Sensory Inc. (Santa Klara, Kalifornijos valstija) rinkodaros
direktorius, įtaisytųjų balso sistemų
programinės įrangos kūrėjas. Tarkim,
turėdami balso sąsają, galėtume
pasiklausyti muzikos vien ištarę dainos
pavadinimą - valdymo įtaisais
nereiktų jos ieškoti tarp įvairių meniu.
"Manome, kad balso sąsaja yra labai
svarus regimosios ir lytėjimo sąsajų
papildymas", - teigia E.Soule'as.
Ar vartotojai pirktų prietaisus su įtaisytomis BAS? Analitinės
firmos Kelsey Group iš Prinstono (Niu
Džersio valstija) darbuotojai, kurie stebi įtaisytosios kalbos technologijų
paklausą, mano, kad taip. 2002 m. liepos mėn. firma savo leidinyje
paskelbė, kad įtaisytosios kalbos
apdorojimo programinės įrangos
apyvarta, 2002 m. siekianti 8 mln. dol., per ketverius metus turėtų padidėti iki
277 mln. dol. Taigi, žinovai pranašauja sparčią balso technologijų rinkos
plėtrą, nors šių technologijų verslas ir
nėra lengva duona: 1999 m. žlugo Lernout &
Hauspie - viena garsiausių šios srities kompanijų ir geriausių
balso technologijų kūrėja.
Visgi šiuo metu yra nemažai smulkių ir stambių šios srities
įmonių. Tarp jų - garsiosios
IBM ir Philips, kurios R&D (tyrimai ir plėtra)
kompanijų šimtuke užima atitinkamai 5 ir
24 vietas. Abi kompanijos jau yra sukūrusios ne vieną balso atpažinimo
įrenginį bei sukaupusios dešimtmečių
patirtį. Yra ir smulkesnių įmonių:
Sensory, Advanced Recognition Technology ir Voice Signal
Technologies.
Visos šios kompanijos tikisi, kad jų technologijos bus įvertintos ir
daug kur pritaikytos. Kai kurios jų paslaugos, pvz., balsu valdomas telefono
numerio rinkimas, jau turi savo vartotoją; kitos, tarkim, galimybė balso
komanda įjungti šviesą ar televizorių,
kol kas atrodo neįprastai; yra ir tokių,
kurios numatomos dar labai negreit, kaip kad galimybė mobiliajam
telefonui padiktuoti elektroninio pašto
laišką ir pan.
Kas neapgaubta paslapties šydu
Iš esmės balso atpažinimo
technologija yra tarsi senas vynas naujuose buteliuose. Pagrindus šiai
technologijai aštuntojo dešimtmečio
pradžioje padėjo IBM korporacijos ir
Carnegie Mellon universiteto mokslininkai. Nuo to laiko šią sritį ėmė plėtoti
įvairių kompanijų ir universitetų
tyrėjų grupės. Balso apdorojimo
technologijos - tai tokia veiklos sritis, kuri apima įvairiausius mokslus:
kompiuteriją, taikomąją matematiką,
elektrotechniką, lingvistiką ir informatiką.
Komercinių BAS kūrėjai
vengia detaliau šnekėti apie savo sistemų
veikimą. Tačiau apskritai visų šių
sistemų balso atpažinimo principas yra
gana paprastas, kad ir kam būtų
diktuojama - asmeniniam kompiuteriui ar mobiliajam telefonui, kuris siųs
laišką elektroniniu paštu.
Kai žmogus šneka, mikrofonas garso bangas verčia analoginiu
signalu, o šis keičiamas skaitmeniniu.
Iš skaitmeninio signalo kas 10 ar 20 milisekundžių išrenkami
informacijos freimai. Kiekvienas freimas turi
būti toks trumpas, kad per jį nekistų
informacijos dažninės savybės, ir toks
ilgas, kad apimtų bent vieną dažnio
periodą. Balso apdorojimo sistema iš
kiekvieno freimo išrenka tik jai
reikalingą spektrinės priklausomybės
informaciją, o visa kita - atmeta.
Toliau BAS gautus rezultatus palygina su bibliotekoje saugomų
žodžių atitikmenimis. Teoriškai kalbos
duomenis būtų galima lyginti su visų
bibliotekos žodžių akustine duomenų
baze, kurioje atsispindi netgi žodžių
tarimo ypatybės - akcentas, tarmė ir
t.t. Bet galop, kai bus rasti geriausi ištartų žodžių atitikmenys, pasirodys,
kad toks žodžių atpažinimo būdas per
lėtas, taigi šiuo būdu užduočių
neįmanoma atlikti realiu laiku.
2 pav. Kaip atpažįstama kalba.
Yra ir kitas atpažinimo principas. Pirmiausia BAS ištartą žodį
lygina su kalbos fonemų ir alofonų
(pozicinių fonemos variantų)
akustine duomenų baze. Skaitytojams primename, kad fonema yra
mažiausias kalbos garsinės sistemos vienetas,
skiriantis tos kalbos žodžius. Pvz.,
išlavintos klausos žmogus pajaus, kad garsas "d" skirtingai tariamas
anglų kalbos žodžiuose
dog, and ir address. Anglų kalboje yra apie 40 fonemų
ir keli tūkstančiai alofonų. Taigi,
balso atpažinimo sistemos bibliotekos
žodžiai gali būti pateikiami pagal
fonemų ir alofonų visumą, t. y., pagal
žodžių tarimą.
Balso atpažinimo principas gali remtis ir kalbos modeliais, kurie
žodžius jungia į frazes ar sakinius.
Paprastesniame - gramatikos - kalbos modelyje sistema žodžius atpažįsta
tik iš konteksto. Jei kalbėtojas klausiamas, koks jo pašto indeksas,
sistema gali tikėtis išgirsti skaičių seką.
Gramatinis modelis gerai veikia dialogo, įsakinėjimo ar valdymo atvejais.
Jei nenorima, kad kalbėtojas būtų
varžomas būtinybės kalbėti įsakmiai,
kalbos modelis gali remtis statistiniais kalbos ypatumais - juk kai kurių žodžių
junginiai yra dažnai vartojami. Jei sakoma
Dow Jones Industrial, statistinio vidurkio artinį taikanti sistema šiuos
žodžius atpažins išsyk.
Balso sistemų veiksmingumas priklauso nuo to, kaip sudarytas
atpažinimo algoritmas, ir nuo to, kaip tarpusavyje susiję atpažinimo
metodai. Pradėti analizuoti balsą galima
įvairiais būdais. Tarkim, sistema
atpažino kelias fonemas. Toliau balsas gali būti analizuojamas tik
tinkamiausiais artiniais. Kartais sistema
identifikuoja žodį dar nepasibaigus tam
skirtam laikui, nes nustatoma aukšta šio
žodžio atpažinimo tikimybė.
Kartais analizės pabaigoje sistema nusprendžia, kad identifikavimo tikimybė
nėra didelė, arba randa kelis ištartų
žodžių atitikmenis. Tokiais atvejais
sistema gali paprašyti pakartoti sakinį.
Nuostabusis Markovas
Beveik visos šiuo metu rinkoje siūlomos BAS remiasi
slaptaisiais Markovo modeliais (Hidden Markov
Models - HMM). Jais aprašoma fonemų ir alofonų tarimas bei šių
tarimų trukmė. Markovo modeliai jau
taikomi tris dešimtmečius, ir jų
populiarumas tik didėja. "HMM artinys
turi neginčijamų pranašumų.
Matematikos požiūriu jis yra labai
patogus, lengvai suprantamas ir įgyvendinamas", - tvirtina Masačusetso
technologijos instituto kompiuterijos laboratorijos vadovas Viktoras Zue.
Be abejo, esama ir kitų
artinių. Kitos BAS kūrėjos - kompanijos
Sensory ir Fonix (Solt Leik Sitis, Jutos valstija) pasiūlė vadinamųjų
neuroninių tinklų veikimo principą.
Neuroniniai tinklai geriau nei HMM atpažįsta
atskirus žodžius, tik pirmiau juos
reikia "pamokyti". Anot E.Soule'o, neuroniniam tinklui reikia "pasakyti",
kokių žodžių jis turėtų ieškoti ir
kokių neieškoti. Tik tuomet jis nustato
esminius požymius, pagal kuriuos ieškomus žodžius galima atskirti nuo
panašiai skambančiųjų.
Kai reikia atpažinti ne pavienius žodžius, o sakinius ar skaičių
sekas, slaptieji Markovo modeliai yra pranašesni už neuroninius tinklus.
Dabartinė Sensory kalbos atpažinimo
sistema Fluent Speech taiko hibridinį
- neuroninių tinklų ir slaptųjų
Markovo modelių - artinį.
Kad būtų sukurta duomenų
bazė, su kuria reiktų lyginti ištartus
žodžius, HMM irgi reikia
"pamokyti". Kai kurias užduotis atlikti sistemą
moko pats kalbėtojas. Tuomet atpažinimo sistema mokės atpažinti būtent
to žmogaus kalbą. Kitais atvejais
kalbančiųjų gali būti daug. Tuomet
sistemos kūrėjai parenka daugelio žmonių
kalbos pavyzdžių ir sudaro mokymo duomenų vidurkį.
"Jei BAS skirta naudoti automobilyje, balso pavyzdžius turime
įrašyti automobilyje, kad duomenų
bazėje būtų atsižvelgta į šios ribotos
erdvės akustines charakteristikas", -
aiškina Philipso kalbos apdorojimo centro Dalase (Teksaso valstija) vadovas
Fadis Kaake. Iš tikrųjų parengti gerus
sistemos mokymo duomenis yra taip pat svarbu, kaip ir parašyti
veiksmingus žodžių paieškos algoritmus,
todėl kompanijos visą su šiomis
technologijomis susijusią informaciją laiko
paslaptyje.
Balso atpažinimo technologijų tobulinimo galimybės toli gražu
nėra išsemtos. Mokslininkai tikisi šias
sistemas papildyti regimąja informacija, kad žodžiai būtų atpažįstami iš
lūpų, rankų ir plaštakų judesių. Šiuo
metu kalbos atpažinimo sistemų kūrėjai
tobulina kalbos modelius, kad į
lustą įterpiamas žodynas atspindėtų
žodžių semantikos ar sakinio struktūros
ypatumus. Šios informacijos pagrindu būtų galima analizuoti ne tik 2 ar 3
žodžių, bet ir ilgesnio junginio
žodžių ypatybes.
Kokia dabartinė padėtis?
Kyla logiškas klausimas: jei kalbos atpažinimo procedūrai reikia
tiek daug kompiuterinių išteklių, kaip
šios sistemos kūrėjai ją sugebėjo
integruoti į mobilųjį telefoną ar ASA?
Pirmieji prietaisai buvo kuriami atsižvelgiant į esamus
kompiuterinius išteklius. Šiuo metu rinkoje
esančios galingiausios įtaisytosios kalbos
atpažinimo sistemos, kurios įdiegtos
Compaq iPad 3800 (200 MHz Intel procesorius ir 64 Mb talpos operatyvioji
atmintis), gali atpažinti tik porą
tūkstančių žodžių. Į garsą reaguojantys
mobilieji telefonai, kurių
skaitmeninių signalų procesoriai yra 16 skilčių,
gali atpažinti ne daugiau kaip šimtą
žodžių. (Palyginimui galima
paminėti, kad IBM kompanijos sudaryta kompiuterio valdymo balso sąsaja
programa skirta atpažinti 150 000 žodžių. Be
to, šį žodyną vartotojas gali papildyti.)
Trumpesniam žodynui reikia mažiau atminties, o sistema greičiau
susiranda žodžius. Taigi, kol kas savo
nešiojamajam kompiuteriui negalėtumėt padiktuoti romano "Karas ir
taika". Tačiau jau dabar balso komandomis galėtume nurodyti pasirinkti
reikalingą meniu ar išsirinkti adresą
iš adresų knygutės.
Įtaisytosios kalbos sistemos tobulėjo kartu su mikroprocesorine
technika. Pirmuosiuose į balsą
reaguojančiuose prietaisuose programinė
įranga būdavo integruojama į
specializuotus integrinius grandynus. Vėliau
ją imta kurti esamų kompiuterių
procesoriams ir atminties lustams. Nors ir nepritaikyti tokiai specifinei balso
atpažinimo užduočiai, šie
bendrosios paskirties lustai su ja susidorodavo visai neblogai. Maža to,
skaitmeninių signalų procesorių skaičiavimo
metodika idealiai tinka kalbos atpažinimo algoritmams valdyti. E.Soule'o
teigimu, kai kurie rinkoje populiarūs procesorių/skaitmeninių signalų
procesorių lustai, kaip kad Texas
Instruments OMAP arba Intel ARM
XScale, puikiai tinka mobiliųjų telefonų BAS
taikomiesiems uždaviniams spręsti:
"Procesoriuje galite išsikviesti
užduoties kodą, o tame pačiame silicio luste
turite skaitmeninių signalų
procesorių, kuris valdo kalbos atpažinimo
algoritmą bei apdoroja radijo ryšio
bangų juostą."
Paprasčiausi balsu valdomi prietaisai atpažįsta tik kelias
pagrindines komandas, ištartas reikiama tvarka
ir reikiamu tempu: "įžiebk šviesą",
"grotuvas, aštuntas takelis" ir pan. Visi
kiti žodžiai prietaisui tėra
neįsidėmėtinas triukšmas. Panašiai reaguoja
šunys, iš viso žodžių srauto
išskiriantys tik jiems pažįstamus žodžius. Jei
žodžiai bus ištarti kita tvarka ar per
greitai, prietaisas jų nesupras.
Kad prietaisas vykdytų sudėtingesnes užduotis, turi būti sukurta
"pakantesnė" garso sąsaja, kuri
vartotojui leistų šnekėti kaip žmogui, o
ne kaip robotui, kad jam nereikėtų
įsiminti ilgų, griežta tvarka tariamų
komandų. Toks uždavinys yra gerokai
sudėtingesnis, nes BAS turėtų ne tik
šią kalbą atpažinti, bet ir ją suprasti.
M.Huangas paaiškino, kaip toks prietaisas veikia. Jo kinų kalbos
atpažinimo algoritmas yra integruotas
į Compaq iPaq 3600 ASA ir naudoja tik 200 Kb atminties. Kalbos
atpažinimo modeliai bei biblioteka užima 2
Mb atminties. Atpažinimo metu sistema papildomai naudoja 1 Mb
operatyviosios atminties.
"Tarkim, noriu į
dienotvarkę įtraukti pasimatymą su asmeniu,
kuris įrašytas į adresų knygą.
Žinoma, šią informaciją galiu atspausdinti,
bet galiu ir įsakyti žodžiu", -
aiškina M.Huangas. Žodis
"atspausdinti" reiškia šviesplunksne imituoti
rašymą ant miniatiūrinio 2,3 x 3 colių
displėjaus. Kinų kalba rašytos
informacijos įvedimas yra itin varginantis
darbas, nes kiekvienam hieroglifui įvesti
reikia trijų keturių nuoseklių
"rašiklio" pavingiavimų.
Paspaudęs prietaiso mikrofono mygtuką, M.Huangas kiniškai
sako: "Prašom man rasti Y.C.Chu".
ASA paklūsta, ir minėtam asmeniui daro įvestį. (Y.C.Chu -
Philipso kalbos grupės Taipėjuje vadovas.) Huangas
komandą ištaria šiek tiek kitaip:
"Surask Y.C.Chu". Prietaisas ir vėl atlieka
teisingą įvestį.
Abiem atvejais kalbos atpažinimo sistema pirmiausia atpažįsta
sakinį, jį parašo displėjuje, paskui
apmąsto komandą. Šiame
pavyzdyje kiekvienas prietaiso žodynėlio
žodis turi savąją paskirtį - "surask" yra
paliepimas ieškoti žmogaus, Y.C.Chu yra ieškomas asmuo.
(Tiesmukesnių komandų, kurių žodžiams
nesuteiktos jokios papildomos ypatybės,
žodynėliai išsiplečia iki įspūdingo 40
000 žodžių skaičiaus.) M.Huangas
su ASA nešneka kokiu nors ypatingu būdu ir nei jis, nei kas kitas šios
BAS nemoko; prietaisas atsiliepia į skirtingų žmonių kalbą.
Toliau M.Huangas tikrina prietaiso "organizatoriaus" savybes. Jis
sudaro pasimatymų tvarkaraštį, kai
būna užpildytos prietaiso pateikiamos trumpos formos. Reaguodamas
į trumpą komandą "naujas
susitikimas", "organizatorius" pateikia
tuščią formą. "Su Y.C.Chu", -
diktuoja M.Huangas, kai pasirodo laukelis "Su kuo?". "Biure", - kai pasirodo
laukelis "Kur?" ir t.t.
"Dabar visą informaciją
sutrauksiu į vieną sakinį, - pažadėjo
M.Huangas ir tarė: - Rytoj 10 valandą
su Lifen Yeh norėčiau pažiūrėti
filmą". Po sekundės ar dviejų užpildoma
forma, bet neužpildomas jos laukelis "Kur?". "Nesakiau, kur bus
rodomas filmas, todėl prietaisas šį laukelį
paliko tuščią", - paaiškino jis.
Kad patvirtintų susitikimo komandą, M.Huangas iškvietė
elektroninio pašto programą
ištardamas "Nusiųsk jai laišką". BAS suprato,
kad "jai" - tai Lifen Yeh.
Ar pagrindinė įtaisytųjų BAS
paskirtis bus trumpųjų žinučių
diktavimas? Šiais laikais Europoje ir Azijoje, sykiu paėmus, kasdien
išsiunčiama apie milijardą trumpųjų mobiliojo
telefono žinučių. "Tai didžiulis
informacijos srautas, nors mobiliųjų
telefonų sąsaja trumpoms žinutėms siųsti
yra pasibaisėtina", - sako Voice Signal
Technologies vyriausiasis technologas Jordanas Cohenas.
Žinučių diktavimas
mobiliajam telefonui galėtų atrodyti
neįveikiama užduotis, bet J.Cohenas pažymi,
kad SMS žinučių riba tėra 160 ženklų.
Voice Signal Technologies darbuotojai tikisi iki 2002 m. pabaigos parengti
žinučių diktavimo technologiją, kuri
būtų paklausi, nes Jungtinėse
Valstijose ši belaidžio ryšio paslauga vis
populiarėja. Masačutsetso
technologijos instituto darbuotojas V. Zue, tobulinantis kompiuterio garso plokštę,
pritaria teiginiui, kad diktuoti žinutes
būtų gerokai patogiau, nei jas
rinkti. "Taip siųsti žinutes atrodytų
natūraliau ir būtų patogiau, bet ne
visada. Net jei sistema veiktų ir be
priekaištų, ar visuomet norėtume kalbėtis
su mašina? - klausia V. Zue. - Įsivaizduokite, kad dalyvaujate
konferencijoje. Savo nešiojamame kompiuteryje rinkdamas tekstą ir jį siųsdamas
radijo bangomis niekam netrukdote. O garsiai šnekėti būtų tiesiog
nepadoru. Be to, taip negalėtumėte
išsaugoti konfidencialumo."
Kova su triukšmais
Balso atpažinimo technologijos prašyte prašosi įdiegiamos
automobiliuose. Tokią įrangą turintį
automobilį vairuoti saugiau, nes
vairuotojas mobiliajam telefonui gali diktuoti į
jį net nepažiūrėjęs, be to, patogiau
valdyti prietaiso skydelį bei orientuotis kelyje.
Deja, automobilyje yra daugybė visokių triukšmo šaltinių: variklio
ir vėjo gaudesys, išorės bei radijo
imtuvo triukšmas, keleivių kalbos.
Laimei, kaip aiškina BAS žinovė Judith
Markowitz, triukšmo ir balso dažnius nesunku atskirti. Svarbiausia,
nustatyti pašalinių garsų (tarp jų ir
atsitiktinių žmogaus ištartų žodžių) ypatumus,
pagal kuriuos būtų galima atskirti
triukšmą nuo balso garsų ir jį filtruoti.
Kai kuriuos triukšmus, pvz., įvairiu
greičiu važiuojančio automobilio
variklio ūžesį, galima išmatuoti iš anksto,
kad vėliau būtų nesunku jų atsikratyti.
Svarbi ir mikrofono padėtis automobilio salone. Dar geriau
naudoti ne vieną mikrofoną, bet jų
rinkinį. Vienas ar daugiau mikrofonų būtų
atkreipti į vairuotoją, kiti
fiksuotų triukšmą. Suprantama, kuo
daugiau įrangos, tuo ji brangesnė.
Papildomi mikrofonai, analoginiai skaitmeniniai keitikliai, skaitmeninių signalų
procesoriai ir kita automobiliui pritaikyta įranga BAS gali pabranginti
keliais šimtais ar net tūkstančiais dolerių.
Nepaisydamos techninių sunkumų, kai kurios automobilių
kompanijos kuria automobiliams skirtas balsu valdomas sistemas.
General Motors (2 kompanijų šimtuko vieta) sukurta
sistema OnStar vairuotojui ir keleiviams siūlo galimybę rinkti telefono
numerį bei rašyti ir siųsti elektroninį
laišką. Tuo tarpu DaimlerChrysler (4
vieta), kuri jau nuo 1996 m. Mercedes Benz limuzinams siūlo garso sąsajas,
sukūrė bandomąją sistemą, leidžiančią
vairuotojui susirasti ir rezervuoti viešbutį. 2002 m. rugsėjo mėn.
Honda Motor Co. (21 vieta) pateikė sąvajį balso
sąsajos Accord modelį (pačią BAS
sukūrė IBM).
Balso atpažinimo technologijų ateitis
Įdomu, po kiek laiko visi imsime šnekėtis su savo elektroniniais
įrenginiais? Kad norėtume naudotis
balso atpažinimo technologijomis, pirmiausia turėtume jas pripažinti. Šį
barjerą tenka įveikti kiekvienai naujai
technologijai. Vartotojų požiūriui turi
įtakos ir kartų kaita: jaunesniems
žmonėms balso valdomi prietaisai ir
įrengimai yra priimtinesni. O mūsų
jauniausioji karta jau senokai auga drauge su balso valdomais žaidimais ir žaislais.
Tikimasi, kad visų rūšių BAS
išpopuliarins Microsoft korporacija (12 vieta). Nors jos Redmondo
(Vašingtono valstija) padalinys ir nepardavinėja įtaisytųjų BAS, bet nuolat ir
visur šias technologijas platina - į
jos sukurtą "Windows XP" operacinę
sistemą yra įdiegta ir balso sąsaja,
kuria vartotojas gali susisiekti su internetu. Daugiau kaip 100 žmonių turinti
Redmondo ir Beijingo padalinių kalbos tyrimo grupė savo skaičiumi
nusileidžia tik IBM korporacijai.
Visuotinai paplitusios balso atpažinimo sistemos dar labiau
įtvirtins kompiuterijos technologijas,
kurios galiausiai apims bemaž visas mūsų
gyvenimo sritis. Beje, kiekvienas žmogus ateitį mato savaip. Viena iš
įkūnytų ateities vizijų -
Masačusetso technologijos institute per trejus
metus sukurtas eksperimentinis "intelektualiųjų technologijų kambarys"
(projektas Oxygen), pilnas mikrofonų,
vaizdo kamerų ir judesio detektorių.
Čia vartotojo judesiai nuolat sekami; jis gali bendrauti su išoriniu
pasauliu taip, kaip jam patogiau: balsu, gestais ir net piešiniais.
Kai kurių specialistų
nuomone, kitas šios technologijos etapas -
sistema, kuri būtų ne nuolankus ir
intelektu nepasižymintis tarnas, bet mus suprantantis ir padedantis gyventi
patarėjas bei pašnekovas.
Pabaigoje skaitytojui siūlome susipažinti su tuzinu stambiausių
pasaulio kompanijų, gaminančių BAS
(žr. lentelę).