Számítógép vezérlése hanggal

Míg köztünk, emberek közt a kommunikáció egyik legalapvetőbb és minden kétséget kizáróan legkifejezőbb formája a beszéd, addig természetesnek vesszük, hogy gépeinkkel valamilyen periféria, jellemzően egér és billentyűzet segítségével lépünk kapcsolatba. Ennek azonban nem kell szükségszerűen így lennie! Noha több évtizeddel ezelőtt felvetődött annak a gondolata, sőt igénye, hogy képessé tegyük a számítógépeinket az emberi beszéd megértésére, az erre irányuló erőfeszítések sokáig csak részeredményeket hoztak. Az elmúlt évtizedben azonban sokat fejlődött a terület, és bár az emberi beszéd tartalmi megértésétől bizonyára még mindig messze állnak a számítógépek, a formai értelemben vett megértés, tehát lényegében a mikrofonnal „hallott” szavak és mondatok írott szöveggé alakítása egyre kevésbé okoz gondot nekik. Ez nem csak azt jelenti, hogy egyre pontosabban diktálhatunk tetszőleges hosszúságú szöveget a számítógépnek, hanem lehetőség nyílik az egész rendszer irányítására kizárólag hangalapú utasításokat adva. Ilyen módon szinte bármit megvalósíthatunk, ami a normál számítógéphasználat során felmerül. Így például programok indítása és bezárása, szörfölés a neten, emailek írása, olvasása, de akár szövegszerkesztés vagy játék is.

Némi kellemetlenséget jelenthet, hogy a forgalomban lévő hangvezérlést kínáló programok szinte egyike sem ismeri a magyar nyelvet, de valószínűsíthető, hogy a közeljövőben a terület fejlődésével egyre inkább nőni fog a kevesebbek által beszélt nyelvek, így a magyar támogatottsága is.

Bár Windows operációs rendszerekben alapból megtalálható a hangvezérlés funkció, tapasztalatom szerint hosszú tanítgatás és állítgatás után is csak rendkívüli nehézkesen használható. Egy hangvezérlést kínáló szoftvernek legalább három dologban kell jól működnie: az elhangzó utasítások magas arányú megértése, nagyfokú testreszabhatóság, intuitív kezelhetőség. Sajnos a Windows mint három kategóriában elbukik. Bizonyos parancsokat csak sokadjára vagy egyáltalán nem ért meg, csak a meglévő parancsokkal dolgozhatunk, újabb funkciókat nem lehet hozzáadni, és nem érti a természetes beszédet, a parancsokat betűre pontosan kell kimondanunk. Az egyetlen előnye más programokkal szemben, hogy, ha már van egy telepített Windows-unk, nem kell külön fizetni a szolgáltatásért, és a beszerzéssel, telepítéssel sem kell bajlódnunk.

[iframe src=’https://videoplayercdn.osi.office.net/embed/9a6649e6-9a36-4136-aa92-abd4bba4a547′ height=315 percent=80 style=”display: block; margin: auto;”]
 
Szerencsére az alap windows-os beépítettnél léteznek jobb lehetőségek is, ezekből kettőt szeretnék kiemelni. A terület egyik óriása, a Dragon NaturallySpeaking átfogó megoldást kínál a számítógépek hangvezérlésére. Egy pár perces betanítás után (ez gyakorlatban egy adott szöveg jól artikulált felolvasását jelenti) egészen jó arányban ismeri fel a diktált szöveget és az utasításokat. Az előre definiált parancsok az átlagos számítógéphasználat szinte teljes egészét lefedik, de szükség esetén lehetőség van új parancsszavak felvételére is. A vezérlése meglehetősen intuitív, de ha elakadnánk egy feladat végrehajtásanál, a beépített, kényelmesen elérhető súgóban pillanatok alatt rá lehet találni az adott szituációban alkalmazható parancsszavakra.
A negatívumok közé tartozik, hogy a magyar nyelv egyelőre itt sem támogatott, valamint hogy kizárólag fizetős verzió létezik. Az alap jelenleg 100, a professzionális verzió 300 dollárba kerül, de annak, aki csak kipróbálni szeretné érdemes lehet alternatív források között is szétnézni a neten.

[youtube https://youtu.be/uXXvJ-4Abbc id=videoid sd=0 percent=80 center=1 rel=1 https=0 privacy=0]
 
Egy másik kiváló program a VoiceAttack. Ez a kisméretű szoftver kifejezetten hangutasítások végrehajtására lett kifejlesztve hosszabb szöveg diktálására nem igazán alkalmas. Óriási előnye, hogy rendkívül széleskörűen testre szabható és a legkomplexebb feladatok végrehajtására is könnyen meg lehet tanítani bármiféle programozási ismeret nélkül. Feladatok végrehajtásának akár egész sorozata hozzárendelhető egy-egy hang- vagy billentyűparancshoz. Azok, akik kész megoldást keresnek több előre elkészített profilt is találhatnak a neten, amelyeket betöltve azonnal használható a program. A demo verzió ingyenesen letölthető, de egyszerre csak 20 parancs kezelését engedi. A korlátlan verzió jelenleg 10 dollárért érhető el.

Néhány további program: Tazti, e-Speaking, VoxCommando

Ajánlott bejegyzések