Sisteme interactive cu răspuns vocal

by donpedro

Sistemele interactive cu răspuns vocal (IVR = interactive voice response system) sunt o punte între oameni şi bazele de date din computere şi au rolul de a face legătura între utilizatorii de telefoane şi informaţia pe care aceştia o doresc, oricând şi oriunde. Aceste sisteme există de mai mult de 10 ani, iar astăzi sunt folosite pentru efectuarea de tranzacţii la burse, reţineri de bilete pentru călătorii şi administrarea de conturi bancare. Cea mai mare parte a IVR şi aplicaţii de efectuare a tranzacţiilor actuale folosesc o interfaţă utilizator DTMF (Dual-Tone MultiFrequency). Totuşi, aplicaţiile care permit apelanţilor să-şi folosească propria voce în locul intrărilor DTMF pentru efectuarea de tranzacţii sunt ultimele inovaţii în serviciile la distanţă bazate pe telefon

Adoptarea rapidă a soluţiilor bazate pe voce în industria IVR este determinată de îmbunătăţirile în algoritmele vocale, de procesarea limbajului natural şi de modelarea limbajului. Alături de aceste realizări tehnologice, un număr de factori legaţi de piaţă sunt cei care determină ca interfaţa utilizator IVR să fie alegerea ideală. Acest articol descrie aplicaţiile actuale IVR vocale, cu accent pe recunoaşterea fonetică a vorbirii, caracteristici şi avantaje, precum şi strategii de dezvoltare şi de comercializare.

Introducere

Aplicaţiile IVR actuale de efectuare a tranzacţiilor permit accesul la informaţii bancare, de portofoliu şi despre cont, la programări ale zborurilor liniilor aeriene şi la programul cinematografelor. Apelanţii pot de asemenea face comenzi, urmări starea acestor comenzi sau folosi o carte de telefon pentru a contacta un birou sau o persoană individuală. Recunoaşterea automată a vorbirii măreşte flexibilitatea şi puterea acestor aplicaţii IVR.
Facilităţile care pot fi livrate cu aplicaţiile actuale IVR vocale sunt foarte multe, de la recunoaşterea literelor şi numerelor vorbite până la recunoaşterea de propoziţii şi fraze complexe. Anumite aplicaţii înlocuiesc pur şi simplu interfeţele touch-tone cu aplicaţii vocale care recunosc un număr limitat de litere şi numere vorbite care sunt translatate în apăsări de taste. Aplicaţiile mai avansate folosesc dialoguri în care utilizatorii folosesc un număr redus de cuvinte, aceste cuvinte fiind recunoscute cu precizie. Aplicaţiile actuale cele mai avansate permit recunoaşterea de propoziţii şi fraze mai complexe vorbite în mod natural.
Înlocuirea simplă touch-tone este mai rapidă şi mai ieftină decât aplicaţiile cu dialog dirijat sau cele de recunoaştere a vorbirii naturale. Totuşi, înlocuirea touch-tone este mult mai puţin sofisticată şi nu cuprinde flexibilitatea şi potenţialul de automatizare a apelului realizat de tehnologiile de recunoaştere vocală (vezi figura 1).
Următorul scenariu de întrebări şi răspunsuri ilustrează facilităţile de recunoaştere a vorbirii pentru aceste tipuri de aplicaţii.
înlocuirea touch-tone
– Sistemul întreabă: “Pentru informaţii de
control apăsaţi sau spuneţi unu”.
– Răspunsul apelantului: “Unu”.
dialog dirijat
– Sistemul întreabă: “Doriţi informaţii de
control al contului sau informaţii despre
dobânzi?”
– Răspunsul apelantului: “Control”, sau
“controlul contului”, sau “dobânzi”.
limbaj natural
– Sistemul întreabă: “Ce tranzacţie doriţi să
efectuaţi?”
– Răspunsul apelantului: “Transferă 500$ din
cont în contul de economii”.

Ing. Aurelian Blejan

Figura 1
Domeniul de recunoaştere a vorbirii

S-ar putea să vă placă și