Blog de Ingeniería

sábado 15 de noviembre de 2008

Voicexml - El paso más natural luego de la Escritura

RESUMEN

VoiceXML es un estándar propuesto por la W3C que tiene como objetivo crear ficheros – documentos y que lo llamaron XML, estos reproducen sonidos digitalizados o sintetizado utilizando una tecnología llamada Text To Speech, que, reconoce información ingresada por el usuario pulsaciones telefónicas y también permite reconocer palabra y/o frases pronunciadas por una persona, todo esto usando un dispositivo telefónico, ya sea fijo o móvil.

VoiceXML está compuesto en su totalidad por XML, es decir necesita que el documento VoiceXML sea "bien estructurado" para que pueda ser reconocido como correcto.
Actualmente esta especificación es declarada oficialmente como estándar por la W3C.

¿PARA QUE SIRVE?

Crea una serie de ventajas significativas en los desarrollos basados en web, entrega de contenidos para las aplicaciones interactivos en respuesta a la voz.

Ej. Se podría bajo una plataforma puramente Web, escribir un texto y al dar al enter, la tecnología VoiceXml lo transforma en voz y lo envía a un teléfono fijo o móvil. Una vez que haya atendido la llamada el sistema puede interactuar, con los teclados de su teléfono, para votar, para pulsar y desviar la llamada una vez escuchado el TTS a un Call Center, y se pueden ver las estadísticas en un Servidor IVR.


Pero … ¿Cómo trabaja el VoiceXml explicado para un empresario?


Podemos explicarlo mediante el gráfico de abajo:

¿Como funciona VoiceXML?

Mientras que HTML crea interfaces "graficas" para que el usuario “vea” y e “interactúe” con información por medio del teclado de un ordenador, VoiceXML crea interfaces orales. Es decir, el usuario o cliente no "ve" la información, la escucha.

Como VoiceXML actúa con la voz, el usuario no necesita ordenador; solo le basta con un teléfono.

El usuario se conecta al servidor VoiceXml a través la Red de Telefonía e interactúa con su empresa con su voz.

Este servidor tiene un browser (elemento que sirve) para procesar la información, cada browser debe ser capaz de reconocer y procesar las etiquetas de cada lenguaje, es decir es el intermediario para gestionar las llamadas de voz.

Entrada aportada por Ignacio Fernández, Director de Nuevas Tecnologías, Posicionamiento Web