El otro día estuvimos hablando de los sistemas de reconocimiento de voz y su implementación en maquinas como los contestadores-automáticos.
Si en el caso de estas maquinas la idea es el reconocimiento y la ejecución de una serie de determinadas sentencias que les emitimos de viva voz, ahora lo que se pretende es que el propio sistema emita los sonidos que se le introduzcan sin que hayan sido pregrabados con anterioridad.
El sistema está compuesto por dos partes: el front-end prepara el texto y lo convierte a una representación fonética, después el back-end lee este formato y sintetiza los sonidos requeridos.
Para determinar la calidad de un sistema de este tipo se utilizan dos criterios, la naturaleza y la inteligibilidad. El primero mide cuan la voz sintética se aproxima a la voz humana y el segundo mide si la voz es entendida por los seres humanos. Estos dos factores pueden observarse en cualquiera de estos sistemas, hasta tal punto de percibir señales muy robóticas y otras muy naturales (todo lo natural que suena una voz sintética vaya).
Las dos tecnologías más utilizadas son las siguientes:
La concatenación: se basa como su propio nombre indica en la concatenación de pequeños segmentos de voz pregrabados y reproducidos en tiempo de ejecución. Es la técnica más usada en la actualidad y la que obtiene mejores resultados.
La síntesis de formantes: no usa muestras del habla humana sino un modelo acústico basado en una serie de parámetros como la frecuencia fundamental, ruidos…
El principal problema de estos sintetizadores de voz es que aun no se ha conseguido una voz tan natural como la voz humana…nos siguen pareciendo muy robóticas las voces de, por ejemplo, el GPS del coche, y sigue habiendo reticencias entre la población a todo aquello que tenga que ver con este tipo de voces…
Con todo, se está consiguiendo mejorar las prestaciones de estos sistemas, y quién sabe? Quizá algún día se nos hará imposible distinguir la voz de una maquina de una humana, quien sabe, quizá incluso se nos haga mucha más agradable.
No hay comentarios:
Publicar un comentario