Muchos centros de llamadas Síntesis Server utilizan servidores de síntesis de voz para llamadas de ruta en el menú principal a un operador humano que trabaja en un departamento específico . Estos servidores suelen ser capaces de producir discurso , así como la comprensión de ella. Servidores de síntesis de voz también se utilizan en las aplicaciones web para que sean más accesibles e interactivos.
Motor de síntesis de voz
Un motor de síntesis de voz acepta la entrada en forma de texto preprogramado o los comandos en tiempo real y salidas de voz reconocible. Motores de síntesis de voz que procesan preprogramadas texto suelen realizar una única tarea, como informar a los visitantes que un área determinada es fuera de límites . Motores de síntesis de voz que aceptan comandos en tiempo real se utilizan para proporcionar a los discapacitados con un medio de comunicación , y también se utilizan en los sistemas de telecomunicaciones. La voz que se oye de estos sistemas es una combinación de muestras de voz humana y los algoritmos que crean la ilusión de hablar suave.
Reconocimiento de Voz
Reconocimiento de voz sistemas funcionan en la dirección opuesta . Ellos interpretan el discurso de un ser humano y lo convierten en texto. Sistemas de reconocimiento de voz utilizan un método de interpretación de discurso de un ser humano que se basa en las probabilidades . Por ejemplo , en un sistema de reconocimiento de voz simple donde las únicas entradas aceptables son " sí" o " no", el equipo es capaz de calcular la probabilidad de que un usuario está diciendo una o la otra. Esto es posible debido a que el sistema de reconocimiento de voz se puede comparar los sonidos fonéticos de cada entrada contra una base de datos de muestras . El principio es el mismo para los sistemas con muchos insumos , aunque la probabilidad de error es mayor.
Texto a voz
Texto a voz es una tecnología que convierte el texto para ser reconocible en su equivalente fonético, que luego convierte en sonido con altavoces . Una gran parte de este proceso tiene que ver con la interpretación del texto y lo descomponen en partes . Cada pieza puede estar compuesto de varias palabras , y representa frases individuales . De esta manera, el motor de texto a voz puede hacer discurso que suena natural oyentes humanos . Motores de texto a voz sofisticados rompen aún más estas unidades en sílabas individuales , completas con el tono y la información de duración.