Aquí hay un desglose de cómo se usan los libros de códigos en diferentes contextos:
* Cuantización vectorial (VQ): Esta es la aplicación más común. En VQ, un libro de códigos contiene un conjunto de vectores (que a menudo representan características espectrales como coeficientes Cepstrales MEL-Frequency-MFCCS). Estos vectores representan diferentes "prototipos" de sonidos del habla. Durante la codificación, se compara un vector de características de voz entrante con los vectores en el libro de códigos, y el índice de vector de coincidencia más cercano se utiliza como una representación comprimida del discurso original. Durante la decodificación, este índice se utiliza para recuperar el vector correspondiente del libro de códigos, reconstruyendo una aproximación del discurso original. El objetivo es lograr una compresión eficiente mientras se mantiene la calidad del habla aceptable.
* Modelos Hidden Markov (HMMS): Los libros de códigos a veces se usan dentro de HMMS para el reconocimiento de voz. Cada estado en un HMM podría tener un libro de códigos asociado que represente las características acústicas que se pueden observar en ese estado. Las probabilidades de observar vectores de libros de códigos específicos se usan durante el proceso de decodificación para determinar la secuencia más probable de estados HMM (y por lo tanto, las palabras reconocidas).
* Reconocimiento/verificación del altavoz: Los libros de códigos pueden almacenar funciones específicas de los altavoces. Por ejemplo, un libro de códigos podría representar las características espectrales típicas de la voz de un altavoz en particular. Este libro de códigos se puede usar para compararse con la voz de un altavoz desconocido para determinar si es una coincidencia.
En esencia, un libro de códigos proporciona una representación cuantificada y compacta del espacio potencialmente vasto de posibles sonidos del habla o características del altavoz, permitiendo almacenamiento eficiente, transmisión y procesamiento de datos del habla. La calidad del procesamiento del habla depende en gran medida de la calidad y el diseño del libro de códigos, que a menudo implica algoritmos de capacitación para crear representaciones efectivas.