El cepstrum es un método de Fourier no lineal que se utiliza para "deconvolucionar" dos señales. Sus principales aplicaciones son el análisis del habla y la detección de ecos.
Algoritmo
Cuando se mide una vocal hablada, se obtiene una señal que consiste en la convolución de una función de excitación v(t), generada por las cuerdas vocales, y la respuesta al impulso del tracto vocal h(t):
La función de excitación tiene la forma de una serie de impulsos. Si la ecuación anterior se transforma al dominio de la frecuencia, la convolución se convierte en una multiplicación:
S(f) es el espectro de la señal, V(f) es el espectro de la excitación y H(f) es la función de transferencia del tracto vocal.
La logaritmización de la ecuación transforma la multiplicación en una suma:
Por último, se realiza una transformación inversa de Fourier, que transforma la ecuación en el rango "cepstral":
El término "cepstrum" es una palabra inventada que se crea intercambiando las cuatro primeras letras de la palabra "spectrum". Del mismo modo, "Frecuencia" se convierte en "Quefrency", "Filtrado" en "Liftering" y así sucesivamente.
La función de excitación tiene la forma de una serie de impulsos, cuya transformada de Fourier es a su vez una serie de impulsos. Esto significa que todas las transformaciones anteriores no pueden cambiar la forma de la función de excitación y, por tanto, sus picos siguen siendo visibles en el cepstrum. Para "deconvolucionar" las dos partes de la señal, basta con poner a cero los coeficientes situados a la izquierda o a la derecha del primer pico y reconstruir la señal temporal después de este "Liftering". Si se suprimen los coeficientes de orden superior, se obtiene la respuesta al impulso h(t). Por el contrario, si se suprimen los coeficientes de orden inferior, la reconstrucción proporciona la función de excitación v(t).
Del mismo modo, una señal superpuesta con ecos de sí misma puede interpretarse como una convolución de la señal original con una sucesión de Dirac (sucesión de impulsos). Con el análisis cepstral es posible reconstruir la señal original hasta cierto punto y medir el retardo del eco, que corresponde al valor temporal del pico en el cepstrum.
Tipo de cepstrum - Cepstrum real
El cepstrum real se define del siguiente modo:
Aquí x es el conjunto de datos reales. Se calcula la transformación inversa del logaritmo del valor absoluto de la FFT y solo se pasa como resultado su parte real.
Tipo Cepstrum - reconstrucción con fase mínima
Como la información de fase se pierde cuando se forma el valor absoluto, solo es posible reconstruir la señal de tiempo con una fase mínima:
Aquí L es un vector que contiene la ventana "Liftering". Para separar la respuesta al impulso de la excitación, se puede especificar la longitud de esta ventana "Liftering ", que filtra una parte de los coeficientes cepstrales antes de reconstruir la señal de tiempo. Para extraer la respuesta al impulso, deben suprimirse todos los coeficientes de orden superior a partir del pico del cepstrum que indica la función de excitación. Puede medir esta posición con el cursor en el diagrama cepstrum. Si introduce un número negativo, la ventana se invierte y se suprimen todos los coeficientes de orden inferior. La reconstrucción muestra entonces la función de excitación.
Opciones - Escalado fijo (solo en el asistente para análisis)
El cepstrum suele producir picos pronunciados con altas amplitudes. Si se utiliza la escala automática para el eje Y, estos picos conducen a valores finales tan altos para el eje Y que todos los coeficientes de interés solo se muestran como una línea horizontal. Para aumentar estos coeficientes, puede activar la Escalado fijo para el eje Y y especificar manualmente los valores finales simétricos.
Opciones - Picos (solo en el asistente para análisis)
Los picos del cepstrum se identifican mediante un algoritmo de reconocimiento de máximos locales. El número de 4icos está limitado por un valor máximo. Los picos se ordenan según su valor absoluto espectral. Tenga en cuenta que es posible que no se alcance el número de picos establecido si se detectan menos picos en el espectro.
Puede utilizar el botón Etiquetado para visualizar los valores X y/o Y de los picos en el cepstrum.
Opciones - Establecer/eliminar referencia (solo en el asistente para análisis)
Esta función permite comparar diferentes configuraciones. El botón Establecer referencia muestra una copia del cepstrum actualmente visualizado en el nivel inferior de la ventana. A continuación, puede realizar otras configuraciones que afecten a la visualización en el nivel superior. Con Eliminar referencia se elimina la copia y se vuelve a mostrar la señal de tiempo.
Bibliografía
•Oppenheim, A. V. and Schafer, R. W. (1989). Discrete-Time Signal Processing. Prentice Hall, Englewood Cliffs, NJ.
•Bogert, B. P. and Healy, M.J.R. and Tukey J. W. (1963). The Quefrency Alanysis of Time Series for Echoes: Cepstrum, Pseudo-autocovariance, Cross-Cepstrum and Saphe Cracking, from Proc. Symposium Time Series Analysis., ed. Rosenblatt, M. John Wiley and Sons, Nueva York Páginas 209-243.