Objet et modèle d’analyse Analyse cepstrale (Option Analyse spectrale)

23.08.2021

Le Cepstre est une technique de Fourier non linéaire utilisée pour "déconvoluer" deux signaux. Ses principales applications sont l'analyse de la parole et la détection des échos.

Algorithme

Lorsque vous mesurez une voix parlée, le signal est la convolution d'une fonction d'excitation v(t), produite par les cordes vocales, et de la réponse impulsionnelle du conduit vocal h (t ) :

La fonction d'excitation a la forme d'une série d'impulsions. Si nous transformons l'équation ci-dessus dans le domaine de Fourier, la convolution est remplacée par une multiplication :

S(f) est le spectre du signal, V(f) est le spectre de l'excitation et H(f) est la fonction de transfert du conduit vocal.

Nous prenons maintenant le logarithme de cette équation qui transforme la multiplication en une addition :

Nous appliquons ensuite une FFT inverse pour entrer dans le domaine "cepstral" :

Le terme "cepstre" est dérivé de "spectre" en échangeant les quatre premiers caractères. De la même manière, "frequency" devient "quefrency", "filtering" devient "liftering" et ainsi de suite.

La fonction d'excitation a la forme d'une série d'impulsions dont la transformée de Fourier est à nouveau une série d'impulsions. Cela signifie que toutes les transformations ci-dessus ne peuvent pas changer la forme de la fonction d'excitation et que l'on peut donc voir ses pics dans le cepstre. Pour déconvoluer les deux parties du signal, il suffit de mettre à zéro tous les coefficients cepstraux à gauche ou à droite du premier pic, puis de reconstruire le signal dans le domaine temporel à partir des coefficients cepstraux restants après le "liftering". Si vous éliminez les coefficients d'ordre supérieur, vous obtenez la réponse impulsionnelle h(t). Si on écarte le contraire, on reçoit la fonction d'excitation v(t).

De manière similaire, un signal qui est recouvert par des échos de lui-même peut être vu comme une convolution du signal original avec une série de Dirac (série d'impulsions). Avec l'analyse cepstrale, il est possible de reconstruire le signal original dans une certaine mesure et de mesurer le retard de l'écho qui est égal à la valeur temporelle du pic dans le cepstre.

Type de cepstral - Cepstre réel

Le cepstre réel est défini comme suit :

Le flux d'entrée des données réelles est x. La transformée inverse est prise du logarithme de la magnitude de la FFT. Seule la composante réelle de l'inverse de Fourier est utilisée.

Type de cepstral - Reconstruction de la phase minimale, longueur de la fenêtre "Liftering"

Comme l'information de phase est perdue lorsque la magnitude de la transformée directe est prise, seule une reconstruction de phase minimale est possible dans le domaine temporel :

Ici, L est un vecteur contenant la fenêtre de "liftering". Pour séparer la fonction de réponse impulsionnelle de la fonction d'excitation, il est possible de spécifier la longueur de cette fenêtre de "liftering" , qui va filtrer certains coefficients cepstraux avant de reconstruire la série de données dans le domaine temporel. Pour extraire la fonction de réponse impulsionnelle, il faut "lever" tous les coefficients d'ordre supérieur en commençant par le pic du cepstre qui indique la fonction d'excitation. Vous pouvez mesurer la position de ce pic en utilisant les curseurs dans le graphique du cepstre. Si vous saisissez une valeur négative pour la longueur, la fenêtre est inversée et tous les coefficients d'ordre inférieur sont rejetés. La reconstruction montre alors la fonction d'excitation.

Options - Échelle fixe, Pics (Assistant d'analyse uniquement)

Le cepstre produit souvent des pics aigus avec des amplitudes élevées. Si l'on utilise la mise à l'échelle automatique pour l'axe Y, ces pics conduisent à des valeurs extrêmes tellement élevées pour l'axe Y que tous les coefficients d'intérêt sont rendus sous la forme d'une ligne horizontale. Pour dézoomer ces coefficients, il est possible d'activer l'option Utiliser une échelle fixe pour l'axe Y et de fournir manuellement des valeurs finales symétriques.

Options - Pics (Assistant d'analyse uniquement)

Les pics du cepstre sont identifiés par un algorithme de détection des maxima locaux. Le nombre de pics est limité par une valeur maximale. Les pics sont classés par ordre de magnitude spectrale. Notez qu'un nombre de pics peut ne pas être réalisé si moins de pics sont détectés.

Vous pouvez visualiser les valeurs Y et/ou X des pics du cepstre en appuyant sur Échanger étiquettes.

Options - Définir/effacer la référence (Assistant d'analyse uniquement)

Cette fonction vous permet de comparer différents réglages. Vous pouvez visualiser une copie du cepstre actuellement affiché dans le volet inférieur en appuyant sur Définir référence. Ensuite, vous pouvez régler des paramètres supplémentaires qui affectent l'affichage dans le volet supérieur. Avec Suppr. référence, vous pouvez supprimer la copie et le signal horaire apparaîtra à nouveau.

Références

Oppenheim, A. V. and Schafer, R. W. (1989). Discrete-Time Signal Processing. Prentice Hall, Englewood Cliffs, NJ.

Bogert, B. P. and Healy, M.J.R. and Tukey J. W. (1963). The Quefrency Alanysis of Time Series for Echoes: Cepstrum, Pseudo-autocovariance, Cross-Cepstrum and Saphe Cracking, from Proc. Symposium Time Series Analysis., ed. Rosenblatt, M. John Wiley and Sons, New York. Pages 209-243.

Partager l’article ou envoyer par mail :

Vous serez probablement intéressé par les articles suivants :