Analyseobjekt- und vorlage Cepstralanalyse (Option Spektralanalyse)

23.08.2021

Das Cepstrum ist ein nicht-lineares Fourier-Verfahren welches zur "Entfaltung" zweier Signale verwendet wird. Seine vorwiegenden Anwendungen sind die Sprachanalyse und die Echoerkennung.

Algorithmus

Wenn man einen gesprochenen Vokal misst, erhält man ein Signal, welches aus der Faltung einer Anregungsfunktion v(t), die von den Stimmbändern erzeugt wird, und der Impulsantwort des Vokaltraktes h(t) besteht:

Die Anregungsfunktion hat die Form einer Impulsreihe. Wenn die obige Gleichung in den Frequenzbereich transformiert wird, dann wird aus der Faltung eine Multiplikation:

S(f) ist das Spektrum des Signals, V(f) ist das Spektrum der Anregung und H(f) ist die Übertragungsfunktion des Vokaltraktes.

Logarithmierung der Gleichung führt die Multiplikation in eine Addition über:

Zuletzt erfolgt eine Inverse Fourier-Transformation wodurch die Gleichung in den "Cepstralen"-Bereich transformiert wird:

Der Begriff "Cepstrum" ist ein Kunstwort, welches aus dem Wort "Spectrum" durch vertauschen der ersten vier Buchstaben entsteht. In ähnlicher Weise wird "Frequency" zu "Quefrency", "Filtering" wird zu "Liftering" und so weiter.

Die Anregungsfunktion hat die Form einer Impulsreihe, deren Fourier-Transformierte wiederum eine Impulsreihe ist. Dies bedeutet, dass alle obigen Transformationen die Gestalt der Anregungsfunktion nicht ändern können und deren Peaks daher im Cepstrum sichtbar bleiben. Um die beiden Teile des Signals zu "entfalten", müssen lediglich die Koeffizienten links oder rechts des ersten Peaks auf Null gesetzt und nach diesem "Liftering" eine Rekonstruktion des Zeitsignals durchgeführt werden. Wenn die Koeffizienten höherer Ordnung unterdrückt werden, erhält man die Impulsantwort h(t). Wenn umgekehrt die Koeffizienten niedrigerer Ordnung unterdrückt werden, liefert die Rekonstruktion die Anregungsfunktion v(t).

In gleicher Weise kann ein Signal, welches durch Echos von sich selbst überlagert ist, als eine Faltung des ursprünglichen Signals mit einer Dirac-Folge (Impulsfolge) gesehen werden. Mit der Cepstralanalyse ist es möglich, das ursprüngliche Signal in beschränktem Maße zu rekonstruieren und die Echoverzögerung zu messen, welche dem Zeitwert des Peaks im Cepstrum entspricht.

Cepstrum-Typ - Reelles Cepstrum

Das reelle Cepstrum ist wie folgt definiert:

Hier ist x der reelle Datensatz. Die inverse Transformation des Logarithmus des Betrages der FFT wird berechnet und nur deren Realteil als Ergebnis übergeben.

Cepstrum-Typ - Rekonstruktion mit minimaler Phase

Da die Phaseninformation bei der Betragsbildung verloren geht, ist eine Rekonstruktion des Zeitsignals nur mit minimaler Phase möglich:

Hier ist L ein Vektor, der das "Liftering"-Fenster enthält. Um die Impulsantwort von der Anregung zu trennen, kann die Länge dieses "Liftering"-Fensters angegeben werden, welches einen Teil der Cepstralkoeffizienten vor der Rekonstruktion des Zeitsignals heraus filtert. Um die Impulsantwort zu extrahieren, müssen alle Koeffizienten höherer Ordnung ab dem Peak im Cepstrum, der die Anregungsfunktion anzeigt, unterdrückt werden. Sie können diese Position mit den Cursor im Cepstrum-Diagramm ausmessen. Wenn Sie eine negative Zahl angeben, wird das Fenster invertiert und alle Koeffizienten mit niedrigerer Ordnung werden unterdrückt. Die Rekonstruktion zeigt dann die Anregungsfunktion.

Optionen - Festskalierung, Peaks (Nur im Analyseassistent)

Das Cepstrum erzeugt oft scharfe Peaks mit hohen Amplituden. Wenn automatische Skalierung für die Y-Achse verwendet wird, dann führen diese Peaks zu solch großen Endwerten für die Y-Achse, dass alle interessierenden Koeffizienten nur noch als horizontale Linie dargestellt werden. Um diese Koeffizienten zu vergrößern, können Sie Festskalierung für die Y-Achse einschalten und die symmetrischen Endwerte manuell vorgeben.

Optionen - Peaks (Nur im Analyseassistent)

Die Peaks im Cepstrum werden durch einen Algorithmus zur Erkennung lokaler Maxima identifiziert. Die Peak-Anzahl wird durch einen Maximalwert beschränkt. Die Peaks werden nach ihrem Spektralbetrag sortiert. Beachten Sie, dass die eingestellte Peak-Anzahl u. U. nicht erreicht werden kann, wenn weniger Peaks im Spektrum erkannt wurden.

Mit der Schaltfläche Beschriftungen können Sie die Y- und/oder X-Werte der Peaks im Cepstrums anzeigen lassen.

Optionen - Referenz setzen/löschen (Nur im Analyseassistent)

Diese Funktion ermöglicht Ihnen den Vergleich verschiedener Einstellungen. Mit der Schaltfläche Referenz setzen wird eine Kopie des aktuell angezeigten Cepstrums in der unteren Fensterebene angezeigt. Anschließend können Sie weitere Einstellungen vornehmen, die sich auf die Darstellung in der oberen Ebene auswirken. Mit Referenz löschen entfernen Sie die Kopie und das Zeitsignal wird wieder angezeigt.

Literatur

Oppenheim, A. V. and Schafer, R. W. (1989). Discrete-Time Signal Processing. Prentice Hall, Englewood Cliffs, NJ.

Bogert, B. P. and Healy, M.J.R. and Tukey J. W. (1963). The Quefrency Alanysis of Time Series for Echoes: Cepstrum, Pseudo-autocovariance, Cross-Cepstrum and Saphe Cracking, from Proc. Symposium Time Series Analysis., ed. Rosenblatt, M. John Wiley and Sons, New York. Pages 209-243.

Verwendete FPScript-Funktion

CepstralAnalysis

Siehe auch

Analyseobjekte

Option Spektralanalyse

FFT-Algorithmen

Fourier-Spektralanalyse

FFTn-Funktion

Artikel teilen oder als Email versenden:

Diese Beiträge könnten Sie ebenfalls interessieren