Cepstrum

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Een cepstrum (uitspraak: kepstrum) is het spectrum van de logaritmische voorstelling van het spectrum van een reeks.[1]

De term is afgeleid van het woord spectrum. Andere termen zijn: quefrentie (frequentie), rahmonischen (harmonischen), gamnitude (magnitude), safe (fase), lifter (filter) enzovoort.

Definitie[bewerken]

Oorspronkelijk[bewerken]

De oorspronkelijke definitie is die van het reële cepstrum.[2] Dit is de inverse Fouriertransformatie van het logaritme van de magnitude van de Fouriertransformatie van de reeks:

c_x[n]=\frac{1}{2\pi}\int_{-\pi}^{\pi}\log|X(e^{j\omega})|e^{j\omega n}d\omega

In deze formule is de magnitude reëel en niet negatief. De formule is ook niet inverteerbaar aangezien de informatie van de fase verloren gaat.

Algemeen[bewerken]

Om de informatie van de fase te bewaren moet het complexe logaritme genomen worden. De cepstrale analyse is zelf niet complex. Het complexe cepstrum van een reële reeks is nog altijd een reële functie.

\hat{x}[n]=\frac{1}{2\pi}\int_{-\pi}^{\pi}\log[X(e^{j\omega})]e^{j\omega n}d\omega
\hat{x}[n]=\frac{1}{2\pi}\int_{-\pi}^{\pi}[\log|X(e^{j\omega})|+j\arg(X(e^{j\omega}))]e^{j\omega n}d\omega

In deze formule is arg de continue fase functie.

Eigenschappen[bewerken]

Algemeen[bewerken]

  1. Het cepstrum neemt minstens zo snel af als 1/|n|.
  2. Het cepstrum is oneindig, zelfs als x[n] eindig is.
  3. Het cepstrum is reëel als x[n] reëel is. De voorwaarde voor een reële x[n] is dat de polen en nullen complex geconjugeerde paren vormen.

Minimum- en maximumfase reeksen[bewerken]

Een minimumfase reeks is reëel, causaal en stabiel. De polen en nullen liggen allemaal in de eenheidscirkel. Een maximumfase reeks is het tegengestelde.

  1. Het cepstrum is causaal (0 \text{ voor } n<0) als en slechts als x[n] minimumfase is.
  2. Het cepstrum is 0 \text{ voor } n>0 als en slechts als x[n] maximumfase is.

Convolutie[bewerken]

Een speciale toepassing van cepstrale alanyse is er als het ingangssignaal van een systeem de convolutie is van twee signalen:

x[n]=x_1[n]*x_2[n]

De Fouriertransformatie zou dan de vermenigvuldiging zijn van de twee signalen:

X[z]=X_1[z]X_2[z]

Als het logaritme wordt toepast:

\log[X(z)]=\log[X_1(z)]+\log[X_2(z)]

Dan is het cepstrum:

\hat{x}[n]=\hat{x}_1[n]+\hat{x}_2[n]

Het cepstrum kan dus gezien worden als een systeem dat aan het veralgemeend principe van superpositie voldoet. De ingangsfunctie is convolutie, de uitgang is optelling.

Toepassingen[bewerken]

Een van de eerste toepassingen was het herstellen van oude fonograaf opnames.[3] In dit werk werd vooral gewerkt met opnames van Enrico Caruso. Er moest gecompenseerd worden voor het gebruik van de "morning glory" hoorn die toen gebruikt werd. De idee was om cepstrale averaging toe te passen en hier cepstrale averaging van moderne opnames van af te trekken. Het resultaat werd dan gebruikt als cepstrum van de hoorn die gecompenseerd moest worden. Dit gebruik van cepstrum averaging is nuttig geweest bij andere toepassingen van schatten en compenseren van convolutionele vervorming.[1]

Het cepstrum komt ook veel voor bij stem- en spraakherkenning. De cepstrale coëfficiënten zijn robuuster en betrouwbaarder dan "linear predictive coding (LPC)" coëfficiënten of equivalenten.
Een andere toepassing van het cepstrum bij spraakherkenning is het mel-frequentiecepstrum.[4] Hierbij is het oorspronkelijke spectrum gebaseerd op een filterbank met centrumfrequenties en bandbreedten bepaald uit een constant mel-frequentie interval.

Signalen die echo's bevatten worden ook bestudeerd met cepstra. Voorbeelden zijn seismologie[5] en het bestuderen van oppervlakten in geofysica.

Bij machine diagnoses wordt het cepstrum gebruikt om families harmonischen en zijbanden te ontdekken.[6] Bij het bestuderen van vibratiesignalen kan een harmonische reeks ontdekt worden. Deze reeks zal niet direct synchroon zijn met de assnelheid. Dit duidt in de meeste gevallen op slijtage.

Referenties[bewerken]

  1. a b Alan V. Oppenheim en Ronald W. Schafer (2004): "Dsp history - From frequency to quefrency: a history of the cepstrum", in: IEEE Signal Processing Magazine, vol. 21, uitg. 5, blz. 95-106
  2. B. P. Bogert, M. J. R. Healy en J. W. Tukey (1963): "The Quefrency Alanysis of Time Series for Echoes: Cepstrum, Pseudo Autocovariance, Cross-Cepstrum and Saphe Cracking", in: M. Rosenblatt (red.): Proceedings of the Symposium on Time Series Analysis, Wiley, New York, hfdstk: 15, blz. 209-243.
  3. T.G. Stockham, Jr., T.M. Cannon en R.B. Ingebretsen (1975): "Blind deconvolution through digital signal processing", in: Proceedings of the IEEE, vol. 63, blz. 678-692.
  4. S.B. Davis en P. Mermelstein (1980): "Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences", in: IEEE Transactions on Acoustics, Speech and Signal Processing, vol. ASSP-28, nr. 4, blz. 357-366.
  5. T.J. Ulrych (1971): "Application of homomorphic deconvolution to seismology", in: Geophysics, vol. 36, nr. 4, blz. 650-660.
  6. G. White (1998): "Cepstrum Analyse", in: Technical Papers and Case Studies, Azima DLI.