Autorregresión
Si un modelo puede aproximarse con éxito a los datos, entonces este modelo puede transformarse en el dominio de la frecuencia en lugar de sus datos subyacentes. El modelo transformado describe entonces un espectro estable y continuo. Este es el principio básico de todos los espectros generados por modelización autorregresiva. En un modelo AR, un valor en un instante t se basa en una combinación lineal de valores anteriores (predicción hacia delante), en una combinación lineal de valores posteriores (predicción hacia atrás) o en una combinación de ambos (predicción hacia delante y hacia atrás). Los modelos lineales permiten un cálculo estable y preciso.
Definición del modelo AR y ARMA
Con el fin de obtener el número de grados de libertad para las pruebas estadísticas y crear una base común para todos los algoritmos AR, un modelo AR en FlexPro se define de la siguiente manera:
En estas ecuaciones, x es la serie de datos de la longitud N y a es la serie de parámetros autorregresivos de orden p. FlexPro utiliza la convención de signo positivo (predicción lineal) para los coeficientes AR. El modelo se define como una predicción hacia atrás para los p primeros valores y como una predicción hacia delante para los N - p valores restantes . Esta definición se utiliza en todas las estadísticas de aproximación, aunque este modelo no es aproximado por ninguno de los algoritmos AR de mínimos cuadrados. El modelo solo se utiliza en el caso de una aproximación AR pura mediante el procedimiento ARMA.
La definición de ARMA recibe el número de grados de libertad de la misma manera:
Aquí, b es la serie de coeficientes de media móvil de orden q. Los cálculos aquí también comienzan con una predicción hacia atrás, pero se utiliza un índice inicial más alto para integrar la media móvil para los primeros p valores. Este modelo se aproxima mediante los algoritmos ARMA no lineales.
Definiciones espectrales AR
Las densidades espectrales de potencia AR y ARMA se definen como sigue:
En estas ecuaciones, ν es la varianza del ruido blanco y δt es el intervalo de muestreo. Tenga en cuenta que ambos modelos espectrales son funciones continuas de la frecuencia.
Clasificación de los algoritmos AR
Los coeficientes AR pueden calcularse de varias maneras. Pueden calcularse a partir de estimaciones de la autocorrelación, de los coeficientes de autocorrelación parcial y mediante algoritmos de mínimos cuadrados. Cuando se calcula el modelo AR utilizando el método de correlación, el resultado depende del retardo máximo (maximum lag) para el que se calcula la autocorrelación. Con el método de autocorrelación parcial, esto depende de la definición específica del coeficiente de reflexión. En los métodos de mínimos cuadrados, el resultado depende de cómo se traten los datos en los bordes y de si se aproxima la matriz de datos o las ecuaciones normales.
La mayoría de los algoritmos AR en FlexPro son procedimientos de mínimos cuadrados, ya que estos producen las mejores estimaciones espectrales. Los algoritmos de mínimos cuadrados con separación integrada de señal y ruido mediante descomposición en valores singulares (SVD, Singular Value Decomposition) son los más estables de los métodos AR de FlexPro. Estos algoritmos están firmemente integrados en los estimadores espectrales AR.
Modelos de predicción AR
Una función continua del tiempo solo necesita los parámetros calculados para poder calcular un valor de la función para cualquier valor de tiempo. El hecho de que el intervalo de muestreo original fuera constante o variable deja de tener importancia en cuanto se aproxima el modelo. Esto no se aplica a un modelo autorregresivo. Un modelo de predicción lineal AR es una función discreta que requiere datos muestreados constantemente.
Cuando se evalúa un modelo AR en el dominio del tiempo para un valor siguiente, parte de la secuencia de datos anterior se filtra utilizando los coeficientes AR para crear el nuevo elemento. Aunque un modelo lineal AR no tiene un componente de ruido explícito, forma parte de la secuencia de datos. El ruido blanco se trata así de punto a punto, suponiendo que no está correlacionado.
Limitaciones del modelo AR
En la práctica, a menudo no es posible predecir un valor basándose en sus predecesores. Por ejemplo, el proceso puede ser estocástico (aleatorio) en lugar de determinista, o puede no haber correlación entre el valor y sus predecesores.
El ruido de fondo tampoco es necesariamente blanco y no correlacionado. Los procesos geofísicos, por ejemplo, suelen tener un fondo de ruido rojo. Con el ruido rojo, la varianza disminuye a mayor frecuencia. En algunos casos, la tendencia del ruido puede aproximarse como un modelo AR de primer orden.
Cuanto mayor sea el orden de un modelo AR, más componentes de la serie de datos podrán modelizarse. Si no hay ruido, los componentes armónicos (función senoidal) se registran con un orden que corresponde al doble de su número. Sin embargo, suele haber ruido.
Además, los componentes de banda estrecha no suelen estar exactamente armónicos. Esto puede ser más o menos cierto, es decir, se producen oscilaciones regulares, pero no pueden describirse mediante una única función senoidal o senoidal amortiguada. La información necesaria para describir tales oscilaciones solo puede ser captada por un modelo AR registrando un alto número de ciclos de la oscilación. Para las estructuras que cambian lentamente, esto puede requerir un orden de modelo alto.
Separación señal-ruido AR
Una simple aproximación AR no proporciona una separación efectiva de la señal y el ruido. Incluso si las oscilaciones senoidales puras están incrustadas en poco ruido, a menudo se requiere un orden muy superior al doble del número de componentes para capturar y mapear espectralmente estas oscilaciones. En otras palabras, si el orden es demasiado pequeño, solo se detecta una parte de la señal determinista y el resto se interpreta como ruido. Por lo tanto, se pierden componentes espectrales.
Si, por el contrario, el orden es demasiado alto, se capta totalmente la señal determinista, pero también se modela parte del ruido. Entonces pueden aparecer pequeños picos adicionales en el espectro.
Hay tres maneras de hacer frente a estas restricciones. En primer lugar, se puede filtrar el ruido antes de analizarlo. En segundo lugar, se puede determinar un orden óptimo del modelo que capte todos los componentes de la señal y, al mismo tiempo, modele el menor ruido posible. La tercera opción es la supresión integrada del ruido mediante los algoritmos de mínimos cuadrados que calculan los coeficientes. Se recomienda esta última alternativa.
Selección de los modos propios de la señal
En lugar de intentar encontrar un orden óptimo del modelo, se puede llevar a cabo una separación explícita de la señal y el ruido. A medida que aumenta el orden, se dispone de un número creciente de coeficientes para mapear la señal y el ruido. Si se utiliza un algoritmo matricial basado en componentes principales, los primeros vectores propios describen los componentes de la señal y los siguientes, el ruido. El orden del modelo es entonces menos importante, ya que los vectores asignados al ruido no se tienen en cuenta al calcular los coeficientes AR.
Esta separación integrada de señal y ruido se consigue mediante la descomposición en valores singulares (SVD) en los algoritmos de mínimos cuadrados. Esta opción se utiliza en todos los algoritmos AR y ARMA con SVD. Los modos propios obtenidos deben representar la señal o los componentes principales, ya que estos contribuyen al resultado del cálculo. Los modos propios descartados solo deben asignarse al ruido, ya que se eliminan y no contribuyen al resultado. Esta separación de ruido y señal es parte integrante de los procedimientos SVD. Para analizar los componentes de banda estrecha se necesitan dos modos propios de señal por componente. Para una señal con tres componentes espectrales, por ejemplo, el subespacio de señal debe fijarse en seis.
Espectros AR continuos
Los espectros de frecuencia AR no incluyen ningún filtrado de la secuencia de datos, salvo la determinación de una medida global de ruido blanco. Por eso los espectros AR son tan suaves. Los coeficientes AR solo modelan componentes deterministas, mientras que el ruido se registra como una constante que corresponde a la varianza del ruido blanco o al residuo de la aproximación. La transformación de frecuencia AR solo utiliza los coeficientes AR y esta varianza del ruido blanco. El resultado es una función continua de la frecuencia.
Cada uno de los algoritmos FlexPro AR genera una estimación del ruido blanco. Esta variación influye en la altura, pero no en la forma ni en la frecuencia de los picos espectrales. Los errores en la estimación de esta varianza del ruido se incluyen en el espectro AR como errores de amplitud. Los algoritmos Burg y de autocorrelación suelen generar errores de predicción distribuidos normalmente y espectros AR cuya integral está muy próxima a la potencia de la señal. Esto puede no aplicarse a los algoritmos de mínimos cuadrados.
A menudo puede lograrse una aproximación satisfactoria de un modelo AR a los componentes de la señal con conjuntos de datos muy pequeños y se obtiene un espectro de muy alta resolución. Un estimador espectral AR suele mostrar picos impresionantemente nítidos y estos se aproximan mucho a la frecuencia exacta de los componentes espectrales existentes. En un modelo AR, las frecuencias se determinan directamente a partir de las raíces del modelo. Por lo tanto, no es necesario buscar máximos locales en el espectro.
Si comparamos los métodos AR con la FFT, nos damos cuenta de que la FFT es más fácil de manejar en muchos aspectos. Una FFT requiere cierta optimización, como la elección de una ventana adecuada, la longitud del segmento y el solapamiento o el número de ceros que hay que añadir, pero es difícil obtener un resultado totalmente incorrecto. Los efectos de los parámetros individuales de los algoritmos FFT también son bastante intuitivos. Esto no siempre se aplica a los espectros AR.
Véase también
Objeto de análisis Estimador espectral - estimador espectral AR
Objeto de análisis Estimador espectral - estimador espectral ARMA