Saltar navegación

Documentación de FlexPro 2025

Algoritmo LOESS/LOWESS

LOESS y LOWESS son procedimientos de alisado muy comunes que utilizan una función de regresión ponderada localmente (locally weighted regression).

El procedimiento utiliza una función de ponderación que hace que la influencia de los valores vecinos en el alisado en una determinada posición disminuya a medida que se alejan de dicha posición. Los valores atípicos se ponderan menos que con otros procedimientos. La elección del ancho de alisado, que refleja el número de valores incluidos en el cálculo para un punto, es decisiva. Además, se utilizan dos tipos de ponderaciones, las ponderaciones de vecindad y las ponderaciones de robustez.

1.er paso:

En el primer paso del proceso se determina el rango de los puntos que deben incluirse. Se especifica el número n de estos puntos. Cuanto mayor sea este valor, más lisa será finalmente la curva ajustada. El rango se define de modo que exactamente n valores, incluido el propio punto seleccionado, se encuentren en el intervalo y que el punto seleccionado se encuentre en el centro del rango seleccionado. Por lo tanto, es posible que el número de vecinos izquierdos y derechos sea diferente. El primer valor, por ejemplo, solo tiene vecinos por la derecha.

2.º paso:

En el segundo paso, se determinan las ponderaciones para el alisado de regresión ponderado localmente. La función de ponderación se define mediante:

para k = 1,…,N

 

di es la distancia de xi al enésimo punto vecino. La función de ponderación es simétrica. El mayor valor se alcanza en la posición xi. El valor en los límites de rango es 0.

3.er paso:

Ahora se realiza el alisado de regresión. Para el procedimiento LOWESS se estima una función de regresión lineal mediante el método de los mínimos cuadrados. El procedimiento LOESS, por su parte, utiliza una función cuadrática.

Los parámetros deben calcularse de forma que se minimice la siguiente función:

 

LOWESS:

 

LOESS:

 

4.º paso:

Al estimar la función de regresión lineal en los rangos individuales, solo se incluyen relativamente pocos valores de observación. En consecuencia, siempre es posible que la función de regresión estimada esté influida en mayor o menor medida por posibles valores atípicos. Por lo tanto, las llamadas ponderaciones de robustez se determinan en un cuarto paso. Para determinar las ponderaciones, se calculan los residuos de los valores estimados anteriormente y la mediana.

Las ponderaciones de robustez se calculan mediante la siguiente fórmula:

La ponderación de la robustez es 0 si un residuo es mayor o igual que 6m (m = mediana de los residuos). Esto elimina los valores atípicos.

Las ponderaciones de robustez, multiplicadas por las ponderaciones de vecindad, se utilizan para volver a estimar una función de regresión lineal dentro de los rangos individuales:

LOWESS:

LOESS:

 

El resultado es una serie de nuevos valores alisados. El procedimiento puede repetirse varias veces. Cuanto mayor sea el número de iteraciones, más preciso será el ajuste de curva, aunque aumentar aún más un número ya elevado de iteraciones apenas aporta mejoras visibles.

Bibliografía

Cleveland, W.S. (1979). Robust Locally Weighted Regression and Smoothing Scatterplots. Journal of the American Statistical Association, vol. 74, pág. 829-836.