Implementación de hojas de cálculo de ajuste estacional y suavizado exponencial Es sencillo realizar ajustes estacionales y ajustar modelos de suavizado exponencial utilizando Excel. Las imágenes y gráficos de pantalla que se muestran a continuación se toman de una hoja de cálculo que se ha configurado para ilustrar el ajuste estacional multiplicativo y el suavizado lineal exponencial en los siguientes datos de ventas trimestrales de Outboard Marine: Para obtener una copia del archivo de la hoja de cálculo, haga clic aquí. La versión de suavizado exponencial lineal que se utilizará aquí para propósitos de demostración es la versión de Brown8217s, simplemente porque puede implementarse con una sola columna de fórmulas y sólo hay una constante de suavizado para optimizar. Por lo general, es mejor usar la versión de Holt8217s que tiene constantes de suavizado separadas para nivel y tendencia. El proceso de pronóstico se desarrolla de la siguiente manera: (i) en primer lugar los datos se ajustan estacionalmente (ii) luego se generan pronósticos para los datos desestacionalizados a través de la suavización exponencial lineal y (iii) finalmente los pronósticos desestacionalizados son quotorasonalizados para obtener pronósticos para la serie original . El proceso de ajuste estacional se lleva a cabo en las columnas D a G. El primer paso en el ajuste estacional es calcular una media móvil centrada (realizada aquí en la columna D). Esto puede hacerse tomando el promedio de dos promedios de un año que son compensados por un período entre sí. (Se necesita una combinación de dos promedios de compensación en lugar de un solo promedio para fines de centrado cuando el número de estaciones es par.) El siguiente paso es calcular la relación con el promedio móvil - ie. Los datos originales divididos por la media móvil en cada período - que se realiza aquí en la columna E. (Esto también se llama el componente quottrend-cyclequot del patrón, en la medida en que los efectos de tendencia y de ciclo de negocio podrían ser considerados como todo lo que Por supuesto, los cambios mensuales que no son debidos a la estacionalidad podrían ser determinados por muchos otros factores, pero el promedio de 12 meses suaviza sobre ellos en gran medida. El índice estacional estimado para cada estación se calcula primero haciendo un promedio de todas las razones para esa estación particular, que se hace en las células G3-G6 usando una fórmula de AVERAGEIF. Las relaciones medias se vuelven a escalar de modo que suman exactamente 100 veces el número de períodos en una estación, o 400 en este caso, lo que se hace en las células H3-H6. En la columna F, las fórmulas VLOOKUP se usan para insertar el valor de índice estacional apropiado en cada fila de la tabla de datos, de acuerdo con el trimestre del año que representa. La media móvil centrada y los datos desestacionalizados terminan pareciendo esto: Obsérvese que la media móvil normalmente se parece a una versión más suave de la serie ajustada estacionalmente, y es más corta en ambos extremos. Otra hoja de trabajo en el mismo archivo de Excel muestra la aplicación del modelo de suavizado exponencial lineal a los datos desestacionalizados, empezando en la columna G. Un valor para la constante de suavizado (alfa) se introduce por encima de la columna de pronóstico (aquí en la celda H9) y Por comodidad se le asigna el nombre de rango quotAlpha. quot (El nombre se asigna mediante el mandato quotInsert / Name / Createquot). El modelo LES se inicializa estableciendo los dos primeros pronósticos igual al primer valor real de la serie ajustada estacionalmente. La fórmula utilizada aquí para la previsión de LES es la forma recursiva de una sola ecuación del modelo Brown8217s: Esta fórmula se introduce en la celda correspondiente al tercer período (aquí, célula H15) y se copia desde allí. Obsérvese que la previsión de LES para el período actual se refiere a las dos observaciones precedentes ya los dos errores de pronóstico precedentes, así como al valor de alfa. Por lo tanto, la fórmula de pronóstico en la fila 15 se refiere sólo a los datos que estaban disponibles en la fila 14 y anteriores. (Por supuesto, si deseamos usar el suavizado exponencial lineal simple en vez de lineal, podríamos sustituir la fórmula SES aquí en lugar. También podríamos usar Holt8217s en lugar de Brown8217s modelo LES, lo que requeriría dos columnas más de fórmulas para calcular el nivel y la tendencia Que se utilizan en la previsión). Los errores se calculan en la siguiente columna (aquí, columna J) restando las previsiones de los valores reales. El error cuadrático medio raíz se calcula como la raíz cuadrada de la varianza de los errores más el cuadrado de la media. En el cálculo de la media y la varianza de los errores en esta fórmula, se excluyen los dos primeros períodos porque el modelo no comienza realmente a pronosticar hasta el momento en que se calcula la media y la varianza de los errores en esta fórmula. El tercer período (fila 15 en la hoja de cálculo). El valor óptimo de alpha se puede encontrar cambiando manualmente alfa hasta que se encuentre el RMSE mínimo, o bien puede usar el quotSolverquot para realizar una minimización exacta. El valor de alfa que encontró el Solver se muestra aquí (alpha0.471). Por lo general, es una buena idea trazar los errores del modelo (en unidades transformadas) y también calcular y trazar sus autocorrelaciones en retrasos de hasta una temporada. Las correlaciones de error se calculan usando la función CORREL () para calcular las correlaciones de los errores con ellos mismos rezagados por uno o más períodos - los detalles se muestran en el modelo de hoja de cálculo . Aquí hay una gráfica de las autocorrelaciones de los errores en los primeros cinco retrasos: Las autocorrelaciones en los retornos 1 a 3 son muy cercanas a cero, pero el pico con retraso 4 (cuyo valor es 0,35) es ligeramente problemático. El proceso de ajuste estacional no ha sido completamente exitoso. Sin embargo, en realidad sólo es marginalmente significativo. 95 para determinar si las autocorrelaciones son significativamente diferentes de cero son más o menos 2 / SQRT (n-k), donde n es el tamaño de la muestra yk es el retraso. Aquí n es 38 y k varía de 1 a 5, por lo que la raíz cuadrada de - n-menos-k es de alrededor de 6 para todos ellos, y por lo tanto los límites para probar la significación estadística de las desviaciones de cero son más o menos - O-menos 2/6, o 0,33. Si se modifica el valor de alfa manualmente en este modelo de Excel, se puede observar el efecto en las gráficas de series de tiempo y de autocorrelación de los errores, así como en el error de cuadrícula media raíz que se ilustrará a continuación. En la parte inferior de la hoja de cálculo, la fórmula de pronóstico se quotbootrapeado en el futuro mediante la simple sustitución de los pronósticos de los valores reales en el punto en que se agotan los datos reales, es decir, Donde comienza el futuro. (En otras palabras, en cada celda donde ocurrirá un valor de datos futuro, se inserta una referencia de celda que apunta a la previsión hecha para ese período). Todas las otras fórmulas son simplemente copiadas desde arriba: Obsérvese que los errores para las previsiones de El futuro se calcula que es cero. Esto no significa que los errores reales sean cero, sino que simplemente refleja el hecho de que para propósitos de predicción estamos asumiendo que los datos futuros serán iguales a los pronósticos en promedio. Las previsiones de LES para los datos desestacionalizados se ven así: Con este valor particular de alfa, que es óptimo para predicciones de un período de anticipación, la tendencia proyectada es levemente ascendente, reflejando la tendencia local que se observó en los últimos 2 años más o menos. Para otros valores de alfa, se podría obtener una proyección de tendencia muy diferente. Por lo general, es una buena idea ver qué sucede con la proyección de tendencia a largo plazo cuando el alfa es variado, porque el valor que es mejor para pronósticos a corto plazo no será necesariamente el mejor valor para predecir el futuro más lejano. Por ejemplo, aquí está el resultado que se obtiene si el valor de alpha se establece manualmente en 0.25: La tendencia a largo plazo proyectada es ahora negativa en lugar de positiva Con un valor menor de alfa, el modelo está poniendo más peso en datos antiguos en Su estimación del nivel y tendencia actual y sus previsiones a largo plazo reflejan la tendencia a la baja observada en los últimos 5 años en lugar de la tendencia al alza más reciente. Este gráfico también ilustra claramente cómo el modelo con un valor menor de alpha es más lento para responder a los puntos de quotturning en los datos y por lo tanto tiende a hacer un error del mismo signo para muchos períodos en una fila. Sus errores de pronóstico de 1 paso son mayores en promedio que los obtenidos antes (RMSE de 34,4 en lugar de 27,4) y fuertemente positivamente autocorrelacionados. La autocorrelación lag-1 de 0,56 excede en gran medida el valor de 0,33 calculado anteriormente para una desviación estadísticamente significativa de cero. Como alternativa a la disminución del valor de alfa para introducir un mayor conservadurismo en los pronósticos a largo plazo, a veces se añade al modelo un factor quottrend de amortiguación para hacer que la tendencia proyectada se aplaste después de unos pocos períodos. El paso final en la construcción del modelo de predicción es el de la obtención de la razón de los pronósticos de LES, multiplicándolos por los índices estacionales apropiados. Por lo tanto, las previsiones reseasonalized en la columna I son simplemente el producto de los índices estacionales en la columna F y las previsiones desestacionalizadas de LES en la columna H. Es relativamente fácil calcular intervalos de confianza para los pronósticos de un paso adelante realizados por este modelo: primero Calcular el RMSE (error cuadrático-medio cuadrático, que es sólo la raíz cuadrada del MSE) y luego calcular un intervalo de confianza para el pronóstico ajustado estacionalmente sumando y restando dos veces el RMSE. (En general, un intervalo de confianza de 95 para un pronóstico de un período por delante es aproximadamente igual al punto de previsión más o menos dos veces la desviación estándar estimada de los errores de pronóstico, suponiendo que la distribución del error es aproximadamente normal y el tamaño de la muestra Es lo suficientemente grande, por ejemplo, 20 o más. En este caso, el RMSE en lugar de la desviación estándar de la muestra de los errores es la mejor estimación de la desviación estándar de futuros errores de pronóstico, ya que toma el sesgo, así como las variaciones aleatorias en cuenta. Para el pronóstico estacionalmente ajustado son entonces reseasonalized. Junto con el pronóstico, multiplicándolos por los índices estacionales apropiados. En este caso el RMSE es igual a 27,4 y la previsión desestacionalizada para el primer período futuro (Dic-93) es de 273,2. Por lo que el intervalo de confianza estacionalmente ajustado es de 273.2-227.4 218.4 a 273.2227.4 328.0. Multiplicando estos límites por Decembers índice estacional de 68,61. Obtenemos límites de confianza inferiores y superiores de 149,8 y 225,0 en torno al pronóstico del punto Dec-93 de 187,4. Los límites de confianza para los pronósticos más de un período por delante se ampliarán generalmente a medida que aumenta el horizonte de pronóstico, debido a la incertidumbre sobre el nivel y la tendencia, así como los factores estacionales, pero es difícil calcularlos en general por métodos analíticos. (La forma apropiada de calcular los límites de confianza para la previsión de LES es utilizando la teoría ARIMA, pero la incertidumbre en los índices estacionales es otra cuestión.) Si desea un intervalo de confianza realista para un pronóstico de más de un período, tomando todas las fuentes de Su mejor opción es utilizar métodos empíricos: por ejemplo, para obtener un intervalo de confianza para un pronóstico de dos pasos adelante, podría crear otra columna en la hoja de cálculo para calcular un pronóstico de dos pasos adelante para cada período ( Iniciando el pronóstico de un paso adelante). A continuación, calcular el RMSE de los errores de pronóstico de 2 pasos adelante y utilizar esto como la base para un intervalo de confianza de 2 pasos adelante. Moving promedios Desplazamiento de fase es la diferencia en la detección de puntos de giro entre los datos originales y suavizado. Este efecto es un inconveniente, ya que provoca un retraso en la detección de los puntos de inflexión de la serie temporal, especialmente en el período más actual. Las medias móviles simétricas centradas son resistentes a este efecto. Sin embargo, al final (y al principio) de series temporales no se pueden usar series temporales simétricas. Para calcular los valores suavizados en los dos extremos de la serie temporal se utiliza el filtro asimétrico, sin embargo causan el efecto de fase. Etiquetas / palabras clave: Puede hacer clic y arrastrar en el área de trazado para acercarse Puede pasar el ratón sobre los puntos de datos para ver el valor real que se representa gráficamente Si hay un cuadro de leyenda, haga clic en el nombre de la serie para ocultarlos / Son promedios aritméticos aplicados a intervalos de tiempo sucesivos de longitud fija de la serie. Cuando se aplican a la serie temporal original, producen una serie de valores promediados. La fórmula general para mover el promedio M de coeficientes es: Los coeficientes promedios móviles se llaman pesos. La cantidad p f 1 es el orden del promedio móvil. El promedio móvil se llama centrado si el número de observaciones en el pasado es igual al número de observación en el futuro (es decir, si p es igual a f). Los promedios móviles reemplazan la serie temporal original por las medias ponderadas de los valores actuales, p observaciones anteriores a la observación actual y f observaciones después de la observación actual. Se utilizan para suavizar la serie de tiempo original. Ejemplo En el cuadro se presenta el número de pasajeros que viajan por vía aérea informados por Finlandia en 2001. Los mismos datos se presentan en el gráfico: Tipos de promedios móviles Sobre la base de patrones de ponderación, las medias móviles pueden ser: Simétrica el patrón de pesaje utilizado para calcular movimientos Los promedios son simétricos con respecto al punto de datos objetivo. Por medio de medias móviles simétricas no es posible obtener los valores suavizados para las primeras p y últimas p observaciones (para las medias móviles simétricas pf). Ejemplo Asimétrico el patrón de pesaje utilizado para calcular promedios móviles no es simétrico con respecto al punto de destino. Ejemplo Las medias móviles también se pueden clasificar según su contribución al valor final como: Promedios móviles simples, es decir, las medias móviles para las cuales todos los pesos son iguales En el caso de los promedios móviles simples, todas las observaciones contribuyen igualmente al valor final. Huelga decir que todos los promedios móviles simples son simétricos. Formalmente, para el promedio móvil simétrico de orden P 2p 1 todos los pesos son iguales a 1 / P. Ejemplo La siguiente imagen compara el grado de suavizado logrado aplicando promedios móviles sencillos de 3 y 7 términos. Las observaciones extremas (por ejemplo, abril de 2010 o junio de 2011) tienen menor impacto en el promedio móvil más largo que en el más corto. Medias móviles no simples, es decir, las medias móviles para las cuales todos los pesos no son los mismos. Los casos especiales de promedios móviles no simples son: promedios móviles compuestos, que se obtiene al componer una media móvil simple de orden P, cuyos coeficientes son todos iguales a 1 P y una media móvil simple de orden Q, cuyos coeficientes son todos iguales A 1 Q. Medias móviles asimétricas. Propiedades de las medias móviles Las medias móviles son más suaves para la serie temporal. Cuando se aplican a una serie temporal, reducen la amplitud de las fluctuaciones observadas y actúan como un filtro que elimina los movimientos irregulares de la misma. Las medias móviles con el patrón de ponderación adecuado se pueden utilizar para eliminar ciclos de una cierta longitud en la serie temporal. En el método de ajuste estacional X-12-ARIMA se utilizan diferentes tipos de promedios móviles para estimar el componente de ciclo tendencial y estacional. Si la suma de los coeficientes es igual a 1, entonces el promedio móvil preserva la tendencia. Los promedios móviles tienen dos incumplimientos importantes: No son robustos y pueden ser profundamente afectados por valores atípicos El suavizado en los extremos de la serie no puede hacerse sino con medias móviles asimétricas que introducen cambios de fase y retrasos en la detección de puntos de giro En el método X11 , Los promedios móviles simétricos juegan un papel importante ya que no introducen ningún cambio de fase en la serie suavizada. Pero, para evitar la pérdida de información en los extremos de las series, se complementan con promedios móviles asimétricos ad hoc o se aplican en la serie completada por las previsiones. Right boxTime Series Analysis: El proceso de ajuste estacional ¿Cuáles son las dos filosofías principales del ajuste estacional ¿Qué es un filtro ¿Cuál es el problema del punto final ¿Cómo decidimos qué filtro utilizar ¿Qué es una función de ganancia ¿Qué es un cambio de fase ¿Qué son Henderson Promedios móviles Cómo lidiar con el problema del punto final ¿Qué son los promedios móviles estacionales? ¿Por qué se revisan las estimaciones de tendencia? ¿Cuántos datos se requieren para obtener estimaciones aceptables desestacionalizadas? AVANZADO ¿Cómo se comparan las dos filosofías de ajuste estacional? ¿CUÁLES SON LAS DOS PRINCIPALES FILOSOFÍAS DEL AJUSTE ESTACIONAL? Las dos principales filosofías para el ajuste estacional son el método basado en modelos y el método basado en filtros. Métodos basados en filtros Este método aplica un conjunto de filtros fijos (medias móviles) para descomponer la serie temporal en una tendencia, componente estacional e irregular. La noción subyacente es que los datos económicos se componen de una serie de ciclos, incluidos los ciclos económicos (la tendencia), los ciclos estacionales (estacionalidad) y el ruido (componente irregular). Un filtro esencialmente elimina o reduce la resistencia de ciertos ciclos de los datos de entrada. Para producir una serie ajustada estacionalmente de los datos recolectados mensualmente, los eventos que ocurren cada 12, 6, 4, 3, 2.4 y 2 meses necesitan ser removidos. Corresponden a frecuencias estacionales de 1, 2, 3, 4, 5 y 6 ciclos por año. Los ciclos no estacionales más largos se consideran parte de la tendencia y los ciclos no estacionales más cortos forman el irregular. Sin embargo, el límite entre la tendencia y ciclos irregulares puede variar con la longitud del filtro utilizado para obtener la tendencia. En el ajuste estacional del ABS, los ciclos que contribuyen significativamente a la tendencia son típicamente más grandes que cerca de 8 meses para series mensuales y 4 cuartos para series trimestrales. La tendencia, los componentes estacionales e irregulares no necesitan modelos individuales explícitos. El componente irregular se define como lo que queda después de la tendencia y los componentes estacionales han sido eliminados por los filtros. Los irregulares no muestran características de ruido blanco. Los métodos basados en filtros se conocen a menudo como métodos de estilo X11. Estos incluyen X11 (desarrollado por la Oficina del Censo de los EE. UU.), X11ARIMA (desarrollado por Estadísticas Canadá), X12ARIMA (desarrollado por la Oficina del Censo de los EE. UU.), STL, SABL y SEASABS (el paquete utilizado por el ABS). Las diferencias computacionales entre varios métodos en la familia X11 son principalmente el resultado de diferentes técnicas utilizadas en los extremos de la serie temporal. Por ejemplo, algunos métodos utilizan filtros asimétricos en los extremos, mientras que otros métodos extrapolan la serie temporal y aplican filtros simétricos a la serie extendida. Métodos basados en modelos Este enfoque requiere que la tendencia, los componentes estacionales e irregulares de las series temporales se modelen por separado. Asume que el componente irregular es el ruido blanco 8221 - es decir todas las longitudes de ciclo están representadas igualmente. Los irregulares tienen una media cero y una varianza constante. El componente estacional tiene su propio elemento de ruido. Dos paquetes de software ampliamente utilizados que aplican métodos basados en modelos son STAMP y SEATS / TRAMO (desarrollados por el Banco de España).Las principales diferencias computacionales entre los distintos métodos basados en modelos suelen ser debido a las especificaciones del modelo, en algunos casos los componentes son modelados directamente. Para comparar las dos filosofías a un nivel más avanzado, vea ¿Cómo se comparan las dos filosofías de ajuste estacional? ¿QUÉ ES UN FILTRO? Los filtros pueden ser usados Para descomponer una serie de tiempo en un componente de tendencia, estacional e irregular. Las medias móviles son un tipo de filtro que sucesivamente promedio de un tiempo de cambio de los datos con el fin de producir una estimación suavizada de una serie de tiempo. Esta serie suavizada se puede considerar que tienen Se ha derivado de la ejecución de una serie de entrada a través de un proceso que filtra ciertos ciclos. En consecuencia, un promedio móvil se refiere a menudo como un filtro. El proceso básico implica definir un conjunto de pesos de longitud m 1 m 2 1 como: Nota: un conjunto simétrico de pesos tiene m 1 m 2 y wjw - j Un valor filtrado en el tiempo t puede ser calculado por donde Y t describe el valor De la serie temporal en el tiempo t. Por ejemplo, considere las siguientes series: Usando un filtro simétrico simple de 3 términos (es decir m 1 m 2 1 y todos los pesos son 1/3), el primer término de la serie suavizada se obtiene aplicando los pesos a los tres primeros términos de La serie original: El segundo valor suavizado se produce aplicando los pesos al segundo, tercero y cuarto términos de la serie original: ¿CUÁL ES EL PROBLEMA DEL PUNTO FINAL Reconsiderar la serie: Esta serie contiene 8 términos. Sin embargo, la serie suavizada obtenida mediante la aplicación de filtro simétrico a los datos originales contiene sólo 6 términos: Esto se debe a que no hay suficientes datos en los extremos de la serie para aplicar un filtro simétrico. El primer término de la serie suavizada es un promedio ponderado de tres términos, centrado en el segundo término de la serie original. Un promedio ponderado centrado en el primer término de la serie original no puede obtenerse como datos antes de que este punto no esté disponible. Del mismo modo, no es posible calcular un promedio ponderado centrado en el último término de la serie, ya que no hay datos después de este punto. Por esta razón, los filtros simétricos no pueden utilizarse en ningún extremo de una serie. Esto se conoce como el problema del punto final. Los analistas de series temporales pueden usar filtros asimétricos para producir estimaciones suavizadas en estas regiones. En este caso, el valor suavizado se calcula 8216 fuera del centro8217, con el promedio que se determina usando más datos de un lado del punto que el otro según lo que está disponible. Alternativamente, se pueden usar técnicas de modelado para extrapolar las series temporales y luego aplicar filtros simétricos a la serie extendida. CÓMO DECIDIMOS A QUÉ FILTRO USAR El analista de series temporales elige un filtro apropiado basado en sus propiedades, tales como los ciclos que el filtro quita cuando se aplica. Las propiedades de un filtro pueden ser investigadas usando una función de ganancia. Las funciones de ganancia se usan para examinar el efecto de un filtro en una frecuencia dada sobre la amplitud de un ciclo para una serie temporal determinada. Para obtener más detalles sobre las matemáticas asociadas con las funciones de ganancia, puede descargar las Notas del curso de la serie temporal, una guía introductoria al análisis de series de tiempo publicada por la Sección de análisis de series temporales del ABS (consulte la sección 4.4). El siguiente diagrama es la función de ganancia para el filtro de 3 terminales simétrico que estudiamos anteriormente. Figura 1: Función de ganancia para el filtro simétrico de 3 períodos El eje horizontal representa la longitud de un ciclo de entrada en relación con el período entre puntos de observación en la serie temporal original. Así que un ciclo de entrada de longitud 2 se completa en 2 períodos, que representa 2 meses para una serie mensual, y 2 cuartos para una serie trimestral. El eje vertical muestra la amplitud del ciclo de salida en relación con un ciclo de entrada. Este filtro reduce la intensidad de los ciclos de 3 periodos a cero. Es decir, elimina completamente ciclos de aproximadamente esta longitud. Esto significa que para una serie de tiempo en la que los datos se recogen mensualmente, se eliminarán todos los efectos estacionales que se produzcan trimestralmente aplicando este filtro a la serie original. Un cambio de fase es el cambio de tiempo entre el ciclo filtrado y el ciclo sin filtrar. Un cambio de fase positivo significa que el ciclo filtrado se desplaza hacia atrás y un desplazamiento de fase negativo se desplaza hacia delante en el tiempo. El cambio de fase ocurre cuando el momento de los puntos de giro está distorsionado, por ejemplo cuando el promedio móvil se coloca descentrado por los filtros asimétricos. Es decir, se producirán antes o después en la serie filtrada, que en el original. Las medias móviles simétricas de longitud impar (como las usadas por el ABS), donde el resultado está colocado centralmente, no causan desplazamiento de fase de tiempo. Es importante que los filtros utilizados deriven la tendencia a retener la fase de tiempo, y por lo tanto el tiempo de cualquier punto de inflexión. Las Figuras 2 y 3 muestran los efectos de la aplicación de una media móvil simétrica 2x12 que está descentrada. Las curvas continuas representan los ciclos iniciales y las curvas rotas representan los ciclos de salida después de aplicar el filtro de media móvil. Figura 2: Ciclo de 24 meses, Fase -5,5 meses Amplitud 63 Figura 3: Ciclo de 8 meses, Fase -1,5 meses Amplitud 22 ¿QUÉ SON LAS TASAS DE MOVIMIENTO DE HENDERSON Las medias móviles de Henderson son filtros que fueron obtenidos por Robert Henderson en 1916 para su uso en aplicaciones actuariales. Son filtros de tendencia, comúnmente utilizados en el análisis de series de tiempo para suavizar las estimaciones ajustadas estacionalmente para generar una estimación de tendencia. Se utilizan con preferencia a las medias móviles más simples, ya que pueden reproducir polinomios de hasta el grado 3, capturando así los puntos de inflexión de la tendencia. El ABS utiliza los promedios móviles de Henderson para producir estimaciones de tendencia de una serie ajustada estacionalmente. Las estimaciones de tendencia publicadas por el ABS se derivan típicamente utilizando un filtro de Henderson de 13 términos para series mensuales y un filtro de Henderson de siete términos para series trimestrales. Los filtros de Henderson pueden ser simétricos o asimétricos. Las medias móviles simétricas pueden aplicarse en puntos que estén lo suficientemente alejados de los extremos de una serie temporal. En este caso, el valor suavizado para un punto dado en la serie temporal se calcula a partir de un número igual de valores a cada lado del punto de datos. Para obtener los pesos, se alcanza un compromiso entre las dos características generalmente esperadas de una serie de tendencias. Estos son que la tendencia debe ser capaz de representar una amplia gama de curvaturas y que también debe ser lo más suave posible. Para la derivación matemática de los pesos, refiérase a la sección 5.3 de las notas del curso de la serie cronológica. Que se puede descargar gratuitamente desde el sitio web de ABS. Los patrones de ponderación para una gama de promedios móviles de Henderson simétricos se muestran en la siguiente tabla: Patrón de ponderación simétrica para Henderson Moving Average En general, cuanto más largo sea el filtro de tendencia, más suave será la tendencia resultante, como resulta evidente de una comparación de las funciones de ganancia encima. Un Henderson de 5 términos reduce ciclos de aproximadamente 2,4 períodos o menos en al menos 80, mientras que un término de 23 Henderson reduce los ciclos de aproximadamente 8 períodos o menos en al menos 90. De hecho, un filtro de Henderson de 23 términos elimina completamente los ciclos de menos de 4 períodos . Los promedios móviles de Henderson también atenúan los ciclos estacionales en diversos grados. Sin embargo, las funciones de ganancia en las Figuras 4-8 muestran que los ciclos anuales en series mensuales y trimestrales no se amortiguan significativamente para justificar la aplicación directa de un filtro de Henderson a las estimaciones originales. Esta es la razón por la que sólo se aplican a una serie ajustada estacionalmente, donde ya se han eliminado los efectos relacionados con el calendario con filtros diseñados específicamente. La Figura 9 muestra los efectos de suavizado de la aplicación de un filtro Henderson a una serie: Figura 9: Filtro de Henderson de 23 términos - Valor de las aprobaciones de edificios no residenciales ¿CÓMO SE TRATA DEL PROBLEMA DE PUNTO FINAL El filtro Henderson simétrico sólo puede aplicarse a regiones De datos suficientemente alejados de los extremos de la serie. Por ejemplo, el término estándar Henderson solo puede aplicarse a datos mensuales que sean al menos 6 observaciones desde el inicio o el final de los datos. Esto se debe a que la suavidad del filtro de la serie tomando un promedio ponderado de los 6 términos a cada lado del punto de datos, así como el punto en sí. Si intentamos aplicarlo a un punto que es menos de 6 observaciones desde el final de los datos, entonces no hay suficientes datos disponibles en un lado del punto para calcular el promedio. Para proporcionar estimaciones de tendencia de estos puntos de datos, se utiliza una media móvil modificada o asimétrica. El cálculo de filtros Henderson asimétricos puede generarse mediante una serie de métodos diferentes que producen resultados similares pero no idénticos. Los cuatro métodos principales son el método de Musgrave, el método de minimización del cuadrado medio, el método Best Lineal Unbiased Estimates (AZUL) y el método de Kenny y Durbin. Shiskin et. Al (1967) derivaron los pesos asimétricos originales para la media móvil de Henderson que se usan dentro de los paquetes X11. Para obtener información sobre la derivación de los pesos asimétricos, consulte la sección 5.3 de las notas de los cursos de la serie temporal. Consideremos una serie de tiempo en la que el último punto de datos observado ocurre en el tiempo N. Entonces, un filtro de Henderson de 13 términos simétricos no puede aplicarse a puntos de datos que se miden en cualquier momento después e incluyendo el tiempo N-5. Para todos estos puntos, se debe utilizar un conjunto asimétrico de pesos. La siguiente tabla muestra el patrón de ponderación asimétrica para un promedio móvil de Henderson estándar de 13 términos. Los filtros de Henderson de 13 términos asimétricos no eliminan ni amortiguan los mismos ciclos que el filtro de Henderson de 13 términos simétricos. De hecho, el patrón de ponderación asimétrica utilizado para estimar la tendencia en la última observación amplifica la fuerza de los ciclos de 12 periodos. También los filtros asimétricos producen algún cambio de fase de tiempo. CUÁLES SON LOS MOMENTOS MOVILES ESTACIONALES Casi todos los datos investigados por el ABS tienen características estacionales. Dado que los promedios móviles de Henderson utilizados para estimar la serie de tendencias no eliminan la estacionalidad, los datos deben ajustarse estacionalmente primero usando filtros estacionales. Un filtro estacional tiene pesos que se aplican al mismo período en el tiempo. Un ejemplo del patrón de ponderación para un filtro estacional sería: (1/3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3) donde, por ejemplo, se aplica un peso de un tercio a tres enero consecutivos. Dentro de X11, una serie de filtros estacionales están disponibles para elegir. Se trata de un promedio móvil ponderado de 3 términos (ma) S 3x1. Ponderado a 5-plazo ma S 3x3. Ponderado 7-plazo ma S 3x5. Y un término ponderado de 11 meses S 3x9. La estructura de ponderación de los promedios móviles ponderados de la forma, S nxm. Es que se calcula un promedio simple de m términos, y entonces se determina una media móvil de n de estos promedios. Esto significa que los términos nm-1 se usan para calcular cada valor suavizado final. Por ejemplo, para calcular un término de 11 S 3x9. Un peso de 1/9 se aplica al mismo período en 9 años consecutivos. A continuación, se aplica un promedio móvil de 3 términos simple a través de los valores promediados: Esto da un patrón de ponderación final de (1/27, 2/27, 1/9, 1/9, 1/9, 1/9, 1/9, 1/9, 1/9, 2/27, 1/27). La función de ganancia para un filtro estacional de 11 términos, S 3x9. La aplicación de un filtro estacional a los datos generará una estimación del componente estacional de la serie temporal, ya que preserva la fuerza de los armónicos estacionales y amortigua los ciclos de no - Longitudes estacionales. Los filtros estacionales asimétricos se utilizan en los extremos de la serie. Los pesos asimétricos para cada uno de los filtros estacionales utilizados en X11 se pueden encontrar en la sección 5.4 de las notas de los cursos de la serie temporal. ¿POR QUÉ SE REVISAN LAS ESTIMACIONES DE LAS TENDENCIAS? En el extremo actual de una serie temporal, no es posible utilizar filtros simétricos para estimar la tendencia debido al problema del punto final. En su lugar, se utilizan filtros asimétricos para producir estimaciones de tendencias provisionales. Sin embargo, a medida que se dispone de más datos, es posible volver a calcular la tendencia utilizando filtros simétricos y mejorar las estimaciones iniciales. Esto se conoce como una revisión de tendencias. CUÁNTOS DATOS SE REQUIEREN PARA OBTENER ESTIMACIONES ACEPTADAS AJUSTADAS ESTACIONALMENTE Si una serie temporal presenta estacionalidad relativamente estable y no está dominada por el componente irregular, entonces los datos de 5 años pueden considerarse una longitud aceptable para obtener estimaciones desestacionalizadas de. Para una serie que muestra estacionalidad particularmente fuerte y estable, se puede hacer un ajuste bruto con 3 años de datos. Por lo general, es preferible tener al menos 7 años de datos para una serie cronológica normal, para identificar con precisión los patrones estacionales, los efectos del día de la transacción y los efectos de las vacaciones en movimiento, los saltos de tendencia y estacionales, así como los valores atípicos. COMPARACIÓN DE LAS DOS FILOSOFIAS DE AJUSTE ESTACIONAL Los enfoques basados en modelos permiten las propiedades estocásticas (aleatoriedad) de la serie bajo análisis, en el sentido de que adaptan los pesos de los filtros según la naturaleza de la serie. La capacidad de model8217s para describir con precisión el comportamiento de la serie puede ser evaluada, y las inferencias estadísticas para las estimaciones están disponibles sobre la base de la suposición de que el componente irregular es el ruido blanco. Los métodos basados en filtros son menos dependientes de las propiedades estocásticas de las series temporales. Es la responsabilidad de la analista de series de tiempo seleccionar el filtro más apropiado de una colección limitada para una serie en particular. No es posible realizar controles rigurosos sobre la adecuación del modelo implícito y no se dispone de medidas exactas de precisión e inferencia estadística. Por lo tanto, no se puede construir un intervalo de confianza alrededor de la estimación. Los siguientes diagramas comparan la presencia de cada uno de los componentes del modelo en las frecuencias estacionales para las dos filosofías de ajuste estacional. El eje x es la longitud del período del ciclo y el eje y representa la intensidad de los ciclos que comprenden cada componente: Figura 11: Comparación de las dos filosofías de ajuste estacional Los métodos basados en filtros suponen que cada componente sólo tiene una longitud de ciclo determinada. Los ciclos más largos forman la tendencia, el componente estacional está presente en las frecuencias estacionales y el componente irregular se define como ciclos de cualquier otra longitud. Bajo una filosofía basada en modelos, la tendencia, componente estacional e irregular están presentes en todas las longitudes de ciclo. El componente irregular es de resistencia constante, el componente estacional alcanza un pico en las frecuencias estacionales y el componente de tendencia es más fuerte en los ciclos más largos. En la práctica, el promedio móvil proporcionará una buena estimación de la media de la serie temporal si la media es constante o cambia lentamente. En el caso de una media constante, el mayor valor de m dará las mejores estimaciones de la media subyacente. Un período de observación más largo promediará los efectos de la variabilidad. El propósito de proporcionar un m más pequeño es permitir que el pronóstico responda a un cambio en el proceso subyacente. Para ilustrar, proponemos un conjunto de datos que incorpora cambios en la media subyacente de la serie temporal. La figura muestra las series temporales utilizadas para la ilustración junto con la demanda media a partir de la cual se generó la serie. La media comienza como una constante en 10. Comenzando en el tiempo 21, aumenta en una unidad en cada período hasta que alcanza el valor de 20 en el tiempo 30. Entonces se vuelve constante otra vez. Los datos se simulan sumando a la media un ruido aleatorio de una distribución Normal con media cero y desviación estándar 3. Los resultados de la simulación se redondean al entero más próximo. La tabla muestra las observaciones simuladas utilizadas para el ejemplo. Cuando usamos la tabla, debemos recordar que en cualquier momento dado, sólo se conocen los datos pasados. Las estimaciones del parámetro del modelo, para tres valores diferentes de m se muestran junto con la media de las series temporales de la siguiente figura. La figura muestra la media móvil de la estimación de la media en cada momento y no la previsión. Los pronósticos cambiarían las curvas de media móvil a la derecha por períodos. Una conclusión es inmediatamente aparente de la figura. Para las tres estimaciones, la media móvil se queda por detrás de la tendencia lineal, con el retardo aumentando con m. El retraso es la distancia entre el modelo y la estimación en la dimensión temporal. Debido al desfase, el promedio móvil subestima las observaciones a medida que la media aumenta. El sesgo del estimador es la diferencia en un tiempo específico en el valor medio del modelo y el valor medio predicho por el promedio móvil. El sesgo cuando la media está aumentando es negativo. Para una media decreciente, el sesgo es positivo. El retraso en el tiempo y el sesgo introducido en la estimación son funciones de m. Cuanto mayor sea el valor de m. Mayor es la magnitud del retraso y sesgo. Para una serie cada vez mayor con tendencia a. Los valores de retraso y sesgo del estimador de la media se dan en las ecuaciones siguientes. Las curvas de ejemplo no coinciden con estas ecuaciones porque el modelo de ejemplo no está aumentando continuamente, sino que comienza como una constante, cambia a una tendencia y luego vuelve a ser constante de nuevo. También las curvas de ejemplo se ven afectadas por el ruido. El pronóstico de media móvil de los períodos en el futuro se representa desplazando las curvas hacia la derecha. El desfase y sesgo aumentan proporcionalmente. Las ecuaciones a continuación indican el retraso y sesgo de los períodos de previsión en el futuro en comparación con los parámetros del modelo. Nuevamente, estas fórmulas son para una serie de tiempo con una tendencia lineal constante. No debemos sorprendernos de este resultado. El estimador del promedio móvil se basa en el supuesto de una media constante, y el ejemplo tiene una tendencia lineal en la media durante una parte del período de estudio. Dado que las series de tiempo real rara vez obedecerán exactamente las suposiciones de cualquier modelo, debemos estar preparados para tales resultados. También podemos concluir de la figura que la variabilidad del ruido tiene el efecto más grande para m más pequeño. La estimación es mucho más volátil para el promedio móvil de 5 que el promedio móvil de 20. Tenemos los deseos en conflicto de aumentar m para reducir el efecto de la variabilidad debido al ruido y disminuir m para hacer el pronóstico más sensible a los cambios En promedio El error es la diferencia entre los datos reales y el valor previsto. Si la serie temporal es verdaderamente un valor constante, el valor esperado del error es cero y la varianza del error está compuesta por un término que es una función de y un segundo término que es la varianza del ruido. El primer término es la varianza de la media estimada con una muestra de m observaciones, suponiendo que los datos provienen de una población con una media constante. Este término se minimiza haciendo m tan grande como sea posible. Un m grande hace que el pronóstico no responda a un cambio en la serie temporal subyacente. Para hacer que el pronóstico responda a los cambios, queremos que m sea lo más pequeño posible (1), pero esto aumenta la varianza del error. La predicción práctica requiere un valor intermedio. Previsión con Excel El complemento de previsión implementa las fórmulas de promedio móvil. El siguiente ejemplo muestra el análisis proporcionado por el complemento para los datos de muestra en la columna B. Las primeras 10 observaciones se indexan -9 a 0. En comparación con la tabla anterior, los índices de período se desplazan en -10. Las primeras diez observaciones proporcionan los valores iniciales para la estimación y se utilizan para calcular la media móvil para el período 0. La columna MA (10) (C) muestra las medias móviles calculadas. El parámetro de la media móvil m está en la celda C3. La columna Fore (1) (D) muestra un pronóstico para un período en el futuro. El intervalo de pronóstico está en la celda D3. Cuando el intervalo de pronóstico se cambia a un número mayor, los números de la columna Fore se desplazan hacia abajo. La columna Err (1) (E) muestra la diferencia entre la observación y el pronóstico. Por ejemplo, la observación en el tiempo 1 es 6. El valor pronosticado a partir de la media móvil en el tiempo 0 es 11.1. El error entonces es -5.1. La desviación estándar y la media media de la desviación (MAD) se calculan en las células E6 y E7, respectivamente. Una serie de tiempo es una secuencia de observaciones de una variable aleatoria periódica. Ejemplos de ello son la demanda mensual de un producto, la inscripción anual de primer año en un departamento de la universidad y los flujos diarios en un río. Las series temporales son importantes para la investigación operativa porque son a menudo los impulsores de los modelos de decisión. Un modelo de inventario requiere estimaciones de las demandas futuras, un modelo de programación y dotación de personal para un departamento universitario requiere estimaciones del flujo futuro de estudiantes y un modelo para proporcionar advertencias a la población en una cuenca requiere estimaciones de flujos fluviales para el futuro inmediato. El análisis de series temporales proporciona herramientas para seleccionar un modelo que describe las series temporales y utilizar el modelo para predecir eventos futuros. Modelar la serie temporal es un problema estadístico porque los datos observados se utilizan en procedimientos computacionales para estimar los coeficientes de un supuesto modelo. Los modelos suponen que las observaciones varían aleatoriamente sobre un valor medio subyacente que es una función del tiempo. En estas páginas, se restringe la atención al uso de datos de series de tiempo históricas para estimar un modelo dependiente del tiempo. Los métodos son apropiados para el pronóstico automático a corto plazo de la información de uso frecuente donde las causas subyacentes de la variación del tiempo no están cambiando marcadamente en el tiempo. En la práctica, los pronósticos derivados de estos métodos son posteriormente modificados por analistas humanos que incorporan información no disponible a partir de los datos históricos. Nuestro objetivo principal en esta sección es presentar las ecuaciones para los cuatro métodos de pronóstico utilizados en el complemento de predicción: promedio móvil, suavizado exponencial, regresión y suavizado exponencial doble. Estos son llamados métodos de suavizado. Los métodos no considerados incluyen la predicción cualitativa, regresión múltiple, y métodos autorregresivos (ARIMA). Los interesados en una cobertura más amplia deben visitar el sitio de principios de pronóstico o leer uno de los varios libros excelentes sobre el tema. Utilizamos el libro Previsión. Por Makridakis, Wheelwright y McGee, John Wiley amp Sons, 1983. Para utilizar el libro de Ejemplos de Excel, debe tener instalado el complemento de Pronóstico. Elija el comando Relink para establecer los vínculos al complemento. Esta página describe los modelos utilizados para la predicción simple y la notación utilizada para el análisis. Este método de pronóstico más simple es el pronóstico del promedio móvil. El método simplemente promedios de las últimas m observaciones. Es útil para series de tiempo con una media que cambia lentamente. Este método considera todo el pasado en su pronóstico, pero pesa la experiencia reciente más fuertemente que menos reciente. Los cálculos son simples porque sólo la estimación del período anterior y los datos actuales determinan la nueva estimación. El método es útil para series de tiempo con una media que cambia lentamente. El método del promedio móvil no responde bien a una serie cronológica que aumenta o disminuye con el tiempo. Aquí incluimos un término de tendencia lineal en el modelo. El método de regresión se aproxima al modelo construyendo una ecuación lineal que proporciona el ajuste de mínimos cuadrados a las últimas m observaciones.
No comments:
Post a Comment