Autorregresivo Movimiento Autocorrelación Promedio

Propósito: Revisar la aleatoriedad parcelas autocorrelación (. Box y Jenkins, pp 28-32) son una herramienta comúnmente utilizada para el control de la aleatoriedad en un conjunto de datos. Esta aleatoriedad se determina mediante el cálculo de las autocorrelaciones para los valores de datos en el tiempo que varía queda. Si al azar, tales autocorrelaciones deben estar cerca de cero para cualquier y todas las separaciones temporizados. Si no aleatoria, a continuación, una o más de las autocorrelaciones será significativamente diferente de cero. Además, las parcelas de autocorrelación se utilizan en la etapa de identificación del modelo de Box-Jenkins autorregresivo, moviendo los modelos de series de tiempo promedio. Autocorrelación es sólo una medida de aleatoriedad Tenga en cuenta que no correlacionado no significa necesariamente aleatoria. Los datos que tienen autocorrelación significativa no es aleatoria. Sin embargo, los datos que no muestran autocorrelación significativa todavía pueden exhibir no aleatoriedad de otras maneras. Autocorrelación es sólo una medida de la aleatoriedad. En el contexto de la validación del modelo (que es el principal tipo de aleatoriedad que dicuss en el Manual), la comprobación de autocorrelación es típicamente una prueba suficiente de aleatoriedad desde los residuos de un pobre ajuste de modelos tienden a mostrar aleatoriedad no sutil. Sin embargo, algunas aplicaciones requieren una determinación más rigurosa de aleatoriedad. En estos casos, una batería de pruebas, lo que podría incluir la comprobación de la autocorrelación, se aplican ya que los datos pueden ser no aleatoria de muchas maneras diferentes y, a menudo sutiles. Un ejemplo de dónde se necesita una verificación más rigurosa para la aleatoriedad estaría en la prueba de los generadores de números aleatorios. Muestra Terreno: Autocorrelaciones debe estar cerca de cero para la aleatoriedad. Tal no es el caso en este ejemplo y por lo tanto la hipótesis de aleatoriedad no pasa esta parcela de muestreo de autocorrelación muestra que las series de tiempo no es aleatoria, sino que tiene un alto grado de autocorrelación entre las observaciones adyacentes y casi adyacentes. Definición: r (h) frente a h parcelas de autocorrelación están formados por Eje vertical: coeficiente de autocorrelación, donde C h es la función de autocovarianza y C 0 es la función de varianza Nota que R h está entre -1 y 1. Nótese que algunas fuentes pueden utilizar el siguiente fórmula para la función de autocovarianza Aunque esta definición tiene menos sesgo, el (1 / N) formulación tiene algunas propiedades estadísticas deseables y es la forma más comúnmente utilizada en la literatura estadísticas. Consulte las páginas 20 y 49-50 en Chatfield para más detalles. eje horizontal: Tiempo de retardo h (h 1, 2, 3.) La línea anterior también contiene varias líneas de referencia horizontales. La línea media está en cero. Las otras cuatro líneas son 95 y 99 bandas de confianza. Tenga en cuenta que hay dos fórmulas distintas para generar las bandas de confianza. Si la trama de autocorrelación está siendo utilizado para la prueba de aleatoriedad (es decir, no hay dependencia del tiempo en los datos), se recomienda la siguiente fórmula: donde N es el tamaño de la muestra, z es la función de distribución acumulada de la distribución normal estándar y (alfa ) es el nivel de significación. En este caso, las bandas de confianza se fija anchura que depende del tamaño de la muestra. Esta es la fórmula que se utilizó para generar las bandas de confianza en la trama anterior. parcelas de autocorrelación también se utilizan en la etapa de identificación del modelo para el montaje de modelos ARIMA. En este caso, un modelo de promedio móvil se asume para los datos y las siguientes bandas de confianza debe ser generada: donde k es el retraso, N es el tamaño de la muestra, z es la función de distribución acumulada de la distribución normal estándar y (alfa) se el nivel de significación. En este caso, las bandas de confianza aumentan al incrementar la demora. La trama de autocorrelación puede proporcionar respuestas a las siguientes preguntas: ¿Son los datos aleatorios es una observación relacionada con una observación adyacente es una observación relacionada con una observación dos veces eliminado (etc.) ¿El ruido blanco serie de tiempo observada es la serie de tiempo observada sinusoidal es el autorregresivo serie temporal observada Qué es un modelo apropiado para la serie de tiempo observada es el modelo válido y suficiente en el ss fórmula / Importancia sqrt válido: asegurar la validez de las conclusiones de ingeniería aleatoriedad (junto con el modelo fijo, la variación fijo y fijo de distribución) es uno de los cuatro supuestos que normalmente subyacen en todos los procesos de medición. El supuesto de aleatoriedad es críticamente importante por las siguientes tres razones: La mayoría de las pruebas estadísticas estándar dependen de la aleatoriedad. La validez de las conclusiones de la prueba está directamente vinculada a la validez de la hipótesis de aleatoriedad. Muchas fórmulas estadísticas de uso común dependen de la suposición de la aleatoriedad, la fórmula más común es la fórmula para la determinación de la desviación estándar de la media de la muestra: donde s es la desviación estándar de los datos. Aunque se utilizan en gran medida, los resultados del uso de esta fórmula son de ningún valor a menos que el supuesto de aleatoriedad sostiene. Para los datos univariados, el modelo por defecto es Si los datos no son al azar, este modelo es incorrecto y no válido, y las estimaciones de los parámetros (como la constante) se convierta sin sentido y no válidos. En resumen, si el analista no comprueba la aleatoriedad, la validez de muchas de las conclusiones estadísticas se convierte en sospechoso. La trama de autocorrelación es una excelente manera de comprobar tales randomness. A RIMA significa autorregresivos integrados en movimiento modelos Promedio. Univariado (solo vector) ARIMA es una técnica de predicción que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su principal aplicación es en el área de predicción a corto plazo que requiere un mínimo de 40 puntos de datos históricos. Funciona mejor cuando sus datos exhibe un patrón estable o constante en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de que los autores originales), ARIMA es generalmente superior a técnicas de suavizado exponencial cuando los datos son razonablemente largo y la correlación entre las observaciones anteriores es estable. Si los datos son de corto o muy volátiles, y luego algún método de alisado puede funcionar mejor. Si usted no tiene al menos 38 puntos de datos, se debe considerar otro método que no ARIMA. El primer paso en la aplicación de la metodología ARIMA es para comprobar si hay estacionariedad. Estacionariedad implica que la serie se mantiene en un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, a continuación, sus datos no es estacionaria. Los datos también debe mostrar una varianza constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y crece a un ritmo más rápido. En tal caso, las subidas y bajadas en la estacionalidad se harán más dramática en el tiempo. Sin estas condiciones de estacionariedad se cumplen, muchos de los cálculos asociados con el proceso no se puede calcular. Si una representación gráfica de los datos indica no estacionariedad, entonces debería diferencia de la serie. La diferenciación es una excelente manera de transformar una serie no estacionaria a uno estacionario. Esto se realiza restando la observación en el periodo actual de la anterior. Si esta transformación se realiza sólo una vez para una serie, se dice que los datos han sido primera diferenciados. Este proceso elimina esencialmente la tendencia si la serie está creciendo a un ritmo bastante constante. Si está creciendo a un ritmo creciente, se puede aplicar el mismo procedimiento y la diferencia de los datos de nuevo. Sus datos serían entonces segundo diferenciada. Autocorrelaciones son valores numéricos que indican cómo una serie de datos está relacionado con sí mismo en el tiempo. Más precisamente, se mide la fuerza con los valores de datos en un número especificado de periodos aparte se correlacionan entre sí en el tiempo. El número de períodos separados generalmente se llama el retraso. Por ejemplo, una autocorrelación en medidas de retardo 1 cómo valora 1 periodo aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso de 2 medidas de cómo los datos de dos períodos separados están correlacionadas en toda la serie. Autocorrelaciones pueden variar 1--1. Un valor cercano a 1 indica una correlación positiva alta, mientras que un valor cercano a -1 indica una correlación negativa alta. Estas medidas son más a menudo evaluados a través de representaciones gráficas llamadas correlagrams. Un correlagram representa los valores de autocorrelación para una serie dada en diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. metodología ARIMA intenta describir los movimientos de una serie de tiempo estacionaria en función de lo que se denomina autorregresivo y moviendo parámetros medios. Estos se conocen como parámetros AR (autoregessive) y los parámetros MA (promedios móviles). Un modelo AR con sólo 1 de parámetros se puede escribir como. X (t) Un (1) X (t-1) E (t) en la que X (t) de series de tiempo bajo investigación Un (1) el parámetro autorregresivo de orden 1 X (t-1) las series de tiempo se retrasó 1 periodo E (t) el término de error del modelo Esto simplemente significa que cualquier valor dado de X (t) puede explicarse por alguna función de su valor anterior, X (t-1), además de algunos errores aleatorios inexplicable, E (t). Si el valor estimado de A (1) fue 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionado con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), además de algunos al azar de error e (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Mover Modelos Promedio: Un segundo tipo de modelo de Box-Jenkins se llama un modelo de media móvil. Aunque estos modelos son muy similares al modelo AR, el concepto detrás de ellos es muy diferente. Móviles parámetros medios relacionan lo que ocurre en el período t sólo a los errores aleatorios que ocurrieron en periodos pasados, es decir, E (t-1), E (t-2), etc en lugar de X (t-1), X ( t-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA se puede escribir de la siguiente manera. X (t) - B (1) E (t-1) E (t) El término B (1) se llama un MA de orden 1. El signo negativo delante del parámetro se utiliza para la única convención y por lo general se imprime a cabo automáticamente por la mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente con el error aleatorio en el periodo anterior, E (t-1), y con el término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil se pueden extender a estructuras de orden superior que cubren diferentes combinaciones y en movimiento longitudes medias. metodología ARIMA también permite que los modelos que se construirán que incorporan tanto autorregresivo y moviendo parámetros medios juntos. Estos modelos se conocen como modelos mixtos a menudo. Aunque esto lo convierte en una herramienta de pronóstico más complicado, de hecho, la estructura puede simular la serie mejor y producir un pronóstico más exacto. modelos puros implican que la estructura se compone sólo de los parámetros AR o MA - no ambas. Los modelos desarrollados por este enfoque generalmente se llaman los modelos ARIMA, ya que utilizan una combinación de autorregresivo (AR), la integración (I) - refiriéndose al proceso de diferenciación inversa para producir el pronóstico, y moviendo las operaciones promedio (MA). Un modelo ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (P), el número de operadores de diferenciación (d), y el más alto orden del plazo de media móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo de segundo orden autorregresivo de primer orden con un componente promedio cuya serie se ha diferenciado una vez para inducir estacionariedad en movimiento. Recogiendo la Especificación de la derecha: El principal problema en la clásica Box-Jenkins está tratando de decidir qué especificación ARIMA utilizar - i. e. cuántos parámetros AR y / o MA que incluyen. Esto es lo que gran parte de la caja-Jenkings 1976 se dedicó al proceso de identificación. Dependía de gráfica y numérica eva - luación de la autocorrelación de la muestra y las funciones de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en la complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, los datos representan solamente una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, error de medición, etc.) pueden distorsionar el proceso de identificación teórica. Es por ello que la modelización ARIMA tradicional es más un arte que una science.2.1 Moving Modelos Promedio (modelos MA) modelos de series temporales conocidos como modelos ARIMA puede incluir términos autorregresivos y / o términos de medias móviles. En la Semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor rezagado de x t. Por ejemplo, un retraso de 1 x término autorregresivo es t-1 (multiplicado por un coeficiente). Esta lección define términos de medias móviles. Un término promedio móvil en un modelo de series de tiempo es un error pasado (multiplicado por un coeficiente). Sea (en peso desbordado N (0, sigma2w)), lo que significa que el w t son de forma idéntica, distribuido de forma independiente, cada uno con una distribución normal con media 0 y la misma varianza. El 1º orden moviendo modelo de media, denotado por MA (1) es (xt theta1w mu peso) El orden 2º movimiento modelo de media, denotado por MA (2) es (mu xt peso theta1w theta2w) El q º orden moviendo modelo de media , denotado por MA (q) es (mu xt wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque no voltear los signos algebraicos de valores de los coeficientes estimados y los términos (unsquared) en las fórmulas para FCA y varianzas. Es necesario comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza señales positivas en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie de tiempo con un MA (1) Nota Modelo que el único valor distinto de cero en el ACF teórico es de retardo 1. Todos los demás autocorrelaciones son 0. Así, un ACF muestra con una autocorrelación significativa sólo en el retardo 1 es un indicador de un posible MA (1) modelo. Para los estudiantes interesados, pruebas de estas propiedades son un apéndice de este folleto. Ejemplo 1 Supongamos que un MA (1) modelo es x t 10 w w t 0,7 t-1. donde (en peso desbordado N (0,1)). Por lo tanto el coeficiente 1 0.7. El ACF teórico está dado por una trama de esta sigue ACF. La trama se acaba de mostrar es la ACF teórico para un MA (1) con 1 0.7. En la práctica, una muestra de costumbre suelen proporcionar un patrón tan claro. El uso de R, simulamos n 100 valores de las muestras utilizando el modelo x 10 w t t t 0,7 W-1 donde w t iid N (0,1). Para esta simulación, un gráfico de series temporales de datos de la muestra de la siguiente manera. No podemos decir mucho de esta trama. El ACF de la muestra para la simulación de datos sigue. Vemos un aumento en el retardo 1 seguido por valores generalmente no significativos para retardos pasado 1. Tenga en cuenta que la muestra ACF no coincide con el patrón teórico de la MA subyacente (1), que es que todas las autocorrelaciones para los retrasos del pasado 1 estarán 0 . una muestra tendría un ACF muestra ligeramente diferente se muestra a continuación, pero probablemente tendría las mismas características generales. Theroretical Propiedades de una serie temporal con un modelo MA (2) Para el (2) Modelo MA, propiedades teóricas son las siguientes: Tenga en cuenta que los únicos valores no nulos en la ACF teórica son los GAL 1 y 2. Autocorrelaciones para retardos más altos son 0 . por lo tanto, una muestra con ACF autocorrelaciones significativas en los retardos 1 y 2, pero autocorrelaciones no significativos para retardos más alto indica una posible MA (2) del modelo. iid N (0,1). Los coeficientes son 1 0,5 y 2 0.3. Debido a que este es un MA (2), el ACF teórica tendrá valores distintos de cero solamente en los retardos 1 y 2. Los valores de los dos autocorrelaciones son distintos de cero Una trama de la ACF teórico sigue. Como casi siempre es el caso, datos de la muestra suele comportarse tan perfectamente como teoría. Hemos simulado n 150 valores de la muestra para el modelo x 10 w t t t-0,5 W 0,3 W 1 T-2. donde w t iid N (0,1). El gráfico de series temporales de datos de la siguiente manera. Al igual que con el gráfico de series temporales de los (1) datos de las muestras MA, usted no puede decir mucho de ella. El ACF de la muestra para la simulación de datos sigue. El patrón es típico para situaciones en las que una (2) modelo de MA puede ser útil. Hay dos picos estadísticamente significativas en los retardos 1 y 2, seguido por los valores no significativos para otros retardos. Tenga en cuenta que debido a un error de muestreo, el ACF muestra no coincide con el patrón teórico exactamente. ACF para el general MA (q) Modelos Una característica de los modelos MA (q), en general, es que hay autocorrelaciones distintos de cero para los primeros retardos q autocorrelaciones y 0 para todos los GAL gt q. No unicidad de la conexión entre los valores de 1 y (Rho1) en MA (1) Modelo. En el MA (1) modelo, para cualquier valor de 1. el recíproco 1/1 da el mismo valor para A modo de ejemplo, utilizar 0,5 por 1. y luego usar 1 / (0,5) 2 por 1. Usted conseguirá (Rho1) 0,4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. que restringir MA (1) modelos de tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 habrá un valor de parámetro permisible, mientras que 1 1 / 0.5 2 no lo hará. Invertibilidad de modelos Un modelo MA MA se dice que es invertible si es algebraicamente equivalente a un modelo AR orden infinito convergentes. Al converger, nos referimos a que los coeficientes AR disminuyen a 0 a medida que avanzamos en el tiempo. Invertibilidad es una restricción de software programado en series de tiempo utilizado para estimar los coeficientes de los modelos con los términos MA. No es algo que comprobamos en el análisis de datos. Información adicional acerca de la restricción invertibilidad de MA (1) modelos se da en el apéndice. Teoría avanzada Nota. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - Q y q 0 tiene soluciones para y que están fuera del círculo unitario. R Código de los ejemplos en el Ejemplo 1, que representa el ACF teórica del modelo x 10 w t t. 7w t-1. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizan para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0,7), lag. max10) 10 rezagos de ACF para MA (1) con 0,7 theta1 lags0: 10 crea una variable llamada desfases que va de 0 a 10. parcela (retardos, acfma1, xlimc (1,10), ylabr, Type H, principal ACF para MA (1) con theta1 0,7) abline (H0) agrega un eje horizontal de la gráfica el primer comando determina la ACF y lo almacena en un objeto acfma1 llamado (nuestra elección del nombre). El comando plot (los comandos 3º) parcelas se retrasa en comparación con los valores de ACF para desfases del 1 al 10. Cuando las etiquetas El parámetro ylab el eje Y y el parámetro principal pone un título en la parcela. Para ver los valores numéricos de la ACF sólo tiene que utilizar el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. xcarima. sim (n150, lista (mac (0,7))) Simula n 150 valores de MA (1) xxc10 añade 10 para hacer medias por defecto 10. Simulación en el sentido de 0. plot (x, TypeB, mainSimulated MA (1) datos) ACF (x, xlimc (1,10), mainACF para datos de muestras simuladas) En el Ejemplo 2, se representa gráficamente la ACF teórica del modelo XT 10 en peso de 0,5 w t-1 0,3 w T-2. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 parcela (GAL, acfma2, xlimc (1,10), ylabr, Type H, principal ACF para MA (2) con theta1 0,5, theta20.3) abline (H0) xcarima. sim (n150, lista (mac (0,5, 0,3))) xxc10 plot (x, TypeB, principal simulada MA (2) Serie) ACF (x, xlimc (1,10), mainACF para MA simulada (2) datos) Apéndice: Prueba de propiedades de MA (1) para los estudiantes interesados, aquí están las pruebas de las propiedades teóricas de la (1) modelo MA. Diferencia: (texto (xt) w texto (mu theta1 en peso) 0 texto (en peso) de texto (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Cuando h 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 . la razón es que, por definición de independencia del peso. E (k w w j) 0 para cualquier k j. Además, como la w t tiene media 0, E (w w j j) E (w j 2) w 2. Por una serie de tiempo, aplicar este resultado para obtener el ACF dado anteriormente. Un modelo MA invertible es uno que puede ser escrito como un modelo AR orden infinito que converge de manera que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el (1) modelo de MA. Tenemos entonces sustituto de la relación (2) A la hora de w t-1 en la ecuación (1) (3) (ZT en peso theta1 (z - theta1w) en peso theta1z - theta2w) t-2. la ecuación (2) se convierte en A continuación, sustituir relación (4) para W t-2 en la ecuación (3) (ZT en peso theta1 z - theta21w peso theta1z - theta21 (z - theta1w) en peso theta1z - theta12z theta31w) Si tuviéramos que continuar ( infinitamente), obtendríamos el modelo AR orden infinito (ZT en peso theta1 z - theta21z theta31z - theta41z puntos) Obsérvese, sin embargo, que si 1 1, los coeficientes multiplicadores de los retardos z aumentará (infinitamente) de tamaño a medida que avanzamos en la espalda hora. Para evitar esto, necesitamos 1 LT1. Esta es la condición para un MA (1) modelo invertible. Modelo de la orden infinito MA En la semana 3, así que ver un AR (1) modelo puede ser convertido en un modelo de orden infinito MA: (xt - mu peso phi1w phi21w puntos phik1 w puntos resumen phij1w) Esta suma de términos de ruido blanco es conocido últimos como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos que se remontan en el tiempo. Esto se llama una orden infinito MA o MA (). Una orden MA finito es un AR orden infinito y cualquier orden de AR finito es un MA orden infinito. Recordemos en la semana 1, se observó que la exigencia de un AR estacionario (1) es que 1 LT1. Permite calcular el Var (x t) utilizando la representación causal. Este último paso se utiliza un hecho básico acerca serie geométrica que requiere (phi1lt1) diverge de lo contrario las series. NavigationARMA y ARIMA (Box-Jenkins) modelos ARMA y ARIMA (Box-Jenkins) modelos En las secciones anteriores hemos visto cómo el valor de una serie de tiempo univariante en el tiempo t. x t. puede ser modelado utilizando una variedad de expresiones en movimiento promedio. También hemos demostrado que los componentes tales como las tendencias y la periodicidad de la serie temporal se pueden modelar de forma explícita y / o separan, con los datos que se descomponen en tendencia, estacionales y componentes residuales. También puso de manifiesto, en las discusiones anteriores sobre la autocorrelación. que los coeficientes de autocorrelación completas y parciales son extremadamente útiles en la identificación y el modelado de patrones en series de tiempo. Estos dos aspectos de análisis de series de tiempo y el modelado se pueden combinar en un marco más general, y, a menudo muy eficaz de modelado en general. En su forma más básica de este enfoque es conocido como el modelado ARMA (autorregresivo de media móvil), o cuando la diferenciación se incluye en el procedimiento, la modelización ARIMA o Box-Jenkins, después de que los dos autores que eran fundamentales para su desarrollo (véase el recuadro amp Jenkins, 1968 box1, y la caja, Jenkins amp Reinsel de 1994 BOX2). No hay una regla fija en cuanto al número de periodos de tiempo necesarios para la elaboración de modelos de éxito, pero para los modelos más complejos, y para una mayor confianza en los procedimientos de ajuste y validación, serie con 50 pasos de tiempo se recomienda a menudo. modelos ARMA combinan métodos de autocorrelación (AR) y las medias móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos pueden ser combinados, examinamos cada uno por separado. Ya hemos visto que los modelos de medias (MA) en movimiento puede ser utilizado para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican suavizado exponencial doble o triple puede manejar componentes de tendencia y periódicos en los datos. Además, estos modelos se pueden utilizar para crear previsiones que imitan el comportamiento de los períodos anteriores. Una forma simple de tales modelos, basados en los datos anteriores, se puede escribir como: donde i términos de la beta son las ponderaciones aplicadas a los valores anteriores de la serie histórica, y es habitual para definir beta i 1, sin pérdida de generalidad. Así que para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor de la media móvil se calcula como la media ponderada de los valores actuales y pasados inmediatos. Este proceso de promedio es, en cierto sentido, un mecanismo regulador pragmática, sin un enlace directo a un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarca los procedimientos de medias móviles en conjunción con los procesos aleatorios. Si dejamos que sea un conjunto de variables aleatorias independientes e idénticamente distribuidos (un proceso aleatorio) con media cero y varianza conocida fijo, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Es evidente que el valor esperado de xt bajo este modelo es 0, por lo que el modelo sólo es válido si el xt ya han sido ajustados para tener significa un cero o si se añade una constante fija (la media de la xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior se puede ampliar para evaluar la covarianza, cov (x t XTK.), Lo que nos encontramos con rendimientos: Tenga en cuenta que ni el valor medio, ni la covarianza (o autocovariancia) en el retardo k es una función del tiempo, t. por lo que el proceso es estacionario segundo orden. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (ACF): Si k 0 rho k 1, y para k gt q rho k 0. Además, el ACF es simétrica y - k rho k rho. El ACF se puede calcular para un proceso de primer orden MA: El componente autorregresivo AR o de un modelo ARMA se puede escribir en la forma: donde los términos son de coeficientes de autocorrelación en los retardos 1,2. p y z t es un término de error residual. Tenga en cuenta que este término de error se relaciona específicamente con el actual período de tiempo, t. Así que para un proceso de primer orden, p 1 y que tiene el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t se determina por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . de la medida en que los valores para todos los pares de valores en los períodos de tiempo de espera 1 aparte están correlacionados (es decir, su autocorrelación), más un término de error residual, z. en el tiempo t. Pero esto es precisamente la definición de un proceso de Markov. por lo que un proceso de Markov es un primer proceso autorregresivo de orden. Si alfa 1 el modelo establece que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es un simple paseo aleatorio 1D. Si se incluyen varios términos del modelo estima el valor de x en el tiempo t mediante una suma ponderada de estos términos, además de un componente de error aleatorio. Si sustituimos la segunda expresión anterior a la primera, tenemos: y la aplicación repetida de esta rendimientos de sustitución: Ahora bien, si LT1 alfa y k es grande, esta expresión se puede escribir en el orden inverso, con términos decrecientes y con la contribución de la expresión en x en el lado derecho de la expresión convirtiéndose prácticamente nula, por lo que tenemos: Desde el lado derecho de esta xt modelos de expresión como la suma de una serie ponderada de los valores anteriores, en este caso los términos de error aleatorio, es evidente que este modelo AR es, de hecho, una forma de modelo de MA. Y si asumimos que los términos de error tienen media cero y varianza constante, como en el modelo MA tenemos el valor esperado del modelo como también 0, suponiendo que el xt se han ajustado para proporcionar una media cero, con una variación: Ahora, como siempre que LT1 alfa esta suma es finito y es simplemente 1 / (1- alpha), por lo que tenemos: (. x t x tk) al igual que con el modelo MA anteriormente, este análisis se puede extender a evaluar la covarianza, cov de una proceso de primer orden AR, que nos encontramos con rendimientos: para LT1 alfa esta suma es finita y es simplemente alfa k / (1- alfa 2), por lo que tenemos: esto demuestra que para un modelo de primer orden autorregresivo de la función de autocorrelación (ACF) es simplemente definido por sucesivas potencias de la autocorrelación de primer orden, con la condición de LT1 alfa. Para Gt0 alfa esto es simplemente una curva de potencia o exponencial similar rápidamente decreciente, tendiendo a cero, o para LT0 es una curva oscilatoria de amortiguación, de nuevo tiende a cero. Si se hace una suposición de que la serie de tiempo es estacionaria del análisis anterior se puede extender a autocorrelaciones segundo y de orden superior. Con el fin de adaptarse a un modelo AR a un conjunto de datos observados, se busca minimizar la suma de los errores al cuadrado (un ajuste por mínimos cuadrados), utilizando el menor número de términos que proporcionan un ajuste adecuado a los datos. Los modelos de este tipo se describen como autorregresivo. y puede ser aplicado a ambas series de tiempo y los conjuntos de datos espaciales (véase más adelante, los modelos autorregresivos espaciales). Aunque, en teoría, un modelo autorregresivo podría proporcionar un buen ajuste a un conjunto de datos observados, por lo general, requeriría la eliminación previa de y componentes de tendencia y periódicos, e incluso entonces puede ser que necesite un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, mediante la combinación de los modelos AR con modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las siguientes subsecciones. En los dos apartados anteriores hemos introducido el modo de MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos, simplemente añadiendo juntos como un modelo de orden (p q.), Donde tenemos términos AR p y términos q MA: En general, esta forma de modelo ARMA combinado se pueden utilizar para modelar una serie de tiempo con menos términos general que cualquiera de una MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de los términos q que representan la variación promedio de la variación aleatoria sobre Q períodos anteriores (el componente MA), más la suma de los términos P AR que calculan el valor actual de x como la suma ponderada p de los valores más recientes. Sin embargo, esta forma de modelo supone que la serie de tiempo es estacionaria, que es raramente el caso. En la práctica, las tendencias y la periodicidad existe en muchas bases de datos, por lo que hay una necesidad de eliminar estos efectos antes de usar estos modelos. La eliminación se lleva a cabo típicamente mediante la inclusión en el modelo de una etapa inicial de diferenciación, por lo general, una vez, dos veces o tres veces, hasta que la serie es al menos aproximadamente estacionaria - no presente las tendencias o periodicidades obvias. Al igual que con los procesos de MA y AR, el proceso de diferenciación es descrito por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman una triple: (.. P d q) que define el tipo de modelo aplicado. De esta forma, el modelo se describe como un modelo ARIMA. La letra I en Arima se refiere al hecho de que el conjunto de datos ha sido inicialmente diferenciados (cf. diferenciación) y cuando el modelado es completa a continuación, los resultados tienen que ser sumadas o integradas para producir las estimaciones finales y pronósticos. modelización ARIMA se discute a continuación. Como se ha señalado en el apartado anterior, la combinación de diferenciación de una serie de tiempo no estacionarias con el modelo ARMA proporciona una poderosa familia de modelos que se pueden aplicar en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo es en gran parte debido a G E P G M Box y Jenkins, y como resultado de los modelos ARIMA son conocidos también como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es a diferencia de la serie de tiempo hasta que es estacionario, lo que garantiza que la tendencia y se eliminan los componentes de temporada. En muchos casos, uno o dos de diferenciación etapa es suficiente. La serie diferenciada será más corto que la serie fuente de C pasos de tiempo, donde C es el rango de la diferenciación. Un modelo ARMA se ajusta entonces a la serie de tiempo resultante. Dado que los modelos ARIMA tienen tres parámetros que hay muchas variaciones a los posibles modelos que puedan estar equipados. Sin embargo, la decisión sobre lo que estos parámetros deben ser pueden ser guiados por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contienen el menor número de términos como sea posible, que a su vez significa que los valores de p y q debe ser pequeña (ii) el ajuste a los datos históricos debe ser tan buena como sea posible, es decir, el tamaño de las diferencias al cuadrado entre el valor estimado en cualquier período de tiempo pasado y el valor real, debe reducirse al mínimo (principio de mínimos cuadrados) - los residuos del modelo seleccionado puede entonces ser examinado para ver si los residuos restantes son significativamente diferentes de 0 (véase más adelante) (iii) la correlación parcial medido en los retardos 1,2,3. debe proporcionar una indicación de la orden del componente de AR, es decir, el valor elegido para q (iv) la forma de la función de autocorrelación parcela (acf) puede sugerir el tipo de modelo ARIMA necesario - la tabla de abajo (del NIST) proporciona orientación sobre la interpretación de la forma de la ACF en cuanto a la selección del modelo. Modelo ARIMA selección del tipo de uso de la Serie ACF forma no es estacionaria. Los modelos estándar ARIMA se describen a menudo por la triple: (.. p q d) como se señaló anteriormente. Estos definen la estructura del modelo en términos de la orden de los modelos AR, de diferenciación y MA para ser utilizados. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos de instalar y de interpretar - los callos (P. D. Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS se muestra a continuación, se muestra el diálogo para seleccionar manualmente los elementos estructurales no estacionales y de temporada (instalaciones similares están disponibles en otros paquetes integrados, tales como SAS / ETS). Como puede verse, el cuadro de diálogo también permite que los datos se transforman (típicamente para ayudar en la estabilización de la varianza) y para permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software en particular permite valores atípicos para ser detectados si es necesario, de acuerdo con una variedad de procedimientos de detección, pero en muchos casos se han investigado los valores atípicos y ajustado o eliminado y los valores de sustitución estimada, antes de cualquier análisis. SPSS modelizador de series temporales: la modelización ARIMA, el modo experto Una serie de modelos ARIMA puede ser ajustado a los datos, de forma manual o por medio de un proceso automatizado (por ejemplo, un proceso por etapas), y una o más medidas utiliza para juzgar cuál es el mejor en términos de la medida y la parsimonia. comparación de modelos normalmente hace uso de uno o más de los informativos medidas teóricas descritas anteriormente en este manual - AIC, MDL (la función de BIC y / o R, Arima (), proporciona la medida de la AIC, mientras que SPSS proporciona una serie de medidas de ajuste, incluida una versión de la estadística BIC otras herramientas varían en las medidas a -. Minitab, que ofrece una amplia gama de métodos de TSA, no incluye estadísticas AIC / tipo BIC). En la práctica de una amplia gama de medidas (es decir, distinto de / además de las medidas de mínimos cuadrados basado, se puede utilizar para evaluar la calidad del modelo. Por ejemplo, el error absoluto medio y el error máximo absoluto pueden ser medidas útiles, ya que incluso una buenas ajuste de mínimos cuadrados todavía puede ser deficiente en algunos lugares. una serie de paquetes de software también puede proporcionar una medida global de la autocorrelación que pueda permanecer en los residuos después de ajustar el modelo. una estadística aplicada con frecuencia se debe a Ljung y Box (1978 LJU1) y es de la forma: donde n es el número de muestras (valores de datos), ri es la autocorrelación de la muestra en el retardo i y k es el número total de retardos sobre el que el cálculo se lleva a cabo Q k se distribuye aproximadamente como.. una distribución chi-cuadrado con k -. m grados de libertad, donde m es el número de parámetros utilizados en el ajuste del modelo, excluir las variables constantes plazo o de predicción (es decir, justo incluyendo los pd q triples) Si la medida es estadísticamente significativa se indica que los residuos contienen todavía autocorrelación significativa después de que el modelo ha sido equipado, lo que sugiere que un modelo mejorado debe ser buscada. Ejemplo: Modelación del crecimiento del número de pasajeros de aerolíneas El siguiente es un ejemplo de montaje automatizada, utilizando SPSS para los datos de prueba de Box-Jenkins-Reinsel de aerolínea número de pasajeros REI1 han proporcionado anteriormente en este manual. Inicialmente se especifica ninguna especificación de las fechas que son meses dentro de unos años. El modelo seleccionado por el proceso automatizado era un modelo ARIMA (0,1,12), es decir, el proceso identificó correctamente que la serie requiere un nivel de diferenciación y se aplica un modelo de media móvil con una periodicidad de 12 y ningún componente de autocorrelación para adaptarse a la datos. El ajuste del modelo produjo un valor de R2 de 0,966, que es muy alto, y un error máximo absoluto (MAE) de 75. El ajuste visual del modelo a los datos parece excelente, pero la trama de la autocorrelación residual después del montaje y Ljung - Box prueba demuestra que sigue siendo autocorrelación significativa, lo que indica que un modelo mejorado es posible. Automatizado ARIMA ajuste a los pasajeros de avión Internacional: Los totales mensuales, 1949-1960 Para investigar más a fondo se ajustó un modelo revisado, basado en la discusión de este conjunto de datos por Box y Jenkins (1968) y la edición actualizada de Chatfields (1975 CHA1) libro en que utiliza Minitab para ilustrar su análisis (6ª edición, 2003). Las series de tiempo se define como tener una periodicidad de 12 meses y un modelo ARIMA con componentes (0,1,1), (0,1,1). Gráficamente los resultados son muy similares a la tabla de arriba, pero con este modelo, el R cuadrado es 0.991, el MAE41 y el estadístico de Ljung-Box ya no es significativa (12,6, con 16 grados de libertad). El modelo es así una mejora en la versión original (generado automáticamente), se compone de una MA no estacional y un componente MA estacional, ningún componente autorregresivo, y un nivel de diferenciación para las estructuras estacionales y no estacionales. Ya sea apropiado es manual o automatizado, un modelo ARIMA puede proporcionar un buen marco para el modelado de una serie de tiempo, o puede ser que los modelos o enfoques alternativos proporcionan un resultado más satisfactorio. A menudo es difícil saber de antemano qué bueno es probable que sea ningún modelo de pronóstico dada, ya que es sólo a la luz de su capacidad para predecir valores futuros de la serie de datos que pueda ser verdaderamente juzgado. A menudo, este proceso se aproxima por el ajuste del modelo a los datos del pasado con exclusión de períodos de tiempo recientes (también conocidos como muestras de retención fuera) y, a continuación, utilizando el modelo para predecir estos eventos futuros conocidos, pero incluso esto sólo ofrece confianza limitada en su validez futuro. el pronóstico a largo plazo puede ser extremadamente fiable utilización de dichos métodos. Es evidente que el modelo de las estadísticas de tráfico aéreo internacional se ha descrito anteriormente no es capaz de predecir correctamente los números de los pasajeros a través en la década de 1990 y más allá, ni la caída de 5 años en los Estados Unidos números internacionales de pasajeros de aerolíneas publicar 9/11/2001. Del mismo modo, un modelo ARIMA puede ser instalado en valores históricos de las cotizaciones bursátiles o valores de índice (por ejemplo, la Bolsa de Nueva York o de índices FTSE) y proporcionará típicamente un excelente ajuste a los datos (lo que da un valor de R cuadrado superior a 0,99), pero son a menudo de poca utilidad para la predicción de valores futuros de estos precios o índices. Típicamente, los modelos ARIMA se utilizan para la predicción, en particular en el campo de la modelización macro y micro económico. Sin embargo, pueden ser aplicados en una amplia gama de disciplinas, ya sea en la forma descrita aquí, o aumentada con variables de predicción adicionales que se cree que mejora la fiabilidad de las previsiones realizadas. Estos últimos son importantes porque toda la estructura de los modelos ARMA discutidos anteriormente depende de los valores anteriores y eventos aleatorios independientes en el tiempo, no en cualquier factores explicativos o causales. De ahí que los modelos ARIMA solamente reflejarán y extender los patrones del pasado, lo que podría ser necesario modificar las previsiones por factores tales como el entorno macroeconómico, los cambios tecnológicos, o de recursos a largo plazo y / o cambios ambientales. Box1 Box G E P, G Jenkins M (1968). Algunos avances recientes en la predicción y el control. Estadística Aplicada, 17 (2), 91-109 BOX2 caja, G E P, Jenkins, G M, G Reinsel C (1994) Análisis de series de tiempo, predicción y control. 3ª ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) El análisis de los tiempos de la serie: Teoría y Práctica. Chapman y Hall, Londres (véase también, 6ª ed., 2003) LJU1 Ljung G M, G E P Box (1978) sobre una medida de una falta de ajuste en modelos de series temporales. Biométrika, 65, 297303 NIST / SEMATECH e-Manual de Métodos Estadísticos, www. itl. nist. gov/div898/handbook/ Sección 6.4: Introducción a las series temporales. 2010 SPSS / PASW 17 (2008) (modelos de series temporales) AnalyzeForecasting REI1 Reinsel GC conjuntos de datos para los modelos Box-Jenkins: www. stat. wisc. edu/Autoregressive media móvil ARMA (p, q) los modelos de análisis de series temporales - parte 2 Michael Salas-Moore el 24 de agosto de 2015, de la Parte 1 se considera el modelo autorregresivo de orden p, también conocido como el modelo AR (p). Hemos introducido como una extensión del modelo de paseo aleatorio en un intento de explicar la correlación serial adicional en series de tiempo financieras. En última instancia, nos dimos cuenta de que no era lo suficientemente flexible como para captar realmente la totalidad de la autocorrelación en los precios de cierre de Amazon Inc. (AMZN) y el Índice de Equidad de SampP500 Estados Unidos. La razón principal de esto es que ambos de estos activos son condicionalmente heterocedástica. lo que significa que son no estacionarias y tienen períodos más o menos varianza o volatilidad de la agrupación, y no es tomado en cuenta por el modelo AR (p). En próximos artículos, finalmente, construir hasta el autorregresivo integrado en movimiento modelos Promedio (ARIMA), así como los modelos condicionalmente heteroscedásticos de las familias ARCH y GARCH. Estos modelos nos darán nuestros primeros intentos realistas de precios de los activos de predicción. En este artículo, sin embargo, vamos a introducir el promedio móvil de orden q modelo, conocido como MA (q). Este es un componente del modelo más general ARMA y como tal tenemos que entender que antes de seguir adelante. Le recomiendo que lea los artículos anteriores en la colección de análisis de series temporales si no lo ha hecho. Todos ellos se pueden encontrar aquí. De media móvil (MA) Modelos de orden q Justificación Un modelo en movimiento promedio es similar a un modelo autorregresivo, excepto que en lugar de ser una combinación lineal de los valores de la serie de tiempo pasado, es una combinación lineal de los últimos términos de ruido blanco. Intuitivamente, esto significa que el modelo MA ve este tipo de perturbaciones de ruido blanco al azar directamente en cada valor actual del modelo. Esto está en contraste con un modelo AR (p), donde los choques de ruido blanco se ven sólo indirectamente. a través de la regresión en términos anteriores de la serie. Una diferencia clave es que el modelo MA referida solamente ver los últimos choques q para un modelo particular MA (q), mientras que el (p) modelo AR tomará todas las crisis anteriores en cuenta, aunque de una manera cada vez menos débil. Definición Matemáticamente, el MA (q) es un modelo de regresión lineal y está estructurado de manera similar a AR (p): media móvil de orden q Modelo Un modelo de serie temporal, es un modelo de media móvil de orden q. MA (q), si: comienzan xt beta1 peso w w ldots betaq final, donde es ruido blanco con E (en peso) 0 y varianza sigma2. Si tenemos en cuenta el operador de desplazamiento hacia atrás. (Véase un artículo anterior), entonces podemos volver a escribir lo anterior como una función de la phi: comienzan xt (1 beta 1 de la beta 2 de 2 ldots betaq q) en peso PHIQ () en peso final vamos a hacer uso de la función phi en artículos posteriores. Segundo Propiedades orden como con AR (p) la media de un proceso MA (q) es cero. Esto es fácil de ver como la media es simplemente una suma de medio de términos de ruido blanco, que son todos ellos cero. comienza el texto enspace mux E (xt) suma E (wi) 0 final comienzan sigma2w texto enspace (1 beta21 ldots beta2q) final de texto enspace RHoK left 1 texto enspace k 0 suma Betai beta / sumq beta2i texto enspace k 1, ldots, q 0 texto enspace k gt q extremo derecho. Donde beta0 1. estaban ahora va a generar algunos datos simulados y utilizarlo para crear correlograms. Esto hará que la fórmula anterior para RHoK algo más concreto. Las simulaciones y Correlogramas MA (1) Vamos a empezar con un (1) proceso de MA. Si fijamos beta1 0.6 obtenemos el siguiente modelo: Al igual que con los modelos AR (p) en el artículo anterior, podemos utilizar R para simular una serie tal y luego trazar la correlogram. Dado que hemos tenido mucha práctica en la anterior serie de artículos análisis de series temporales de llevar a cabo las parcelas, voy a escribir el código R en su totalidad, en lugar de dividirlo: La salida es la siguiente: Como se ha visto anteriormente en la fórmula para RHoK , para k gt q, todas las autocorrelaciones debe ser cero. Desde q 1, deberíamos ver un pico significativo en k1 y picos entonces insignificantes posterior a esa. Sin embargo, debido al sesgo de muestreo que debemos esperar para ver 5 (marginalmente) picos significativos sobre una parcela de muestreo de autocorrelación. Esto es precisamente lo que el correlogram nos muestra en este caso. Tenemos un pico significativo en k1 y picos entonces insignificantes para k gt 1, excepto en k4 donde tenemos un pico marginalmente significativa. De hecho, esta es una manera útil de ver si un modelo MA (q) es adecuada. Al echar un vistazo en el correlogram de una serie particular, podemos ver cuántas existen retardos distintos de cero secuenciales. Si existen tales retardos q entonces podemos intentar legítimamente para ajustar un modelo MA (q) a una serie particular. Ya que tenemos la evidencia de nuestros datos simulados de un (1) proceso de MA, fueron ahora va a tratar de adaptarse a una (1) modelo MA con nuestros datos simulados. Desafortunadamente, tampoco hay un comando ma equivalente al comando ar modelo autorregresivo en R. En lugar de ello, hay que utilizar el comando más general Arima y establecer el autorregresivo y componentes integrados a cero. Hacemos esto mediante la creación de un 3-vector y el establecimiento de los dos primeros componentes (los parámetros autogressive e integrados, respectivamente) a cero: Recibimos una salida útil a partir de la orden de Arima. En primer lugar, podemos ver que el parámetro se ha estimado en 0.602 sombrero, que está muy cerca del verdadero valor de beta 1 0.6. En segundo lugar, los errores estándar ya están calculados para nosotros, por lo que es fácil de calcular los intervalos de confianza. En tercer lugar, recibimos una varianza estimada, log-probabilidad y el Criterio de Información de Akaike (necesaria para la comparación de modelos). La principal diferencia entre Arima y ar es que Arima estima un término de intersección ya que no resta el valor medio de la serie. Por lo tanto tenemos que tener cuidado al realizar predicciones utilizando el comando Arima. Así volver a este punto más adelante. Como una comprobación rápida se va a calcular los intervalos de confianza para el sombrero: Podemos ver que el intervalo de confianza del 95 contiene el valor verdadero del parámetro de 0,6 beta1 y así podemos juzgar el modelo de un buen ajuste. Obviamente, esto se debe esperar ya que simula los datos en el primer lugar ¿Cómo hacer las cosas cambian si se modifica el signo de la beta 1 al -0,6 Vamos a realizar el mismo análisis: La salida es la siguiente: Podemos ver que en k1 tenemos una significativa pico en el correlogram, excepto que muestra una correlación negativa, ya que se casó esperar de un MA (1) modelo con primer coeficiente negativo. Una vez más, todos los picos más allá k1 son insignificantes. Permite encajar un (1) modelo MA y estimar el parámetro: el sombrero de -0,730, que es una pequeña subestimación de -0.6 beta1. Por último, vamos a calcular el intervalo de confianza: Podemos ver que el verdadero valor del parámetro de beta1-0.6 está contenida dentro del intervalo de confianza del 95, que nos proporciona evidencia de un buen ajuste del modelo. MA (3) Permite ejecutar a través del mismo procedimiento para un proceso MA (3). Esta vez debemos esperar picos significativos en k, y picos significativos o relevantes para k gt 3. Vamos a utilizar los siguientes coeficientes: 0,6 beta1, beta2 0.4 y 0.2 beta3. Permite simular un (3) proceso de MA de este modelo. Ive aumentó el número de muestras aleatorias a 1000 en esta simulación, lo que hace más fácil ver la verdadera estructura de autocorrelación, a expensas de hacer la serie original más difíciles de interpretar: La salida es la siguiente: Como era de esperar los tres primeros picos son significativos . Sin embargo, también lo es la cuarta. Sin embargo, podemos legítimamente sugieren que esto puede ser debido al sesgo de muestreo, ya que esperamos para ver 5 de los picos siendo significativa más allá de KQ. Vamos ahora adaptarse a una MA (3) modelo a los datos para tratar de estimar parámetros: El sombrero de las estimaciones de 0,544, 0,345 y sombrero sombrero de 0,298 están cerca de los verdaderos valores de la Beta10.6, beta20.4 y beta30.3, respectivamente. También podemos producir los intervalos de confianza usando los respectivos errores estándar: En cada caso los intervalos de confianza del 95 contienen el verdadero valor del parámetro y podemos concluir que tenemos un buen ajuste con nuestra (3) modelo MA, como cabría esperar. Datos Financieros En la Parte 1 se consideró Amazon Inc. (AMZN) y el Índice de Equidad de SampP500 Estados Unidos. Hemos equipado el modelo AR (p) a ambos y encontramos que el modelo no fue capaz de capturar con eficacia la complejidad de la correlación serial, especialmente en el elenco de la SampP500, donde los efectos de memoria a largo parecen estar presentes. No voy a trazar los gráficos de nuevo por los precios y autocorrelación, en lugar enferma usted se refiere a la entrada anterior. Amazon Inc. (AMZN) Le permite comenzar por tratar de encajar una selección de MA (q) modelos para AMZN, es decir, con q en. Al igual que en la parte 1, así utilizar quantmod para descargar los precios diarios de AMZN y luego convertirlos en un flujo de retornos de registro de los precios de cierre: Ahora que tenemos las declaraciones de registro de flujo podemos utilizar el comando Arima para adaptarse MA (1), MA (2) y (3) los modelos MA y luego estimar los parámetros de cada uno. Por MA (1) tenemos: Podemos trazar los residuos de los retornos diarios de registro y el modelo ajustado: Tenga en cuenta que tenemos un par de picos significativos en los retardos k2, k11, k16 y k18, lo que indica que el MA (1) modelo es Es improbable que sea un buen ajuste para el comportamiento de los retornos de registro AMZN, ya que este no se ve como una realización de ruido blanco. Vamos a tratar un (2) Modelo MA: Tanto de las estimaciones de los coeficientes beta son negativos. Lets parcela los residuos una vez más: Podemos ver que no hay casi cero autocorrelación en los primeros retardos. Sin embargo, tenemos cinco picos marginalmente significativos en los retardos K12, K16, K19, K25 y K27. Esto sugiere que el MA (2) modelo es la captura de una gran cantidad de la autocorrelación, pero no todos los efectos de memoria de largo. ¿Qué tal un (3) modelo MA Una vez más, podemos trazar los residuos: El MA (3) los residuos parcela se ve casi idéntica a la de la (2) Modelo MA. Esto no es sorprendente, ya que fueron la adición de un nuevo parámetro de un modelo que ha explicado aparentemente lejos la mayor parte de las correlaciones en los retardos más cortos, pero que no tendrá mucho efecto en el largo plazo se retrasa. Toda esta evidencia sugiere el hecho de que un modelo MA (q) es poco probable que sea útil para explicar la totalidad de la correlación en serie en el aislamiento. al menos para AMZN. SampP500 Si recuerdan, en la parte 1 vimos que la primera orden diferenciada diaria estructura de retornos de registro de la SampP500 poseía muchos picos significativos en diversos desfases, tanto a corto y largo plazo. Esto proporcionó evidencia de heteroscedasticidad condicional (es decir, la volatilidad de la agrupación) y los efectos de memoria de largo. Esto nos lleva a la conclusión de que el modelo AR (p) no fue suficiente para capturar toda la autocorrelación presente. A medida que hemos visto anteriormente el modelo MA (q) era insuficiente para captar la correlación serial adicional en los residuos del modelo ajustado a la primera orden diferenciada serie diaria de precios de registro. Ahora vamos a tratar de ajustar el modelo MA (q) a la SampP500. Uno podría preguntarse por qué estamos haciendo esto es si sabemos que es poco probable que sea un buen ajuste. Esta es una buena pregunta. La respuesta es que tenemos que ver exactamente cómo tampoco un buen ajuste, ya que este es el proceso final vamos a seguir cuando nos encontramos con mucho los modelos más sofisticados, que son potencialmente más difíciles de interpretar. Vamos a empezar por la obtención de los datos y su conversión a una primera orden diferenciada serie de precios transformados logarítmicamente de cierre diarios como en el artículo anterior: Ahora vamos para adaptarse a un (1), MA (2) y MA (3) modelo MA de la serie, como lo hicimos anteriormente para AMZN. Vamos a empezar con MA (1): Le permite hacer una gráfica de los residuos de este modelo ajustado: El primer pico significativo se produce en k2, pero hay muchos más en k en. Esto claramente no es una realización de ruido blanco y por lo que debemos rechazar la (1) modelo MA como un buen ajuste potencial para el SampP500. ¿La situación mejora con MA (2) Una vez más, vamos a hacer un gráfico de los residuos de esta (2) Modelo MA equipada: Si bien el pico a k2 ha desaparecido (como casarse esperar), todavía nos quedamos con los picos significativos en muchos retardos más largos en los residuos. Una vez más, nos encontramos con el (2) Modelo MA no es un buen ajuste. Debemos esperar, para el (3) modelo MA, para ver la correlación de menos de serie en k3 que para el MA (2), pero una vez más, también hay que contar con ninguna reducción de los retrasos adicionales. Finalmente, vamos a hacer un gráfico de los residuos de esta MA (3) modelo ajustado: Esto es precisamente lo que vemos en la correlogram de los residuos. De ahí que el MA (3), al igual que con los otros modelos anteriores, no es un buen ajuste para la SampP500. Los próximos pasos Hemos ahora examinaron dos principales modelos de series de tiempo en los detalles, a saber, el modelo Autogressive de orden p, AR (p) y luego de media móvil de orden q, MA (q).

Opciones Binarias el reten

Search This Blog

Autorregresivo Movimiento Autocorrelación Promedio

Comments

Post a Comment

Popular posts from this blog

Mejor Forex Diario De Outlook

Mejor Comercio En Línea Cuenta Con Nosotros

Bandas De Bollinger Pdf