Objetivo: Verificar os lotes de autocorrelação de aleatoriedade (Box e Jenkins, pp. 28-32) são uma ferramenta comumente usada para verificar aleatoriedade em um conjunto de dados. Essa aleatoriedade é verificada pela computação de autocorrelações para valores de dados em diferentes intervalos de tempo. Se aleatório, tais autocorrelações devem estar próximas de zero para separações de tempo e intervalo. Se não aleatório, uma ou mais das autocorrelações serão significativamente diferentes de zero. Além disso, os gráficos de autocorrelação são usados na fase de identificação do modelo para os modelos de séries temporais médias autorregressivas Box-Jenkins. Autocorrelação é apenas uma medida da aleatoriedade Observe que não corretamente não significa aleatoriamente. Os dados que possuem autocorrelação significativa não são aleatórios. No entanto, dados que não mostram autocorrelação significativa ainda podem exibir aleatoriedade de outras maneiras. A autocorrelação é apenas uma medida de aleatoriedade. No contexto da validação do modelo (que é o tipo primário de aleatoriedade que discutimos no Manual), verificar a autocorrelação é tipicamente um teste suficiente de aleatoriedade, uma vez que os resíduos de modelos de montagem pobres tendem a exibir aleatoriedade não sutil. No entanto, algumas aplicações exigem uma determinação mais rigorosa da aleatoriedade. Nesses casos, uma série de testes, que podem incluir a verificação da autocorrelação, são aplicados, uma vez que os dados podem ser não-aleatórios de muitas formas diferentes e muitas vezes sutis. Um exemplo de onde uma verificação mais rigorosa da aleatoriedade é necessária seria testar geradores de números aleatórios. Lote de amostra: as correções automáticas devem ser próximas de zero para aleatoriedade. Tal não é o caso neste exemplo e, portanto, a suposição de aleatoriedade falha. Esse gráfico de autocorrelação de amostra mostra que a série de tempo não é aleatória, mas sim um alto grau de autocorrelação entre observações adjacentes e adjacentes. Definição: r (h) versus h Os gráficos de autocorrelação são formados por eixo vertical: coeficiente de autocorrelação onde C h é a função de autocovariância e C 0 é a função de variância Observe que R h está entre -1 e 1. Observe que algumas fontes podem usar o Seguinte fórmula para a função de autocovariância Embora esta definição tenha menor preconceito, a formulação (1 N) possui algumas propriedades estatísticas desejáveis e é a forma mais utilizada na literatura estatística. Veja as páginas 20 e 49-50 em Chatfield para obter detalhes. Eixo horizontal: intervalo de tempo h (h 1, 2, 3.) A linha acima também contém várias linhas de referência horizontais. A linha do meio está em zero. As outras quatro linhas são 95 e 99 bandas de confiança. Observe que existem duas fórmulas distintas para gerar as bandas de confiança. Se o gráfico de autocorrelação estiver sendo usado para testar aleatoriedade (ou seja, não há dependência de tempo nos dados), recomenda-se a seguinte fórmula: onde N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa ) É o nível de significância. Nesse caso, as bandas de confiança possuem uma largura fixa que depende do tamanho da amostra. Esta é a fórmula que foi usada para gerar as bandas de confiança no gráfico acima. Os gráficos de autocorrelação também são usados no estágio de identificação do modelo para montagem de modelos ARIMA. Neste caso, um modelo de média móvel é assumido para os dados e as seguintes faixas de confiança devem ser geradas: onde k é o atraso, N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa) é O nível de significância. Nesse caso, as bandas de confiança aumentam à medida que o atraso aumenta. O gráfico de autocorrelação pode fornecer respostas para as seguintes questões: Os dados são aleatórios É uma observação relacionada a uma observação adjacente É uma observação relacionada a uma observação duas vezes removida (etc.) É a série de tempo observada ruído branco É a série temporal observada sinusoidal A série temporal observada é autorregressiva. O que é um modelo apropriado para as séries temporais observadas. O modelo é válido e suficiente. A ssqrt da fórmula é válida. Importância: Garantir a validade das conclusões de engenharia. A aleatoriedade (juntamente com modelo fixo, variação fixa e distribuição fixa) é Um dos quatro pressupostos que geralmente dependem de todos os processos de medição. O pressuposto de aleatoriedade é extremamente importante para os seguintes três motivos: a maioria dos testes estatísticos padrão depende da aleatoriedade. A validade das conclusões do teste está diretamente ligada à validade do pressuposto de aleatoriedade. Muitas fórmulas estatísticas comumente usadas dependem da suposição de aleatoriedade, sendo a fórmula mais comum a fórmula para determinar o desvio padrão da amostra: onde s é o desvio padrão dos dados. Embora fortemente utilizados, os resultados da utilização desta fórmula não têm valor a menos que a suposição de aleatoriedade se mantenha. Para dados univariados, o modelo padrão é Se os dados não são aleatórios, este modelo é incorreto e inválido, e as estimativas para os parâmetros (como a constante) tornam-se absurdas e inválidas. Em suma, se o analista não verificar a aleatoriedade, a validade de muitas das conclusões estatísticas torna-se suspeita. A trama de autocorrelação é uma excelente maneira de verificar essa aleatoriedade. A autocorrelação é a correlação entre observações que são n tempos separados. Ele mede a relação entre os valores atrasados de uma série temporal, assim como a correlação de Pearsons mede o grau de uma relação linear entre duas variáveis. A função de autocorrelação é usada na modelagem econométrica para determinar estacionaridade e sazonalidade. Uuml Execute o comando Statisrarrarramaime rarrAutocorrelação e autocorrelação parcial. Uuml Selecione uma variável contendo uma série de tempo x i. Uuml Digite o valor do atraso para o campo de comprimento de atraso. A magnitude do intervalo de tempo determina a ordem do coeficiente de autocorrelação. Uuml Para plotar um correlograma, verifique a opção Plot ACF. A opção Tramas parciais do traço adiciona correlacionamento parcial ao relatório. Uuml Verifique a opção Remover média para preparar séries temporais com média removida. Uuml Use a opção Compute Differenced Series para aplicar o operador de diferenciação às séries temporais. A diferenciação pode ajudar a estabilizar a média de uma série temporal, removendo as mudanças no nível de uma série temporal, e assim eliminando a HYN de tendência e sazonalidade. O Para aplicar o operador mais de uma vez, altere o valor da opção Diferenças de ordem (Repetir N vezes). O Opcionalmente, altere o valor de atraso de diferenciação (o valor padrão é 1). Uuml Opcionalmente, selecione o algoritmo de cálculo de erro padrão. Existem duas maneiras de calcular o erro padrão da autocorrelação da amostra: o Se assumirmos que o processo é ruído branco (verifique a opção de erro padrão de ruído branco), o erro padrão é aproximado pela raiz quadrada (Caixa e Jenkins, CAIXA) :. Pressupostos As observações da série temporal são igualmente espaçadas. O relatório inclui a média geral, variância e uma tabela, mostrando as seguintes estatísticas para cada valor de lag: coeficiente de autocorrelação. Limites de confiança inferiores e superiores para. Erro padrão, parcial R, Box8209Ljung Q. Global significa a média de todas as observações na série temporal. Varia a variância da série temporal. Lags table Paral R (PACF) estimativa de autocorrelação parcial. A autocorrelação parcial é a correlação entre uma série temporal e seus atrasos com os efeitos de atrasos de ordem inferior mantidos constantes e, portanto, remove os laços lineares entre as séries atrasadas. A função de autocorrelação parcial (PACF) é calculada usando o algoritmo de Durbin-Levinson QEN:. O PACF pode revelar a presença do processo autorregressivo na série temporal. Box-Ljung Q uma medida de autocorrelação. A estatística Box-Ljung Q é chi-quadrado distribuída com graus de liberdade k-p-q. Onde p e q são autoregressivos e movendo ordens médias, respectivamente. No lag k. A estatística Box-Ljung é definida como:. Correlogramas Correlogramas (autocorrelação e parcelamentos de autocorrelação parcial) são úteis para a identificação preliminar de um modelo ARIMA. Compare o correlograma de amostra com o correlograma teórico para um processo estacionário. Se a série temporal estiver parada, o ACF diminui praticamente quase imediatamente. Se o gráfico parece não estacionário, tente identificar a tendência e aplicar a diferenciação para removê-la. Se a série não for ajustada sazonalmente, pode ser necessário um tratamento especial. As autocorrelações positivas são freqüentemente encontradas entre os tempos econômicos, devido à persistência associada aos ciclos econômicos e aos períodos de expansão ou recessão. Os processos médios móveis têm o ACF com picos para os primeiros atrasos e o PACF mostra decaimento exponencial. O número de pontos indica a ordem da média móvel. ACF mostra decadência exponencial Os correlogramas mostram que a função de autocorrelação para as séries temporais do PIB permanece significativa para os primeiros cinco atrasos. Mesmo sem indicadores adicionais, podemos concluir que a série temporal não é estacionária. No entanto, mais tarde veremos que a diferenciação de primeira ordem restaura a estacionararia. 1. Abra a série de tempo - conjunto de dados de autocorrelação. 2. Os valores variáveis do PIB são o produto interno bruto (PIB) da Estónia em milhões de euros para 2001 2015 anos (trimestralmente). 3. Execute o comando Statisticsrarr Time SeriesrarrAutocorrelation. 4. Selecione a variável GDP como séries temporais, insira 25 (metade do número de observações) como contagem de atrasos. Verifique as opções Plot ACF e Plot Partial e deixe os valores padrão para outras opções. Verifique a opção Diferença de Lag Valores e deixe o campo Diferenças de ordem igual a 1, para obter as diferenças de primeira ordem. 4. Execute o comando. 5. As parcelas acima mostram que o ACF para o PIB permanece significativo e alto, flutuando em torno de zero porque o PIB tem uma tendência devido à sua natureza econômica. Como o correlograma ACF mostra valores positivos e negativos alternativos (um indicador de uma série estacionária), podemos assumir que as séries temporais diferenciadas são estacionárias e usam-na para modelagem adicional. A decadência não é exponencial, portanto, é recomendável executar testes de estacionaria. Referências BAR Bartlett, M. S. 1946. Sobre a especificação teórica das propriedades de amostragem das séries temporais autocorrelacionadas. Journal of Royal Statistical Society, Série B, 8: 27. BOX Box, G. E. P. e Jenkins, G. M. 1976. Análise de séries temporais: Previsão e controle. San Francisco: Holden-Day. Análise da série de tempo QEN. Boston: Duxbury Press. Quenouville, M. H. 1949. Testes aproximados de correlação em séries temporais. Jornal da Royal Statistical Society, Série B, 11: 68. HYN Hyndman R. Athanasopoulos G. (2014) Previsão: princípios e prática. Publicado por Otexts. Disponível on-line no otextsfpp ORD Princípios de Previsão de Negócios, Keith Ord, Robert Fildes. South-Western College Publishing, New York, NY (2012) Qual é a diferença entre a correlação automática, a correlação automática parcial e a correlação automática inversa ao modelar uma série ARIMA A correlação automática refere-se à correlação de uma série temporal com seus próprios valores passados e futuros , A correlação automática também é chamada de correlação em atraso ou correlação serial, que se refere à correlação entre membros de uma série de números arranjados no tempo. A correlação automática positiva pode ser considerada uma forma específica de persistência, uma tendência para que um sistema permaneça no mesmo estado de uma observação para a próxima. Por exemplo, a probabilidade de que amanhã esteja chuvoso é maior se hoje estiver chuvoso do que se hoje estiver seco. As séries temporais geofísicas são freqüentemente correlacionadas automaticamente devido a inércia ou processos de transição no sistema físico. A correlação automática complica a aplicação de testes estatísticos, reduzindo o número de observações independentes, também complicando a identificação de variância ou correlação significativa entre as séries temporais, é previsível, probabilisticamente, porque os valores futuros dependem dos valores atuais e passados. Três ferramentas para avaliar a correlação automática de um tempo (1) o gráfico de séries temporais (2) o amplificador de trama de dispersão retardada (3) a função de correlação automática. Um padrão mais claro para um modelo de MA está no ACF. O ACF terá autocorrelações não-zero somente em atrasos envolvidos no modelo. O PACF leva em consideração a correlação entre uma série de tempo e cada um de seus valores de atraso intermédios. A identificação de um modelo de MA é muitas vezes melhor feita com o ACF em vez do PACF. Para um modelo de MA, o PACF teórico não desliga, mas, em vez disso, se encaixa em direção a 0 de alguma forma. Isso é útil para detectar a ORDEM de um modelo automático regressivo. Ou seja, o PACF para uma série de tempo com o atraso 1 terá valor não-zero somente até 1, a função de auto-correlação parcial (PACF) fornece a correlação parcial de uma série de tempo com seus próprios valores atrasados, controlando os valores de As séries temporais em todos os atrasos mais curtos. Isso contrasta com a função de auto-correlação, que não controla outros atrasos. A identificação de um modelo AR é muitas vezes melhor feita com o PACF. Para um modelo AR, o PACF teórico desliga após a ordem do modelo. A frase desliga significa que, em teoria, as autocorrelações parciais são iguais a 0, além desse ponto . Dito de outra forma, o número de autocorrelações parciais não-zero dá a ordem do modelo AR. Por ordem do modelo, queremos dizer o atraso mais extremo de x que é usado como preditor. Esta função foi introduzida por Cleveland em 1972 para séries de tempo estacionárias discretas. Existem 2 Métodos para estimar IACF. 1) Estimando o espectro de dados ao suavizar o periodograma, tomando o recíproco da estimativa e depois calculando a transformação de Fourier. 2) Aproximação do modelo por processo AR adequado, estimando os parâmetros deste modelo usando Yule-Walker Equations. As autocorrelações inversas de uma série de tempo são definidas como as autocorrelações associadas ao inverso da densidade espectral da série. Eles podem ser estimados pelo cálculo das autocorrelações associadas ao inverso de uma estimativa de densidade espectral. Dois métodos diferentes de estimar as autocorrelações inversas resultam de dois métodos diferentes de estimar a densidade espectral a retardo regressivo e periodograma. As estimativas das autocorrelações inversas são usadas para auxiliar na identificação de um modelo auto-regressivo, parcimonioso e móvel, para a série e fornecer estimativas iniciais aproximadas dos parâmetros para uma busca iterativa para o máximo da função de verossimilhança. As técnicas discutidas são aplicadas em leituras de concentração de processos químicos, medições de velocidade do vento e dados sísmicos da lua. 2k Vistas middot View Upvotes middot Resposta solicitada por
Комментариев нет:
Отправить комментарий