Sunday 10 March 2019

Estimativa do parâmetro médio móvel


Na prática, a média móvel proporcionará uma boa estimativa da média das séries temporais se a média for constante ou se mudar lentamente. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo significará os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra as séries temporais usadas para ilustração juntamente com a demanda média da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ela aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então, torna-se constante novamente. Os dados são simulados adicionando à média, um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que em qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas em conjunto com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas médias móveis para a direita por períodos. Uma conclusão é imediatamente aparente da figura. Para as três estimativas, a média móvel está atrasada por trás da tendência linear, com o atraso crescente com m. O atraso é a distância entre o modelo e a estimativa na dimensão temporal. Por causa do atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um momento específico no valor médio do modelo e o valor médio previsto pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e tendência do estimador da média são dados nas equações abaixo. As curvas de exemplo não combinam essas equações porque o modelo de exemplo não está aumentando continuamente, antes ele começa como uma constante, muda para uma tendência e depois se torna constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada pela mudança das curvas para a direita. O atraso e o desvio aumentam proporcionalmente. As equações abaixo indicam o atraso e a polarização de um período de previsão para o futuro em relação aos parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel é baseado na suposição de uma média constante, e o exemplo tem uma tendência linear na média durante uma parcela do período de estudo. Uma vez que as séries em tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para esses resultados. Também podemos concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menores. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média. O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero e a variância do erro é composta por um termo que é uma função e um segundo termo que é a variância do ruído,. O primeiro termo é a variância da média estimada com uma amostra de observações m, assumindo que os dados provêm de uma população com um meio constante. Este termo é minimizado fazendo m o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar as previsões sensíveis às mudanças, queremos m o mais pequeno possível (1), mas isso aumenta a variação do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo suplemento para os dados da amostra na coluna B. As primeiras 10 observações são indexadas -9 a 0. Comparadas com a tabela acima, os índices do período são deslocados em -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usadas para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro médio móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto feito a partir da média móvel no tempo 0 é 11,1. O erro então é -5.1. O desvio padrão e o Desvio Médico Médio (MAD) são calculados nas células E6 e E7, respectivamente.8.4 Modelos médios em movimento Em vez de usar valores passados ​​da variável de previsão em uma regressão, um modelo de média móvel usa erros de previsão passados ​​em um modelo de regressão . Y c e theta e theta e dots theta e, onde et é ruído branco. Nós nos referimos a isso como um modelo de MA (q). Claro, não observamos os valores de et, portanto, não é realmente regressão no sentido usual. Observe que cada valor de yt pode ser pensado como uma média móvel ponderada dos últimos erros de previsão. No entanto, os modelos de média móvel não devem ser confundidos com o alisamento médio móvel que discutimos no Capítulo 6. Um modelo de média móvel é usado para prever valores futuros, ao passo que o alavanca média móvel é usada para estimar o ciclo de tendência dos valores passados. Figura 8.6: Dois exemplos de dados de modelos em média móveis com diferentes parâmetros. Esquerda: MA (1) com y t 20e t 0.8e t-1. Direito: MA (2) com t e t - e t-1 0.8e t-2. Em ambos os casos, e t é normalmente distribuído ruído branco com zero médio e variância um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterando os parâmetros theta1, dots, thetaq resulta em diferentes padrões de séries temporais. Tal como acontece com os modelos autorregressivos, a variância do termo de erro e só alterará a escala da série, e não os padrões. É possível escrever qualquer modelo AR (p) estacionário como modelo MA (infty). Por exemplo, usando a substituição repetida, podemos demonstrar isso para um modelo AR (1): begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et phi13y phi12e phi1e phi1e e amptext end Provided -1 lt phi1 lt 1, o valor de phi1k ficará menor quando k for maior. Então, eventualmente, obtemos et et phi1 e phi12 e phi13 e cdots, um processo MA (infty). O resultado inverso é válido se impomos algumas restrições nos parâmetros MA. Então, o modelo MA é chamado de inversível. Ou seja, podemos escrever qualquer processo de MA (q) inversível como um processo AR (infty). Os modelos invertidos não são simplesmente para nos permitir converter de modelos MA para modelos AR. Eles também têm algumas propriedades matemáticas que os tornam mais fáceis de usar na prática. As restrições de invertibilidade são semelhantes às restrições de estacionaria. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1 - theta2 lt 1. Condições mais complicadas mantêm-se para qge3. Mais uma vez, R irá cuidar dessas restrições ao estimar os modelos. Ao resolver as condições de primeira ordem, obtemos uma equação não-linear, que não pode ser explicitamente resolvida. Para o problema de minimização (11.27), geralmente implementa métodos de otimização numérica. O estimador de mínimos quadrados é assintoticamente eficiente e tem asfixicamente as mesmas propriedades que o estimador de máxima verossimilhança (ML). A seguir, assumimos um processo ARMA () estável e inversível com a representação AR (). A estimativa de máxima verossimilhança alude aos pressupostos de distribuição sob os quais as distribuições normais multivariadas com uma densidade com matriz de covariância, que é dada em (11.24) e a Vetor de parâmetros A função de verossimilhança é então uma função de densidade interpretada como uma função do vetor de parâmetros para observações determinadas, ou seja. Um escolhe o vetor de parâmetro respectivo que maximiza a função de verossimilhança para as observações dadas, isto é, o estimador ML é definido por Debaixo da hipótese da distribuição normal, o logaritmo da função de verossimilhança assume uma forma simples sem alterar o maximizador. A função log-verossimilhança (11.29) também é chamada de função exata de verossimilhança. Observa-se que, em particular, o cálculo do inverso e do determinante da () matriz é bastante envolvido para longas séries temporais. Portanto, muitas vezes é uma aproximação da probabilidade exata, o que é bom para longas séries temporais. Uma possibilidade é usar a distribuição condicional: sob a suposição de distribuições normais, as distribuições condicionais são normais com um valor esperado. Quanto maior for, melhor será a aproximação de. A função de log-verossimilhança condicional pode ser calculada a partir dos dados e otimizada em relação ao parâmetro. Como valor inicial para o algoritmo de otimização numérica, os estimadores de Yule-Walker, por exemplo, podem ser usados ​​(exceto em casos específicos de ineficiência assintótica). Para comparar os estimadores de verossimilhança exata e condicional, considere um processo de MA (1) (11.25) com e N. A matriz é banda diagonal com elementos na diagonal principal e em diagonais acima e abaixo. Duas realizações do processo com e são mostradas na Figura 11.7. Como o processo possui apenas um parâmetro, pode-se simplesmente procurar na região (-1,1). Isso é mostrado para ambos os estimadores na Figura 11.8 () e 11.9 (). Para o processo com um ainda vê uma clara discrepância entre as duas funções de verossimilhança, que para pode ser ignorada. Ambos os estimadores são neste caso bastante próximos do parâmetro verdadeiro 0.5. Fig .: Duas realizações de um processo MA (1) com, N, (acima) e (abaixo). SFEplotma1.xpl Fig .: Funções de probabilidade exatas (sólidas) e condicionais (tracejadas) para o processo MA (1) da figura 11.7 com. O parâmetro verdadeiro é. SFElikma1.xpl Fig .: Funções de probabilidade exatas (sólidas) e condicionais (tracejadas) para o processo MA (1) da figura 11.7 com. O parâmetro verdadeiro é. SFElikma1.xpl Sob alguns pressupostos técnicos, os estimadores ML são consistentes, assintoticamente eficientes e têm uma distribuição normal assintótica: com a matriz Fisher Information. Para a otimização da função de verossimilhança, freqüentemente usa métodos numéricos. A condição necessária para um máximo é com. Ao escolher um valor inicial (por exemplo, o estimador de Yule-Walker) e o graduador de aproximação de Taylor, Hess, obtém a seguinte relação: Uma vez que geralmente não se atinge imediatamente o parâmetro de maximização, um constrói a iteração até chegar a convergência , Ou seja, Muitas vezes, é mais fácil usar a expectativa da matriz de Hessian, ou seja, a matriz de informações de (11.31):

No comments:

Post a Comment