Thursday 31 October 2019

Moving average mean stata


Esta estrutura de dados é completamente imprópria para a finalidade. Assumindo um identificador id você precisa remodelar. por exemplo. Em seguida, uma média móvel é fácil. Use tssmooth ou apenas gerar. por exemplo. Mais sobre por que sua estrutura de dados é bastante imprópria: não só o cálculo de uma média móvel precisa de um loop (não necessariamente envolvendo egen), mas você estaria criando várias novas variáveis ​​extras. Usá-los em qualquer análise subsequente seria algo entre estranho e impossível. EDIT III dar um loop de amostra, enquanto não se deslocam da minha posição que é má técnica. Eu não vejo uma razão por trás de sua convenção de nomenclatura em que P1947 é um meio para 1943-1945 suponho que é apenas um erro de digitação. Vamos supor que temos dados para 1913-2017. Por meio de 3 anos, perdemos um ano em cada extremidade. Isso poderia ser escrito de forma mais concisa, à custa de uma enxurrada de macros dentro de macros. Usando pesos desiguais é fácil, como acima. A única razão para usar o egen é que ele não desiste se houver faltas, o que o acima fará. Por uma questão de exaustividade, note que é fácil lidar com falhas sem recorrer a egen. E o denominador Se todos os valores estiverem em falta, este reduz-se a 00, ou em falta. Caso contrário, se algum valor estiver faltando, adicionamos 0 ao numerador e 0 ao denominador, o que equivale a ignorá-lo. Naturalmente, o código é tolerável como acima para médias de 3 anos, mas para esse caso ou para a média de mais de anos, que iria substituir as linhas acima por um loop, que é o que egen does. MOVAVG: Stata módulo usando Mata para gerar Moving Médias Ao solicitar uma correção, mencione por favor estes itens handle: RePEc: boc: bocode: s457476. Veja informações gerais sobre como corrigir material no RePEc. Para questões técnicas sobre este item, ou para corrigir seus autores, título, resumo, informações bibliográficas ou download, entre em contato: (Christopher F Baum) Se você é autor deste item e ainda não está registrado no RePEc, recomendamos que o faça aqui . Isso permite vincular seu perfil a este item. Ele também permite que você aceite citações em potencial para este item que estamos incertos sobre. Se as referências estiverem totalmente ausentes, você pode adicioná-las usando este formulário. Se as referências completas listarem um item que está presente no RePEc, mas o sistema não tiver vinculado a ele, você pode ajudar com este formulário. Se você souber de itens ausentes citando este, você pode nos ajudar a criar esses links adicionando as referências relevantes da mesma maneira como acima, para cada item referente. Se você é um autor registrado deste item, você também pode querer verificar a guia de citações em seu perfil, pois pode haver algumas citações esperando confirmação. Tenha em atenção que as correcções podem demorar algumas semanas para filtrar os vários serviços RePEc. Mais serviços Seguir séries, jornais, autores e mais Novos artigos por e-mail Subscrever novas adições ao RePEc Registro de autor Perfis públicos para pesquisadores de Economia Vários rankings de pesquisa em Economia e campos relacionados Quem foi um estudante de quem, usando RePEc Biblio Artigos curados amp Artigos em vários tópicos de economia Carregue seu artigo para ser listado em RePEc e IDEAS EconAcademics Blog agregador para pesquisa de economia Plagiarismo Casos de plágio em Economia Papéis do mercado de trabalho RePEc série de trabalho de trabalho dedicado ao mercado de trabalho Fantasy League Finja que você está no comando de uma economia Departamento de serviços da StL Fed dados, pesquisa, apps amp mais do St. Louis FedI tem uma série de tempo de medição horária de variáveis ​​ambientais e meteorológicas (temperatura e umidade) ao longo de vários anos. A partir desses valores horários eu gostaria de calcular uma média de 24 horas correndo para criar parâmetro de exposição. Para isso, a exigência é que pelo menos 17 das medidas horárias devem estar disponíveis com não mais de 6 horas de valores perdidos consecutivos. Se mais de 6 valores de hora em falta consecutivamente em 24, os dados para essa data específica está definido como ausente. Como posso implementar isso em Stata ou SAS Obrigado antecipadamente perguntado Jun 27 12 at 15:33 Para cálculos gerais de média móvel, usando PROC EXPAND é o método mais fácil (você precisa ETS licenciado para usar este procedimento). Por exemplo, o código abaixo calculará uma média móvel de 24 períodos e definirá as primeiras 16 observações em falta. No entanto, para cumprir o restante de seus critérios, você ainda precisará executar uma etapa de dados mais tarde, ao longo das linhas de código Robs, assim você pode também executar todos os cálculos dentro dessa etapa. Respondeu Jun 28 12 at 13:11 Sua resposta 2017 Stack Exchange, Incestata: Análise de Dados e Software Estatístico Nicholas J. Cox, Universidade de Durham, Reino Unido Christopher Baum, Faculdade de Boston egen, ma () e suas limitações Statarsquos comando mais óbvio para calcular movendo É a função ma () de egen. Dada uma expressão, cria uma média móvel - period dessa expressão. Por padrão, é tomado como 3. deve ser ímpar. No entanto, como a entrada manual indica, egen, ma () não pode ser combinado com varlist:. E, por esse motivo, não é aplicável aos dados do painel. Em qualquer caso, fica fora do conjunto de comandos especificamente escritos para séries temporais, veja as séries temporais para detalhes. Abordagens alternativas Para calcular médias móveis para dados de painel, existem pelo menos duas opções. Ambos dependem do conjunto de dados ter sido tsset previamente. Isso vale muito a pena fazer: não só você pode salvar a si mesmo repetidamente especificando variável de painel e variável de tempo, mas Stata se comporta de forma inteligente, dada qualquer lacuna nos dados. 1. Escreva sua própria definição usando generate Usando operadores de séries temporais como L. e F. Dar a definição da média móvel como o argumento para uma declaração de geração. Se você fizer isso, você não estará, naturalmente, limitado às médias móveis ponderadas (não ponderadas) centradas calculadas por egen, ma (). Por exemplo, as médias móveis ponderadas de três períodos seriam dadas por e alguns pesos podem ser facilmente especificados: Você pode, naturalmente, especificar uma expressão como log (myvar) em vez de um nome de variável como myvar. Uma grande vantagem dessa abordagem é que a Stata automaticamente faz a coisa certa para os dados do painel: os valores iniciais e retardatários são elaborados dentro dos painéis, exatamente como a lógica determina que eles devam ser. A desvantagem mais notável é que a linha de comando pode ficar bastante longa se a média móvel envolver vários termos. Outro exemplo é uma média móvel unilateral baseada apenas em valores anteriores. Isso poderia ser útil para gerar uma expectativa adaptativa do que uma variável será baseada puramente em informações até à data: o que alguém poderia prever para o período atual baseado nos últimos quatro valores, usando um esquema de ponderação fixo Especialmente comumente usado com timeseries trimestrais.) 2. Use egen, filter () de SSC Use o filtro de função egen escrito pelo usuário () do pacote egenmore em SSC. No Stata 7 (atualizado após 14 de novembro de 2001), você pode instalar este pacote após o qual a ajuda egenmore aponta para detalhes sobre filter (). Os dois exemplos acima seriam renderizados (nesta comparação, a abordagem de gerar é talvez mais transparente, mas veremos um exemplo do oposto em um momento). Os retornos são um numlist. Leva-se a defasagens negativas: nesse caso -11 se expande para -1 0 1 ou chumbo 1, atraso 0, atraso 1. Os coeficientes, outro número, multiplicam os itens correspondentes retardados ou principais: neste caso, esses itens são F1.myvar . Myvar e L1.myvar. O efeito da opção de normalização é escalar cada coeficiente pela soma dos coeficientes para que o coeficiente (1 1 1) normalize seja equivalente aos coeficientes de 13 13 13 e o coeficiente (1 2 1) normalize seja equivalente aos coeficientes de 14 12 14 Você deve especificar não apenas os atrasos, mas também os coeficientes. Como egen, ma () fornece o caso igualmente ponderado, a razão principal para egen, filter () é suportar o caso desigualmente ponderado, para o qual você deve especificar coeficientes. Poderia também ser dito que obrigar os usuários a especificar coeficientes é uma pequena pressão extra sobre eles para pensar sobre quais coeficientes eles querem. A principal justificativa para pesos iguais é, suponhamos, simplicidade, mas pesos iguais têm propriedades de domínio de frequência ruim, para mencionar apenas uma consideração. O terceiro exemplo acima pode ser qualquer um dos quais é quase tão complicado quanto a abordagem gerar. Há casos em que egen, filter () dá uma formulação mais simples do que gerar. Se você quer um filtro binomial de nove períodos, que os climatologistas acham útil, então parece talvez menos horrível do que, e mais fácil de obter do que, Assim como com a abordagem de geração, egen, filter () funciona corretamente com dados do painel. Na verdade, como dito acima, depende do conjunto de dados ter sido tsset previamente. Uma dica gráfica Depois de calcular suas médias móveis, você provavelmente vai querer olhar para um gráfico. O comando tsgraph escrito pelo usuário é inteligente sobre conjuntos de dados tsset. Instale-o em um Stata 7 atualizado por ssc inst tsgraph. O que sobre subconjunto com se nenhum dos exemplos acima fazer uso de se restrições. Na verdade egen, ma () não permitirá se a ser especificado. Ocasionalmente as pessoas querem usar se ao calcular médias móveis, mas seu uso é um pouco mais complicado do que é normalmente. O que você esperaria de uma média móvel calculada com if. Vamos identificar duas possibilidades: Fraca interpretação: Eu não quero ver nenhum resultado para as observações excluídas. Interpretação forte: Eu nem quero que você use os valores para as observações excluídas. Aqui está um exemplo concreto. Suponha como conseqüência de alguma condição if, as observações 1-42 estão incluídas, mas não as observações 43 sobre. Mas a média móvel de 42 dependerá, entre outras coisas, do valor de observação 43 se a média se estender para trás e para a frente e for de comprimento pelo menos 3, e dependerá também de algumas das observações 44 em diante em algumas circunstâncias. Nossa suposição é que a maioria das pessoas iria para a interpretação fraca, mas se isso está correto, egen, filter () não suporta se. Você sempre pode ignorar o que você donrsquot quer ou mesmo definir valores indesejados para desaparecer depois, usando substituir. Uma nota sobre os resultados faltando nas extremidades da série Como as médias móveis são funções de defasagens e derivações, egen, ma () produz faltando onde não existem os retornos e as derivações, no início e no final da série. Uma opção nomiss força o cálculo de médias móveis mais curtas e não centralizadas para as caudas. Em contraste, nem gerar nem egen, filter () faz, ou permite, nada de especial para evitar resultados em falta. Se algum dos valores necessários para o cálculo estiver faltando, então esse resultado está ausente. Cabe aos usuários decidir se e o que a cirurgia corretiva é necessária para essas observações, presumivelmente depois de olhar para o conjunto de dados e considerar qualquer ciência subjacente que pode ser levado a suportar.

No comments:

Post a Comment