Tuesday 27 June 2017

Movendo Média Regressão Stata


Moving averages. Moving averages. With conjuntos de dados convencionais, o valor médio é muitas vezes o primeiro, e um dos mais úteis, sumário estatísticas para calcular Quando dados está na forma de uma série de tempo, a série média é uma medida útil, mas não Refletem a natureza dinâmica dos dados Os valores médios calculados em períodos curtos, quer precedendo o período atual, quer centrados no período atual, são freqüentemente mais úteis Como esses valores médios variam ou se movem, à medida que o período atual se move do tempo t 2, T 3 etc, são conhecidos como médias móveis Mas Uma média móvel simples é tipicamente a média não ponderada de k valores anteriores Uma média móvel exponencialmente ponderada é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela sua proximidade à Tempo atual Porque não há uma, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisado como uma série e usado na modelagem e forec Asting Uma série de modelos podem ser construídos usando médias móveis e estes são conhecidos como modelos MA Se esses modelos são combinados com modelos AR autorregressivo os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA o I é para médias móveis. Simple integrado. Since Uma série temporal pode ser considerada como um conjunto de valores,, t 1,2,3,4, n a média desses valores pode ser calculada Se assumirmos que n é bastante grande, e selecionamos um inteiro k que é muito menor Que n podemos calcular um conjunto de médias de bloco ou médias simples de movimento de ordem k. Cada medida representa a média dos valores de dados sobre um intervalo de observações k Note que a primeira MA possível de ordem k 0 é a de tk Mais geralmente Podemos descartar o subscrito extra nas expressões acima e write. This afirma que a média estimada no tempo t é a média simples do valor observado no tempo t e os passos de tempo anteriores k -1 Se forem aplicados pesos que diminuem a contribuição de Observações que são Mais afastado no tempo, diz-se que a média móvel é suavizada exponencialmente As médias móveis são frequentemente utilizadas como uma forma de previsão, pelo que o valor estimado para uma série no instante t 1, S t 1 é tomado como MA para o período até E incluindo o tempo teg hoje a estimativa de s é baseada em uma média de valores previamente registados até e inclusive ontem para dados diários. As médias móveis simples podem ser vistas como uma forma de suavização No exemplo ilustrado abaixo, o conjunto de dados de poluição atmosférica mostrado no A introdução a este tópico foi aumentada por uma linha MA de 7 dias de média móvel, mostrada aqui em vermelho. Como pode ser visto, a linha de MA suaviza os picos e depressões nos dados e pode ser muito útil na identificação de tendências. Fórmula de cálculo significa que os primeiros k -1 pontos de dados não têm nenhum valor de MA, mas depois cálculos se estendem para o ponto de dados final na série. PM10 valores médios diários, Greenwich. source Londres Air Quality Network. One razão para a computação simple mover um Da forma descrita é que ele permite que os valores sejam calculados para todos os intervalos de tempo do tempo tk até o presente, e como uma nova medição é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já Calculado Isso fornece um procedimento simples para conjuntos de dados dinâmicos No entanto, existem alguns problemas com esta abordagem É razoável argumentar que o valor médio nos últimos 3 períodos, digamos, deve ser localizado no tempo t -1, não no tempo t e para um MA durante um número par de períodos, talvez ele deve ser localizado no ponto médio entre dois intervalos de tempo Uma solução para esta questão é usar cálculos centralizados MA, em que a MA no tempo t é a média de um conjunto simétrico de valores em torno de T Apesar de seus méritos óbvios, esta abordagem não é geralmente usada porque requer que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centralizado pode ser preferível. As médias móveis podem Ser considerada como uma forma de suavização, removendo alguns componentes de alta freqüência de uma série de tempo e destacando, mas não removendo tendências de forma semelhante à noção geral de filtragem digital Na verdade, as médias móveis são uma forma de filtro linear É possível aplicar um Por exemplo, com uma média móvel de ordem 2, podemos considerá-la como sendo calculada usando pesos, de modo que a MA em x 2 0 5 x é calculada a partir de uma série que já foi suavizada, ou seja, suavizando ou filtrando uma série já suavizada. 1 0 5 x 2 Da mesma forma, a MA em x 3 0 5 x 2 0 5 x 3 Se aplicarmos um segundo nível de suavização ou filtragem, temos 0 5 x 2 0 5 x 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 ou seja, o processo de filtragem de dois estágios ou convolução produziu uma média móvel simétrica ponderada de forma variável, com pesos As circunvoluções múltiplas podem produzir valores ponderados bastante complexos Médias móveis, algumas das quais foram encontradas de uso particular em campos especializados, como na vida i Por exemplo, com dados mensais as variações sazonais podem muitas vezes ser removidas se este for o objetivo de aplicar uma média móvel simétrica de 12 meses com a média móvel. Todos os meses ponderados igualmente, exceto o primeiro eo último que são ponderados por 1 2 Isto é porque haverá 13 meses no modelo simétrico tempo atual, t - 6 meses O total é dividido por 12 Procedimentos semelhantes podem ser adotados para qualquer bem - As médias móveis ponderadas exponencialmente. Com a fórmula da média móvel simples. Todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, t cada um dos k pesos seria igual a 1 k então a soma dos pesos seria 1 ea . Já vimos que múltiplas aplicações desse processo resultam em pesos variando Com médias móveis exponencialmente ponderadas a contribuição para o valor médio de observações que São mais removidos no tempo é deliberada reduzida, enfatizando assim mais recentes eventos locais Essencialmente um parâmetro de suavização, 0 1, é introduzido, ea fórmula revisada para. A versão simétrica desta fórmula seria da forma. Se os pesos na simétrica Modelo são selecionados como os termos dos termos da expansão do binômio, 1 2 1 2 2q eles somarão a 1, e como q se torna grande, aproximar-se-á a distribuição Normal Esta é uma forma de ponderação do kernel, com o Binomial agindo como o Função de núcleo A convolução de dois estágios descrita na subseção anterior é precisamente esta disposição, com q 1, produzindo os pesos. Em suavização exponencial é necessário usar um conjunto de pesos que somam a 1 e que reduzem em tamanho geometricamente. Os pesos usados ​​são Tipicamente da forma. Para mostrar que esses pesos somam 1, considere a expansão de 1 como uma série Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial 1-xp em que x 1 e p -1, que dá . Isto fornece uma forma de média móvel ponderada da forma. Esta soma pode ser escrita como uma relação de recorrência, o que simplifica muito a computação e evita o problema de que o regime de ponderação deve ser rigorosamente infinito para que os pesos somem 1 para valores pequenos A notação usada por diferentes autores varia Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada, e write. where que a literatura de teoria de controle freqüentemente usa Z em vez de S para o exponencialmente ponderada ou suavizada Verificam-se, por exemplo, Lucas e Saccucci, 1990, LUC1 e o website do NIST para mais detalhes e exemplos trabalhados. As fórmulas citadas acima derivam do trabalho de Roberts 1959, ROB1, mas Hunter 1986, HUN1 usa uma expressão da forma. Que pode ser mais apropriado para uso em alguns procedimentos de controle Com 1 a estimativa média é simplesmente o seu valor medido ou o valor do item de dados anterior Com 0 5 a estimativa é o simples m A média das medições atuais e anteriores Em modelos de previsão o valor, S t é freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1 Assim, temos. Isto mostra que a previsão Valor no tempo t 1 é uma combinação da média móvel exponencial ponderada anterior mais uma componente que representa o erro de previsão ponderado, no tempo t. Assumindo uma série temporal é dada e uma previsão é necessária, um valor para é necessário Isto pode ser estimado A partir dos dados existentes, avaliando a soma dos erros de predição quadrados obtendo valores variáveis ​​de para cada t 2,3 definindo a primeira estimativa como sendo o primeiro valor de dados observado x 1 Em aplicações de controle o valor de é importante naquele é usado Na determinação dos limites de controlo superior e inferior e afecta o comprimento médio de execução ARL esperado antes destes limites de controlo serem quebrados sob o pressuposto de que a série cronológica representa um conjunto de dados aleatórios, idênticos Variáveis ​​independentes distribuídas com variância comum Nestas circunstâncias, a variância da estatística de controle é Lucas e Saccucci, 1990. Os limites de controle são geralmente definidos como múltiplos fixos dessa variância assintótica, eg - 3 vezes o desvio padrão Se 0 25, por exemplo, E os dados que estão sendo monitorados assumem uma distribuição Normal, N 0,1, quando em controle, os limites de controle serão -1 134 eo processo atingirá um ou outro limite em 500 passos em média Lucas e Saccucci 1990 LUC1 derivam As ARLs para uma ampla gama de valores e sob várias suposições usando procedimentos de Cadeia de Markov Eles tabulam os resultados, incluindo o fornecimento de ARLs quando a média do processo de controle foi deslocada por algum múltiplo do desvio padrão Por exemplo, com um deslocamento 0 5 com 0 25 o ARL é menor que 50 passos de tempo. As abordagens descritas acima é conhecido como suavização exponencial única como os procedimentos são aplicados uma vez para a série temporal e, em seguida, analisa ou controla pr Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, o alisamento exponencial de dois ou três estágios pode ser aplicado como um meio de remover explicitamente a modelagem desses efeitos, veja a seção sobre Previsão abaixo e O NIST trabalhou exemplo. CHA1 Chatfield C 1975 A análise da teoria e da prática da série do tempo Chapman e salão, Londres. HUN1 Hunter J S 1986 A média móvel exponencialmente ponderada J de Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Coeficientes de Controle de Média Móvel Ponderados Exponencialmente Propriedades e Melhorias Technometrics, 32 1, 1-12. ROB1 Roberts SW 1959 Testes de Gráficos de Controle Baseados em Médias Móveis Geométricas Technometrics, 1, 239-250.Eu estou lutando com uma pergunta em Cameron e Trivedi s Microeconometria usando Stata A questão diz respeito a um conjunto de dados de corte transversal com duas variáveis-chave, Ganhos lnearns e horas trabalhadas anual hours. I estou lutando com a parte 2 da pergunta, mas eu vou tipo toda a coisa para contexto. A média móvel de y após os dados são classificados por x é um caso simples de regressão não paramétrica de y em x. Modificar os dados por horas. Criar uma média móvel de 15 períodos centrada de lnearns com i observação ymai 1 25 soma de j -12 a j 12 de yi j Isso é mais fácil usando o comando forvalues. Plot esta média móvel contra horas usando o Twoway conectado gráfico command. I m não sei o que comandos s para usar para uma média móvel de dados transversais nem eu realmente entendo o que uma média móvel sobre um período de dados mostra. Any ajuda seria ótimo e por favor diga se mais informações é necessário Thanks. Should ser capaz de baixar o conjunto de dados a partir daqui É um pequeno extrato de 1992 a nível individual de dados do Painel Estudo de Dinâmica de Renda - usado no textbook. Still ainda se acostumar com a sintaxe, mas aqui está a minha tentativa de. Em realidade, este conjunto de dados pode ser lido em um diretório adequado por. Este método de suavização é problemático em que o tipo de horas não tem um resultado único em termos de valores da resposta sendo alisada Mas uma implementação com espírito semelhante é possível com rangestat SSC. Há muitas outras maneiras de suavizar um é. Mesmo melhor seria usar lpoly. Stata análise de dados e estatística Software. Nicholas J Cox, Universidade de Durham, Reino Unido Christopher Baum, Boston College. egen, ma e suas limitações. Stata s mais óbvio Comando para calcular médias móveis é a função ma de egen Dada uma expressão, cria uma média móvel - period daquela expressão Por padrão, é tomado como 3 deve ser ímpar. No entanto, como a entrada manual indica, egen, ma não pode ser Combinar Ed com por varlist e, por esse motivo, não é aplicável a dados de painel Em qualquer caso, ele está fora do conjunto de comandos especificamente escrito para as séries temporais ver séries de tempo para detalhes. Alternative abordagens. Para calcular médias móveis para dados do painel , Há pelo menos duas opções Ambos dependem do conjunto de dados ter sido tsset de antemão Isto é muito vale a pena fazer não só você pode salvar-se repetidamente especificando variável de painel e variável de tempo, mas Stata se comporta inteligentemente dado quaisquer lacunas nos dados. Usando-se gerar. Usando operadores de séries temporais como L e F, damos a definição da média móvel como o argumento para uma declaração de geração. Se você fizer isso, você não estará, naturalmente, limitado às médias móveis ponderadas não ponderadas centradas calculadas Por egen, ma. Por exemplo, médias ponderadas de três períodos de tempo seriam dadas por. E alguns pesos podem ser facilmente especificados. Você pode, naturalmente, especificar uma expressão como log myv Ar em vez de um nome de variável, como myvar. Uma grande vantagem desta abordagem é que Stata automaticamente faz a coisa certa para o painel de dados levando e atraso valores são trabalhados dentro painéis, assim como a lógica determina que eles devem ser A desvantagem mais notável é que A linha de comando pode ficar bastante longa se a média móvel envolver vários termos. Outro exemplo é uma média móvel unilateral baseada apenas em valores anteriores Isso pode ser útil para gerar uma expectativa adaptativa de que uma variável será baseada puramente em informações até à data O que alguém poderia prever para o período atual com base nos últimos quatro valores, usando um esquema de ponderação fixa? Um atraso de 4 períodos pode ser especialmente comumente usado com timeseries trimestrais.2 Use egen, filtro de SSC. Use o filtro de função egen escrito pelo usuário Do pacote egenmore no SSC No Stata 7 atualizado após 14 de novembro de 2001, você pode instalar este pacote by. after que ajuda egenmore aponta para detalhes sobre o filtro Os dois exemplos acima Seria renderizado. Nesta comparação a abordagem de gerar é talvez mais transparente, mas vamos ver um exemplo do oposto em um momento Os retornos são um numlist leva sendo retornos negativos neste caso -1 1 expande para -1 0 1 ou chumbo 1, lag 0 , Lag 1 Os coeficientes, um outro numlist, multiplicar o correspondente atraso ou itens de liderança, neste caso, os itens são myvar e O efeito da opção normalizar é a escala de cada coeficiente pela soma dos coeficientes para que coef 1 1 1 normalizar é Equivalente a coeficientes de 1 3 1 3 1 3 e coef 1 2 1 normalizar é equivalente a coeficientes de 1 4 1 2 1 4. Você deve especificar não só os atrasos, mas também os coeficientes Devido a egen, ma fornecer o caso igualmente ponderado, o A principal razão para egen, filtro é para suportar o caso desigualmente ponderada, para o qual você deve especificar coeficientes Também poderia dizer-se que obrigando os usuários a especificar coeficientes é um pouco de pressão extra sobre eles a pensar sobre quais os coeficientes que eles querem A principal justificação Para os pesos iguais é, nós supomos, a simplicidade, mas os pesos iguais têm propriedades do domínio da freqüência ruim, para mencionar apenas uma consideração. O terceiro exemplo acima poderia ser. either de que é apenas aproximadamente tão complicado quanto a aproximação da geração Há uns casos em que egen , Filtro dá uma formulação mais simples do que gerar Se você quer um filtro binomial de nove períodos, que os climatologistas acham útil, then. looks talvez menos horrível do que, e mais fácil de obter direito than. Just como com a abordagem de gerar, egen, filtro funciona corretamente Com dados do painel Na verdade, como dito acima, depende do conjunto de dados ter sido tsset previamente. Uma dica gráfica. Depois de calcular suas médias móveis, você provavelmente vai querer olhar para um gráfico O comando escrito pelo usuário tsgraph é inteligente sobre conjuntos de dados tsset Instale-o em um Stata 7 atualizado por ssc inst tsgraph. What sobre subconjunto com if. None dos exemplos acima fazer uso de se restrições Na verdade egen, ma não permitirá se a ser especificado Ocasionalmente as pessoas wa Nt para usar se ao calcular as médias móveis, mas seu uso é um pouco mais complicado do que é normalmente. O que você esperaria de uma média móvel calculada com if Vamos identificar duas possibilidades. Interpretação de Wreak Eu não quero ver quaisquer resultados para As observações excluídas. Strong interpretação Eu nem quero que você use os valores para as observações excluídas. Aqui está um exemplo concreto Suponha como uma conseqüência de alguma condição if, observações 1-42 estão incluídos, mas não observações 43 sobre Mas a média móvel Para 42 dependerá, entre outras coisas, do valor para a observação 43 se a média se estender para trás e para a frente e for de comprimento pelo menos 3, e dependerá também de algumas das observações 44 em diante em algumas circunstâncias. A maioria das pessoas iria para a interpretação fraca, mas se isso é correto, egen, o filtro não suporta se você pode sempre ignorar o que você não quer ou mesmo definir valores indesejados a falta depois b Y usando replace. Uma nota sobre resultados faltando nas extremidades da série. Como as médias móveis são funções de atrasos e leads, egen, ma produz faltando onde os atrasos e leads não existem, no início e no final da série Uma opção nomiss Força o cálculo de médias móveis mais curtas e não centralizadas para as caudas. Em contraste, nem gerar nem egen, filtro faz, ou permite, nada de especial para evitar resultados faltantes Se algum dos valores necessários para o cálculo está faltando, então esse resultado está faltando Cabe aos usuários decidir se e o que a cirurgia corretiva é necessária para essas observações, presumivelmente depois de olhar para o conjunto de dados e considerar qualquer ciência subjacente que pode ser levado a suportar.

No comments:

Post a Comment