Sunday 24 December 2017

Sas de média móvel em média ponderada


Eu incluí uma captura de tela para ajudar a esclarecer meu problema: estou tentando calcular algum tipo de média móvel e desvio padrão móvel. A coisa é que eu quero calcular os coeficientes de variação (stdevavg) para o valor real. Normalmente, isto é feito calculando o stdev e o avg nos últimos 5 anos. No entanto, às vezes, haverá observações no meu banco de dados para o qual não tenho informações dos últimos 5 anos (talvez apenas 3, 2 etc). É por isso que eu quero um código que irá calcular o avg e stdev, mesmo que não haja informações durante os 5 anos inteiros. Além disso, como você vê nas observações, às vezes eu tenho informações durante mais de 5 anos, quando é esse o caso, eu preciso de algum tipo de média móvel que me permita calcular o valor médio e padrão nos últimos 5 anos. Então, se uma empresa tem informações por 7 anos, preciso de algum tipo de código que avaliará o avg e stdev, digamos, 1997 (em 1991-1996), 1998 (em 1992-1997) e 1999 (1993-1998). Como não estou muito familiarizado com os comandos sas, deve parecer (muito muito grosseiramente) como: Ou algo assim, eu realmente não tenho idéia, vou tentar descobrir, mas vale a pena publicá-lo se eu não o encontrar. Eu sou um Iniciante do SAS e estou curioso se a seguinte tarefa puder ser feita de forma muito mais simples, já que está na minha cabeça. Eu tenho os seguintes metadados (simplificados) em uma tabela chamada userdatemoney: Usuário - Data - Dinheiro com vários usuários e datas para cada dia do calendário (nos últimos 4 anos). Os dados são ordenados pelo Usuário ASC e Data ASC, os dados de amostra são assim: agora eu quero calcular uma média móvel de cinco dias para o Money. Eu comecei com o apprach bastante popular com a função lag () como esta: como você vê, o problema com este método ocorre se houver se o passo de dados for executado em um novo usuário. Aron teria alguns valores atrasados ​​de Anna, que, claro, não deveria acontecer. Agora, minha pergunta: Tenho certeza de que você pode lidar com a mudança do usuário, adicionando alguns campos extras como o laggeduser e redefinindo as variáveis ​​N, Soma e Média se você notar tal comutador, mas: Isso pode ser feito de maneira mais fácil. POR Cláusula de qualquer maneira Obrigado por suas idéias e ajuda, acho que a maneira mais fácil é usar PROC EXPAND: E como mencionado no comentário de Johns, é importante lembrar sobre valores faltantes (e também sobre observações iniciais e finais). Eu adicionei a opção SETMISS ao código, como você deixou claro que deseja esconder valores faltantes, não ignorá-los (comportamento MOVAVE padrão). E se você quiser excluir as primeiras 4 observações para cada usuário (uma vez que não têm pré-histórico suficiente para calcular a média móvel 5), você pode usar a opção TRIMLEFT 4 dentro de TRANSFORMOUT (). Respondeu Dec 3 13 em 15: 29 Esta solução usa uma visão em linha para criar uma tabela temporária que elimina os valores de dados negativos na coluna de Peso. A exibição em linha é uma consulta que seleciona as colunas de gênero e valor. Usa uma expressão CASE para selecionar o valor da coluna Peso. Se o Peso for maior do que zero, então é recuperado se o Peso for menor que zero, então um valor de zero é usado no lugar do valor de Peso. A primeira, ou externa, declaração SELECT na consulta seleciona a coluna de Género constrói uma média ponderada dos resultados que foram recuperados pela visualização em linha. A média ponderada é a soma dos produtos de Valor e Peso divididos pela soma dos pesos. Finalmente, a consulta usa uma cláusula GROUP BY para combinar os dados para que o cálculo seja realizado para cada gênero.

No comments:

Post a Comment