Saturday, 27 October 2018

Como padronizar dados no stata forex


Atualmente, a função de egen oficialmente escrita std () não suporta operações por. Não consigo identificar uma razão estatística ou computacional para isso, mas está bem documentada. (Por que você precisa de sorte para superar uma limitação documentada, não entendo.) Em princípio, qualquer usuário poderia escrever sua própria função egen para suportar o que você deseja implementar em uma chamada de linha única. Na prática, ninguém parece incomodado o suficiente para escrevê-lo dado o trabalho fácil que você usou. Na prática, essas coisas são escritas quando alguém fica irritado com a necessidade de digitar repetidamente três linhas de código. Um motivo muito mais positivo pelo qual o código que você cita é útil que, estatisticamente, você geralmente deseja manter o controle de meios e desvios padrão de qualquer maneira. Respondeu 14 de janeiro 15 às 18:28 Stata não tem isso, mas você pode facilmente fazê-lo sozinho. E aqui é como: 1- A sugestão é que você não pode padronizar por grupo, mas você pode ter desvios médios e padrão por grupo. Assim, (a) pegue a média por grupo, (b) tire o desvio padrão por grupo e, finalmente, (c) é padronizado variável (thevar-meanofthevar) stdofthevar 2- Exemplo: então, padronizamos as vendas variáveis ​​pela empresa. Heres como funciona o código: AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal dando um presente FAQ do Stata Como faço para padronizar variáveis ​​na variável padronizada do Stata A (às vezes chamado de pontuação z ou pontuação padrão) é uma variável que foi redimensionada para Têm uma média de zero e um desvio padrão de um. Para uma variável padronizada, cada valor de caso na variável padronizada indica sua diferença a partir da média da variável original em número de desvios padrão (da variável original). Por exemplo, um valor de 0,5 indica que o valor para esse caso é metade de um desvio padrão acima da média, enquanto um valor de -2 indica que um caso tem um valor de dois desvios padrão inferiores à média. As variáveis ​​são padronizadas por uma variedade de razões, por exemplo, para garantir que todas as variáveis ​​contribuam uniformemente para uma escala quando os itens são agregados ou para facilitar a interpretação dos resultados de uma regressão ou outra análise. Padronizar uma variável é um procedimento relativamente simples. Primeiro, a média é subtraída do valor para cada caso, resultando em uma média de zero. Então, a diferença entre a pontuação dos indivíduos e a média é dividida pelo desvio padrão, o que resulta em um desvio padrão de um. Se começarmos com uma variável x. E gerar uma variável x. O processo é: Onde m é a média de x. E sd é o desvio padrão de x. Para ilustrar o processo de padronização, usaremos o conjunto de dados High School e Beyond (hsb2). Vamos criar versões padronizadas de três variáveis, matemática. Ciência . E socst. Essas variáveis ​​contêm pontuação dos alunos em testes de conhecimento de matemática (matemática), ciência (ciência), estudos sociais (socst). Primeiro, usaremos o comando de resumo (abreviado como soma abaixo) para obter a média e o desvio padrão para cada variável. A média de matemática é 52.645, e seu desvio padrão é 9.368448. Com base nessas informações, podemos gerar uma versão padronizada de matemática chamada z1math. O código abaixo faz isso com o comando generate (abreviado para gen), então usa resumir para confirmar que a média de z1math é muito próxima de zero (devido ao erro de arredondamento, a média de uma variável padronizada raramente será exatamente 0) e A desviação padrão é uma. Abaixo, fazemos o mesmo para a ciência e o socst. Criando duas novas variáveis, z1cience e z1socst. Usando seus respectivos meios e desvios padrão retirados da primeira tabela de estatísticas resumidas. A tabela de estatísticas de resumo mostradas abaixo demonstra que ambas as variáveis ​​estão de fato padronizadas. Padronizar variáveis ​​não é difícil, mas para tornar esse processo mais fácil e menos propenso a erros, você pode usar o comando egen para criar variáveis ​​padronizadas. Os comandos abaixo padronizam os valores de matemática. Ciência . E socst. Criando três novas variáveis, z2math. Z2cience. E z2socst. Mais uma vez, podemos observar uma tabela de estatísticas de resumo para confirmar que essas variáveis ​​são padronizadas. Observe que os meios não são exatamente zero, nem combinam os meios do conjunto de variáveis ​​padronizadas criadas acima usando o comando de geração. Em ambos os casos, isso se deve a um erro de arredondamento muito pequeno. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment