AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajude o Grupo de Consultoria de Estatística dando um presente Notas da Classe Stata Contagem de n para N Introdução A Stata possui duas variáveis internas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro, e assim por diante. N é a notação de Stata para o número total de observações. Vamos ver como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando by pode produzir alguns resultados muito úteis. É claro que, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por variável. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se há números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e configuramos n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. Once em excel, selecione a tabela, copie-a (Ctrl-C ou Edit-Copy) e Colá-lo no editor Stata clicando na marca do ícone do editor de dados pela seta vermelha abaixo ou digitando editar na janela de comando. Se você receber a seguinte mensagem, basta clicar em OK. Volte para a janela do Editor de Dados. O editor de dados parece uma planilha (mas não é). Cole os dados do excel. A primeira linha se tornará o nome da variável. Se a primeira linha não tiver nomes variáveis, eles serão chamados var1, var2, var2, etc. AVISO. Quando copiar e colar você pode perder alguns dados se os valores numéricos tiverem alguns caracteres de string. Se você comparar os valores faltantes na imagem acima (células com pontos). Com os dados do Excel são valores reais, mas com uma letra anexada. Se você não precisa desses dados, então não faça nada. Se você fizer isso, salve o arquivo como. csv e importe-o para o Stata (consulte a seção de inspeção abaixo) IMPORTANTE. Os nomes variáveis devem estar na primeira linha. Selecione apenas os dados que você precisa (não selecione a planilha completa) Você deve ver o seguinte na tela principal do Stata. Se você deseja rotular as variáveis, digite o seguinte. IMPORTANTE. Você pode ter que reescrever as cotações no rótulo Stata variável var1 Área no quadrado quadrado rótulo variável var2 Área no quadrado M rótulo variável var3 População rótulo variável var4 Importações rótulo variável var5 Exportação rótulo variável var6 Tipo de regime A janela das variáveis deve ser assim : Tipo descreva para um primeiro aspecto: Esta é outra maneira mais sistemática de importar dados para o Stata. No Excel, salve os dados como. csv (valor separado por vírgula ou delimitado por vírgulas, basicamente ASCII). A primeira linha deve ter os nomes das variáveis (sem espaços). Uma vez guardado no formato csv, abra o Stata e digite a planilha da linha de comando usando quotH: statadataBankscnvselect. csvquot Ou se você alterar o diretório no Stata, basta digitar inspeção usando cnvselect. csv Se você preferir usar o menu, faça o seguinte: Na caixa de diálogo Caixa clique em Procurar, em Arquivos de tipo: selecione a opção. csv e encontre seu conjunto de dados. Depois de encontrá-lo, clique em Abrir e depois em Ok. Depois de encontrá-lo, você deve ver o seguinte e, em seguida, pressione OK. Seus dados estão agora no formato Stata, lembre-se de salvá-lo, digite: save testdata03. Substituir Você verá seus dados na janela de navegação Para o Stata, a cor vermelha significa erro, neste caso, esperava variáveis numéricas, mas alguns valores possuem letras anexadas, então o Stata as lê como caracteres de cadeia. Para converter esses caracteres de cadeia em numérico, você precisa usar o comando destring (digite helpdestring para detalhes) da seguinte maneira. A inspeção prévia das variáveis nos diz que os seguintes caracteres são misturados com dados numéricos: destring, replace ignore (A X W P M G R W X E Y C Q lt) Neste caso, a opção ignore ajuda o Stata a remover qualquer atributo de caracteres de cadeia em qualquer número. Depois de usar destring. Use compress para converter as variáveis em seu formato mais eficiente.
Comments
Post a Comment