Professional Documents
Culture Documents
Introduo ao STATA
O STATA um Software que permite analisar grandes bases de dados, usando mtodos estatsticos. tcnicas descritivas simples ou ajuste de modelos complexos
Introduo ao STATA
Tania Guilln de Torres
(tguillen@iesc.ufrj.br)
Introduo ao STATA
Vantagens:
1. 2. 3. 4. 5. 6. Requer pouco espao no disco rgido Requer pouca memria RAM - se necessrio possvel aumenta-la, atravs do comando set mem 300m por exemplo. Mtodos grficos poderosos na parte de diagnstico de modelos Boa interface com processadores de texto e impressoras atualizado con freqncia - e publica o Stata Technical Bulletin . Na pgina http://www.stata.com encontram-se disponveis diversas rotinas que podem ser copiadas para o diretrio c:\ado e executadas dentro do Stata.
Introduo ao STATA
Operadores usados pelo STATA :
Operadores Aritmticos + Adio - Subtrao * Multiplicao / Diviso ^ exponenciao Operadores Lgicos & e | ou ~ no Operadores Relacionais
= ~= > >= < igual ( Obs. Aps o comando if devemos usar == ) diferente maior maior igual menor
Desvantagens
No importa arquivos de bancos de dados (Dbase, Epi Info, Acces, etc.) diretamente requer de um programa de interface (Stat-Transfer)
Iniciando o STATA
Clicar 2 vezes no cone do STATA do Windows
Janelas do STATA
Command : Dos comandos a serem executados Results : Sadas dos comandos executados Variables : Lista de variveis do banco em uso Review : Comandos j executados Stata Graph : Grficos
Barra de Ferramentas
O menu do STATA permite a execuo de diversas tarefas de forma anloga a maioria dos programas para o sistema Windows.
File
Permite realizar tarefas do tipo: Abrir e salvar bases de dados no formato STATA (*.dta)
Abrir e salvar grficos criados pelo STATA Executar programas de comandos criados pelo usurio (*.do)
e se necessrio podem ser repetidos clicando duas vezes no comando desejado a partir da janela [Review]
Abrir e salvar arquivo que guarde as sadas da janela de resultados, Importar e salvar arquivos em formato ASCII
Edit
Preferences
possvel: Copiar e colar bases de dados Sadas da janela de Resultados em formato texto ou tabela
Permite personalizar As cores das janelas do Stata Dos Grficos Voltar as configuraes Padro.
Data
Descrever o banco de dados Editar a base de dados Sortear o banco Combinar bases de Dados do tipo: Append ou Merge Criar rtulos para a base de dados, variveis ou categorias de variveis Mudar o nome das variveis, eliminar observaes / variveis Procurar observaes duplicadas Operaes com matrizes Calculadora
Graphics
Elaborar grficos tipo: Histograma Boxplot Barra Setores Disperso, Diagnsticos para os modelos de regresso Series Temporais Controle de qualidade Etc.
Statistics
Estatstica descritiva (Mdias, propores, intervalos de confiana, testes de hipteses, etc. Modelos de Regresso : Linear Logstica Sobrevida Lineares Generalizados Sries Temporais (Arima, Arch/Garch) Dados Longitudinais Amostragem Complexa Analise Multivariada (Componente principais, Analise Fatorial, etc.) Bootstrap/Jackknife
Janela do HELP:
Permite lembrar a sintaxe dos comandos, Pesquisar tpicos no site do STATA. Obter verses atualizadas do STATA.exe e dos programas com extenso *.ado Importar e instalar pesquisadores, rotinas desenvolvidas por outros
Barra de Ferramentas
....cont
Barra de Ferramentas
Abrir arquivos do tipo *.dta Salvar arquivo *.dta em uso Janela do Log Editar base de dados Browse nao permite modificar a base de dados Editor de arquivos de comandos (*.do) Janela do Help Interrompe execuo de comandos
Janela [Log]:
As sadas da janela de Resultados podem ser salvas em formato: *.log ou *.smcl
O formato *.log pode ser editado no bloco de notas, Word, etc. mostrar contedo do arquivo que guarda as sadas fechar o arquivo *.log suspender temporariamente a gravao das sadas no arq.log Resume redireciona as sadas novamente ao arq.log
Entrada de Dados
Clicar no boto [Editor]
Digitar os dados na planilha Stata - uma coluna por varivel e uma linha por paciente. O Stata automaticamente escolhera o tipo da varivel de acordo com os valores digitados.
Obs. No esquecer de apertar o boto Preserve para manter as alteraes feitas no banco de dados no editor de dados
Nome de variveis
Para dar nome varivel clique 2 vezes numa clula da coluna correspondente e digite o nome da varivel, que dever ter no mximo 8 caracteres no campo Name e o rtulo da varivel no campo Label.
No esquea de apertar o boto [Preserve] para que o Stata guarde as mudanas feitas no banco de dados Aperte o [X] no canto superior direito para sair da janela do editor.
Stat/Transfer
possvel transformar bancos de dados em formatos DBASE, Lotus, Excel, Paradox, SPSS, Splus, SAS, etc. para o formato STATA ou para qualquer um dos formatos anteriores
input file type o tipo do banco de dados de entrada file especification a unidade, a pasta, e o nome do banco origem ouput file type o tipo do banco de dados de saida file especification a unidade, a pasta, e o nome do banco destino
Obs: Tambm possvel escolher as variveis e as observaes a serem includas no banco destino.
Data
Labels
Label dataset
Data
Labels
Label dataset
Data
Labels
Label variable
Labels a definir nas observaes . label list wbc: 0: Baixo 1: Medio 2: Alto yesno: 0:Nao 1:Sim sexlbl: 0: Feminino 1: Masculino trtment: 0:tratamento 1:placebo Inserir comentrio sobre a varivel
Label Variable Para associar uma descrio, de at 31 caracteres, a uma varivel do banco de dados.
Nas Observaes Para criar e associar uma descrio, as categorias ou valores de uma varivel do banco de dados
Nas Observaes
b. Nome do conjunto de rtulos c. Clique em OK
Data
Labels
Label values
d. Digite os cdigos e seus respectivos rtulos para cada uma das categorias e. Aps digitar o ltimo cdigo e rtulo, clique no [Cancel] e na janela seguinte no [Close]
Labels
Label values
1
2 escolha a varivel
Obs: Quando h muitas categorias, interessante buscar uma frmula matemtica que automatize a atribuio de valores s categorias. . generate float wbcc2 = (wbcc)^2 . generate float logwbcat = int(logwbcc/2)
Corrigindo valores
Recode - muda o contedo de alguns valores ou de toda a varivel j definida de acordo as regras especificadas
Data Create or change variables Change contents of Variable
Muda contedo da varivel: wbcc2 Expresso que corrige a varivel: sqrt(wbcc) Observao: sqrt(wbcc)= raz quadrada da varivel wbcc
Condio
Nome da nova varivel Opo: Cut pontos de corte Nome da varivel original
Indicar: mnimo, (largura do intervalo) e mximo. Obs: 0(1)6 vai gerar os cdigos: 0,1,2,3,4 que representam as faixas: 1|-2, 2 |-3, 3 |-4, 4 |-5 e 5 |-6
Escolha de observaes
Data Variables utilities
Keep or drop observations
Escolha de observaes
Data Variables utilities
Keep or drop observations
keep weeks relapse trtment sex wbcc logwbcc ficam no banco drop if relapse==1
Browse.
Edit:
Data Data editor
Olhando somente algumas observaes Edit: Exemplos para digitar na janela de comandos: edit weeks relapse edit weeks relapse if trtment==0 edit weeks relapse if trtment==0 in 15/35
List
um comando permite que os valores das variveis e/ou observaes selecionadas na expresso do list sejam apresentados na janela de resultados. Para tal siga a seqncia: Data Describe data List data
List
Na Janela Main do List List values of variables selecione as variveis que sero listadas na janela de resultados.
Na Janela Main do List List values of variables selecione as variveis que sero listadas na janela de resultados. se deseja selecionar somente algumas observaes digite a condio no retngulo do if por exemplo: sexo==0 ou se deseja pode usar a opo [Use a range of observations] na janela by/if/in
List List values of variables Se deseja selecionar somente algumas observaes digite a condio no retngulo do if (por exemplo: sex==0 & trtment==1) na opo [Restrict to observations] na janela by/if/in
. list weeks relapse if sex==0 & trtment==1 +-----------------+ | weeks relapse | |-----------------| | 17 0 | | 19 0 | | 10 1 | | 6 1 | | 11 0 | |-----------------| | 13 1 | | 10 0 | | 9 0 | | 6 0 | | 6 1 | |-----------------| | 7 1 | +-----------------+
Browse:
um comando que tambm permite visualizar a planilha de dados ou uma parte dela, com a diferena que este comando no permite realizar mudanas nas celulas da planilha. uma alternativa ao comando list
Data