You are on page 1of 13

Universidade Federal do Rio de Janeiro Faculdade de Medicina Departamento de Medicina Preventiva Instituto de Estudos de Sade Coletiva

Introduo ao STATA
O STATA um Software que permite analisar grandes bases de dados, usando mtodos estatsticos. tcnicas descritivas simples ou ajuste de modelos complexos

Introduo ao STATA
Tania Guilln de Torres
(tguillen@iesc.ufrj.br)

Rejane Sobrino Pinheiro


(rejane @iesc.ufrj.br)

Introduo ao STATA
Vantagens:
1. 2. 3. 4. 5. 6. Requer pouco espao no disco rgido Requer pouca memria RAM - se necessrio possvel aumenta-la, atravs do comando set mem 300m por exemplo. Mtodos grficos poderosos na parte de diagnstico de modelos Boa interface com processadores de texto e impressoras atualizado con freqncia - e publica o Stata Technical Bulletin . Na pgina http://www.stata.com encontram-se disponveis diversas rotinas que podem ser copiadas para o diretrio c:\ado e executadas dentro do Stata.

Introduo ao STATA
Operadores usados pelo STATA :
Operadores Aritmticos + Adio - Subtrao * Multiplicao / Diviso ^ exponenciao Operadores Lgicos & e | ou ~ no Operadores Relacionais
= ~= > >= < igual ( Obs. Aps o comando if devemos usar == ) diferente maior maior igual menor

Desvantagens
No importa arquivos de bancos de dados (Dbase, Epi Info, Acces, etc.) diretamente requer de um programa de interface (Stat-Transfer)

<= menor igual

Obs. As expresses lgicas assumem o valor 1 para verdadeiro e 0 para falso.

Iniciando o STATA
Clicar 2 vezes no cone do STATA do Windows

Janelas do STATA

Caso no exista o cone clique a seguinte seqncia iniciar Programas Stata

Command : Dos comandos a serem executados Results : Sadas dos comandos executados Variables : Lista de variveis do banco em uso Review : Comandos j executados Stata Graph : Grficos

Barra de Ferramentas
O menu do STATA permite a execuo de diversas tarefas de forma anloga a maioria dos programas para o sistema Windows.

File
Permite realizar tarefas do tipo: Abrir e salvar bases de dados no formato STATA (*.dta)

Os comandos tambm podem ser digitados a partir da janela dos comandos.

Abrir e salvar grficos criados pelo STATA Executar programas de comandos criados pelo usurio (*.do)

e se necessrio podem ser repetidos clicando duas vezes no comando desejado a partir da janela [Review]

Abrir e salvar arquivo que guarde as sadas da janela de resultados, Importar e salvar arquivos em formato ASCII

Edit

Preferences

possvel: Copiar e colar bases de dados Sadas da janela de Resultados em formato texto ou tabela

Permite personalizar As cores das janelas do Stata Dos Grficos Voltar as configuraes Padro.

Data
Descrever o banco de dados Editar a base de dados Sortear o banco Combinar bases de Dados do tipo: Append ou Merge Criar rtulos para a base de dados, variveis ou categorias de variveis Mudar o nome das variveis, eliminar observaes / variveis Procurar observaes duplicadas Operaes com matrizes Calculadora

Graphics
Elaborar grficos tipo: Histograma Boxplot Barra Setores Disperso, Diagnsticos para os modelos de regresso Series Temporais Controle de qualidade Etc.

Statistics
Estatstica descritiva (Mdias, propores, intervalos de confiana, testes de hipteses, etc. Modelos de Regresso : Linear Logstica Sobrevida Lineares Generalizados Sries Temporais (Arima, Arch/Garch) Dados Longitudinais Amostragem Complexa Analise Multivariada (Componente principais, Analise Fatorial, etc.) Bootstrap/Jackknife

Janela do HELP:

Permite lembrar a sintaxe dos comandos, Pesquisar tpicos no site do STATA. Obter verses atualizadas do STATA.exe e dos programas com extenso *.ado Importar e instalar pesquisadores, rotinas desenvolvidas por outros

Barra de Ferramentas

....cont

Barra de Ferramentas

Abrir arquivos do tipo *.dta Salvar arquivo *.dta em uso Janela do Log Editar base de dados Browse nao permite modificar a base de dados Editor de arquivos de comandos (*.do) Janela do Help Interrompe execuo de comandos

Janela [Log]:
As sadas da janela de Resultados podem ser salvas em formato: *.log ou *.smcl

O formato *.log pode ser editado no bloco de notas, Word, etc. mostrar contedo do arquivo que guarda as sadas fechar o arquivo *.log suspender temporariamente a gravao das sadas no arq.log Resume redireciona as sadas novamente ao arq.log

Bases de Dados no STATA


1. 2. 3. possvel criar a base diretamente no editor Importar ou exportar arquivos do tipo ASCII e planilhas E copiar e colar no editor do STATA dados de outras planilhas

Entrada de Dados
Clicar no boto [Editor]

Digitar os dados na planilha Stata - uma coluna por varivel e uma linha por paciente. O Stata automaticamente escolhera o tipo da varivel de acordo com os valores digitados.

Obs. No esquecer de apertar o boto Preserve para manter as alteraes feitas no banco de dados no editor de dados

Nome de variveis
Para dar nome varivel clique 2 vezes numa clula da coluna correspondente e digite o nome da varivel, que dever ter no mximo 8 caracteres no campo Name e o rtulo da varivel no campo Label.

Adicionando novas observaes


Na janela do [Data Editor ], bastar digitar as novas observaes nas linhas vazias que se encontram aps a ltima preenchida.

Adicionando novas variveis


Na janela do editor basta digitar os valores da nova variavel numa coluna vazia e depois atribuir-lhe um nome

No esquea de apertar o boto [Preserve] para que o Stata guarde as mudanas feitas no banco de dados Aperte o [X] no canto superior direito para sair da janela do editor.

Stata usa o ponto . para indicar que a observao missing

Salve o banco na opo File escreva o nome do arquivo.

[Save as] indique o diretrio e

Importao / Exportao de dados


Lembre que o Stata tem os recursos do windows copiar e colar que permitem importar qualquer planilha tipo windows ou salvar bancos do tipo Stata (*.dta) em outros tipos de planilhas. Exemplo: 1. Abrir a planilha leucemia0.xls no programa Excell 2. Marque e copie as linhas e colunas com o nome e o contedo das variveis que sero coladas no Stata (use o cone de copiar ou Ctrl+c") 3. No Stata posicione o cursor na clula da primeira linha e primeira coluna e cole a rea selecionada, apertando o boto direito do mouse selecione a opo colar ou use a opo Ctrl+v

Importao / Exportao de dados


Lembre que o Stata tem os recursos do windows copiar e colar que permitem importar qualquer planilha tipo windows ou salvar bancos do tipo Stata (*.dta) em outros tipos de planilhas. Os comandos Import ou infile na janela de comandos do STATA permitem ler um banco de dados em formato ASCII e Export ou outfile- na janela de comandos permitem salvar o banco de dados em uso, no formato ASCII, para que possa ser importado por qualquer outro pacote que leia este formato. Existem ainda 2 aplicativos o Stat/Transfer do propio STATA e o DBMSCOPY que permitem transformar bancos tipo Stata para outros formatos.

Stat/Transfer
possvel transformar bancos de dados em formatos DBASE, Lotus, Excel, Paradox, SPSS, Splus, SAS, etc. para o formato STATA ou para qualquer um dos formatos anteriores
input file type o tipo do banco de dados de entrada file especification a unidade, a pasta, e o nome do banco origem ouput file type o tipo do banco de dados de saida file especification a unidade, a pasta, e o nome do banco destino

Sintaxe de um comando STATA


[by varlist:] comando [varlist] [=exp] [if exp] [in range] [weight] [, options] os elementos nos colchetes so opcionais by : o comando repetido para cada valor da varivel ou variveis contidas na varlist varlist : lista de variveis para as quais ser executado o comando, se varlist for omitida, o comando ser executado para todas as variveis =exp : opo usada nos comandos generate, replace, egen para definir ou transformar variveis ( generate imc=peso/(altura*altura) if : restringe a ao do comando a aquelas observaes para as quais a expresso verdadeira (edit if sexo==masculino editor de dados mostrara as observaes de indivduos do sexo masculino ) in : restringe a ao do comando a aquelas observaes contidas no intervalo definido no range (ex.: edit in1/10 editor de dados mostrara as primeiras 10 observaes) weight : varivel contendo os pesos que sero usados para ponderar as observaes options : indica as opes especficas a cada comando que sero usadas, devem ser precedidas sempre por uma vrgula.

Obs: Tambm possvel escolher as variveis e as observaes a serem includas no banco destino.

Conhecendo o contedo do Banco


describe ou desc:
permite conhecer o contedo de um banco de dados tipo STATA, fornecendo uma srie de detalhes como por exemplo: nmero de observaes, nmero de variveis, data da ltima atualizao, lista de variveis com seus respectivos tipos e formatos e os rtulos criados.
Data Describe Data Describe variables in memory

Conhecendo o contedo do Banco


. desc Contains data from F:\Regressao\Introd_Stata9\leucemia_wbc0.dta obs: 42 Leukemia Remission Study vars: 8 6 Aug 2008 08:26 size: 1,008 (99.9% of memory free) -------------------------------------------------------------------storage display value variable name type format label variable label -------------------------------------------------------------------weeks byte %8.0g Weeks in remission relapse byte %8.0g yesno Relapse trtment byte %8.0g trtment Treatment logwbcc float %9.0g White blood cell count (ln) sex byte %8.0g sexlbl Sex trtwbcc float %9.0g trtment x logwbcc lgwbccat float %9.0g wbc trlwbcat float %9.0g -------------------------------------------------------------------Sorted by:

Label: colocando Rtulos


Podemos associar descries (rtulos ou labels) a uma base de dados, a uma varivel ou aos cdigos de uma varivel. No Banco de Dados
Para associar uma descrio, de at 31 caracteres, a uma base de dados

Data

Labels

Label dataset

label dataset Para associar uma descrio, de at 31 caracteres, a um banco de dados.

Inserir comentrio sobre o banco de dados

Data

Labels

Label dataset

Data

Labels

Label variable

Labels a definir nas observaes . label list wbc: 0: Baixo 1: Medio 2: Alto yesno: 0:Nao 1:Sim sexlbl: 0: Feminino 1: Masculino trtment: 0:tratamento 1:placebo Inserir comentrio sobre a varivel

Label Variable Para associar uma descrio, de at 31 caracteres, a uma varivel do banco de dados.

Nas Observaes Para criar e associar uma descrio, as categorias ou valores de uma varivel do banco de dados

Nas Observaes
b. Nome do conjunto de rtulos c. Clique em OK

Data

Labels

Label values

Define or modify value labels

1. Defina os rtulos para cada uma das categorias Cdigo Rtulo

a. Clique 2 vezes no boto Define....

d. Digite os cdigos e seus respectivos rtulos para cada uma das categorias e. Aps digitar o ltimo cdigo e rtulo, clique no [Cancel] e na janela seguinte no [Close]

Associar o conjunto de rtulos varivel original

Gerando novas variveis: logwbcc = log(wbcc)


Cria uma varivel newvar adicional no banco de dados, que ir receber o valor da expresso exp , para as observaes selecionadas na condio if e/ou no intervalo in.

Labels

Label values

Assign value labels to variables Data


nome da nova varivel: logwbcc 3 escolha o conjunto de rtulos Expresso que define a nova varivel: log(wbcc)

Create or change variables

Create new Variable

1
2 escolha a varivel

. generate float logwbcc = log(wbcc)

Gerando novas variveis: wbcc2 = (wbcc)^2


Data Create or change variables Create new Variable

Gerando novas variveis


Data Create or change variables Create new Variable

Obs: Quando h muitas categorias, interessante buscar uma frmula matemtica que automatize a atribuio de valores s categorias. . generate float wbcc2 = (wbcc)^2 . generate float logwbcat = int(logwbcc/2)

Corrigindo os valores de uma varivel


Replace - muda o contedo de variveis e/ou de observaes j definidas de acordo com as regras especificadas na expresso =exp Data Create or change variables Change contents of Variable

Corrigindo valores
Recode - muda o contedo de alguns valores ou de toda a varivel j definida de acordo as regras especificadas
Data Create or change variables Change contents of Variable

Muda contedo da varivel: wbcc2 Expresso que corrige a varivel: sqrt(wbcc) Observao: sqrt(wbcc)= raz quadrada da varivel wbcc

. replace wbcc2 = sqrt(wbcc) (42 real changes made)

. replace wbccat2 = 2 if logwbcc>=4 (7 real changes made)

Gerando novas variveis: varivel Indicadora


Data Create or change variables Create new Variable

Gerando novas variveis: Pontos de corte (2.3, 3)


Data Create or change variables Create new Variable extended

Condio

Opo: pontos de corte


Indicar: mnimo, valores anteriores aos pontos de corte e mximo

. generate float wbccat2 = (wbcc>10) & wbcc~=.

. egen float logwbccat3 = cut(logwbcc), at(0,2.29999,2.999999,5.1) icodes

Gerando novas variveis: Pontos de corte (com largura de intervalo fixa)


Data Create or change variables Create new Variable extended

Escolha de variveis e/ou observaes


Drop elimina as variveis ou observaes selecionadas do banco em uso. keep um comando similar ao drop, porem neste comando especifica-se as variveis e/ ou observaes que ficaram no banco Data Variables utilities Keep or drop variables

Nome da nova varivel Opo: Cut pontos de corte Nome da varivel original

Indicar: mnimo, (largura do intervalo) e mximo. Obs: 0(1)6 vai gerar os cdigos: 0,1,2,3,4 que representam as faixas: 1|-2, 2 |-3, 3 |-4, 4 |-5 e 5 |-6

Usar os cdigos: 0,1,2,..

. egen float logwbccat5 = cut(logwbcc), at(0(1)6) icodes

Escolha de observaes
Data Variables utilities
Keep or drop observations

Escolha de observaes
Data Variables utilities
Keep or drop observations

Keep Exemplos drop wbcc2


Manter as observaes 1 at 35

elimina a varivel wbcc2 variveis que

keep weeks relapse trtment sex wbcc logwbcc ficam no banco drop if relapse==1

elimina todas as observaes para as quais relapse==1

. keep in 1/35 (7 observations deleted)

Olhando somente algumas observaes


Existem diferentes maneiras de visualizar o contedo dos arquivos de dados: Edit, List e

Olhando somente algumas observaes


Edit: O icone do Edit permite, acessar a planilha de dados do [Editor] do Stata. Apresentando o contedo de todas as variveis e todos os registros, sendo possvel tambm criar novas variveis, fazer entrada de novas observaes, edio dos j existentes, etc. O comando edit (digitado na janela de comandos) pode ser usado para visualizar subconjuntos de variveis ou de observaes.

Browse.

Edit:
Data Data editor

Olhando somente algumas observaes Edit: Exemplos para digitar na janela de comandos: edit weeks relapse edit weeks relapse if trtment==0 edit weeks relapse if trtment==0 in 15/35

List
um comando permite que os valores das variveis e/ou observaes selecionadas na expresso do list sejam apresentados na janela de resultados. Para tal siga a seqncia: Data Describe data List data

List
Na Janela Main do List List values of variables selecione as variveis que sero listadas na janela de resultados.

Na Janela Main do List List values of variables selecione as variveis que sero listadas na janela de resultados. se deseja selecionar somente algumas observaes digite a condio no retngulo do if por exemplo: sexo==0 ou se deseja pode usar a opo [Use a range of observations] na janela by/if/in

List List values of variables Se deseja selecionar somente algumas observaes digite a condio no retngulo do if (por exemplo: sex==0 & trtment==1) na opo [Restrict to observations] na janela by/if/in
. list weeks relapse if sex==0 & trtment==1 +-----------------+ | weeks relapse | |-----------------| | 17 0 | | 19 0 | | 10 1 | | 6 1 | | 11 0 | |-----------------| | 13 1 | | 10 0 | | 9 0 | | 6 0 | | 6 1 | |-----------------| | 7 1 | +-----------------+

Browse:
um comando que tambm permite visualizar a planilha de dados ou uma parte dela, com a diferena que este comando no permite realizar mudanas nas celulas da planilha. uma alternativa ao comando list

5. 6. 13. 15. 17. 20. 21. 25. 27. 38. 41.

Data

Data browser (read-only editor)

. browse weeks relapse if trtment==0 in 15/35 , nolabel

You might also like