You are on page 1of 9

1

AULA 1 Anlise de Dados Legislativos e Eleitorais Utilizando o Programa Stata


Professor: Ernesto Friedrich de Lima Amaral Data: 18/05/2009 Horrio: 18:0021:00

Entendendo o Stata
O Stata possibilita gerenciamento de dados, anlise estatstica e elaborao de grficos. Existem programas para tornar o Stata mais amigvel para aqueles que no gostam de trabalhar com comandos, mas o curso ser baseado no estilo padro de comandos. Principais janelas do Stata: Review, Variables, Results, Command e Do-file Editor. Bancos de dados em Stata possuem extenso ".dta", e programas ( syntax) possuem extenso ".do". O Stata trabalha com os dados copiando-os na memria RAM. Em virtude disso, bancos de dados grandes podem ser de difcil gerenciamento no Stata. Quando um banco aberto, nenhuma mudana realizada at que voc salve o banco. O fato de usar uma cpia dos dados importante porque: Quando se utiliza o comando "use arquivo", os dados so copiados para a memria do computador, e o arquivo original fechado. Voc pode fazer o que quiser com os dados na memria, e a cpia permanente continuar a mesma em seu disco. A nica forma de mudar uma cpia permanente dos dados utilizando o comando "save". Alm disso, se algum erro reportado, nenhuma mudana realizada no banco que se encontra na memria.

Inserindo comentrios
Para inserir comentrios no Stata, simplesmente utilize asterisco (*) antes do texto:
*Isso um tido como um comentrio no Stata

Ou utilize os smbolos "/*" e "*/", antes e depois do comentrio:


/*Essa uma outra forma de inserir comentrio no Stata*/

Comandos que todos devem saber


O Stata tem vrios comandos (por volta de 800). Fora os comandos estatsticos que interessam a muitas pessoas, aqui esto listados alguns comandos que todos devem saber do que se tratam: Categoria 1. Obtendo ajuda Comandos no Stata search, findit, help

2 2. Atualizando o Stata pela internet 3. Interface de sistema operacional 4. Comeando, salvando e terminando o trabalho 5. Importando dados para o Stata 6. Usando e salvando dados do disco 7. Reportando dados bsicos 8. Manipulao de dados 9. Formatando 10. Convenincia update, net, ado, news pwd, cd, sysdir, mkdir, dir, erase, copy, type clear, set mem, set more, log, notes, exit infix, input, infile, insheet use, save, append, merge, compress describe, codebook, list, browse, edit, count, inspect, summarize, table, tabulate generate, replace, egen, rename, drop, keep, sort, encode, decode, order, by, reshape format, label display

1. Obtendo ajuda
O comando "findit" procura informaes de uma determinada palavra-chave. O "findit" faz uma procura completa, incluindo as procuras de " help" que procura por comando existente no Stata; "search" que procura pela palavra-chave na internet; e " net search" que procura por pacotes para instalao no site www.stata.com.

2. Atualizando o Stata pela internet


Para fazer atualizao de comandos e procedimentos utilize o comando " update". Para mostrar uma breve lista de recentes notcias e informaes sobre o Stata, provenientes do site www.stata.com, digite "news". Instalar um pacote de comandos:
net install nomepacote, from(diretrio_ou_url)]

Utilize o comando "ado" para listar pacotes instalados. Para descrever pacotes instalados, digite:
ado describe

3. Interface de sistema operacional


Alguns comandos bsicos no Stata so importantes para lidar com o programa, e se assemelham aos comandos do DOS e UNIX:

3 pwd cd sysdir mkdir dir erase copy type Mostrar diretrio em que se encontra. Mudar para diretrio indicado. Mostrar diretrio em que o Stata est instalado. Criar diretrio em seu computador. Ver o contedo do diretrio em que se encontra. Apagar arquivo no diretrio especificado. Copiar arquivos para mesmo diretrio ou diretrio diferente. Mostrar contedo de arquivo na tela do Stata.

Diretrio em que o Stata est instalado:


. sysdir STATA: UPDATES: BASE: SITE: PLUS: PERSONAL: OLDPLACE: C:\Programas\Stata10_SE\ C:\Programas\Stata10_SE\ado\updates\ C:\Programas\Stata10_SE\ado\base\ C:\Programas\Stata10_SE\ado\site\ c:\ado\plus\ c:\ado\personal\ c:\ado\

UPDATES BASE PLUS PERSONAL c:\ado

Stata d preferncia a arquivos nesse diretrio. Diretrio com comandos originais. Armazena tudo oriundo da internet, tambm chamado de STBPLUS. Arquivos pessoais. Comandos so armazenados em sub-pastas com a primeira letra do comando.

Nunca bom utilizar o diretrio em que o Stata est instalado para trabalhar, j que arquivos de programas podem ser apagados, ou arquivos pessoais podem ser removidos em uma atualizao do programa. O recomendado utilizar um diretrio para cada projeto. Voc pode criar diretrios com o comando mkdir no Stata, ou no prprio Windows Explorer. Vamos supor que queremos criar um diretrio para esse curso no drive C:\. Esses so os procedimentos:
cd C:\ mkdir cursodcp cd cursodcp mkdir dados cd dados

A partir de agora, assim que comear o Stata, mude para o diretrio recentemente criado:
cd C:\cursodcp\dados

Se voc criar um diretrio com espao entre as palavras, necessrio utilizar aspas:
cd "C:\curso dcp\dados"

Voc tambm pode ver o contedo de diretrios, apagar arquivos, copiar arquivos, e examinar o contedo de um arquivo. Listar o contedo do diretrio atual:
dir

Listar os arquivos que possuem a extenso ".dta":


dir *.dta

4 Listar os arquivos que possuem a extenso ".dta" e nomes que comeam com "prog" e possuem mais dois caracteres:
dir prog??.dta

Apagar um arquivo no diretrio atual:


erase meuarquivo.xyz

Copiar arquivo no diretrio atual. Isso importante para realizar cpia de segurana, antes de realizar mudanas em um arquivo:
copy meuarquivo.abc meuarquivo.bak

Copiar um arquivo para um diretrio diferente:


copy D:\dados\meuarquivo.dta C:\cursodcp\dados\meuarquivo.dta

Ver o contedo de um arquivo:


type meusdados.raw

4. Comeando, salvando e terminando o trabalho


Geralmente o comando "clear" inicia um programa ".do" para limpar a memria do Stata:
clear

Estabelecendo a quantidade de memria alocada para o Stata:


set mem 100m

Para que essa quantidade de memria seja permanente toda vez que abrir o Stata:
set mem 100m, perm

Se grandes tabelas ou regresses forem ser geradas pelos seus comandos, bom digitar o comando abaixo para que o programa no paralise a tela:
set more off

Abrindo um arquivo ".log" para salvar o trabalho. O ideal escrever esse comando no comeo do arquivo ".do":
log using "C:\cursodcp\log\aula1.log", text replace

Salvando os comandos e tabelas geradas. O ideal escrever esse comando no final do arquivo ".do":
log close

Para salvar somente os comandos, fazer um arquivo ".do" no "Do-file Editor". Se a janela "Review" tiver sido usada, clique com o boto direito do mouse para copiar o contedo e colar em um arquivo ".do". Colocando avisos no banco de dados:
notes: criar rtulos em portugus para variveis p501-p511

e
notes p201: verificar se varivel foi codificada corretamente

Listar todos avisos criados no banco de dados:


notes

5 Encerrar o Stata:
exit

Se houver um banco de dados aberto no Stata, o ideal digitar o seguinte comando para encerrar o programa sem salvar os dados:
exit, clear

5. Importando dados para o Stata


Importando dados de um arquivo texto que possui formato fixo para as colunas. Exemplos da "Demographic Health Survey" e do Censo:
infix v005 038-045 v012 062-063 v013 064 using "C:\DHS96\brir31fl.dat"

ou
infix v0001 001-005 v0002 006-008 v0003 009-010 using "C:\Censo\1960\rs.txt"

Importando dados manualmente para o Stata:


input nestu cuesti pais legis partido entrev 51 1 51 307 4 1 51 2 51 307 4 2 51 3 51 307 4 2 51 4 51 307 4 2 51 5 51 307 4 1 51 6 51 307 4 2 51 7 51 307 4 1 51 8 51 307 4 1 51 9 51 307 4 1 51 10 51 307 4 1 end

6. Usando e salvando dados do disco


Com o comando "use", voc abre um banco de dados no Stata, mas no muda o diretrio:
use c:\cursodcp\dados\Argentina51.dta

Se o diretrio atual for c:\cursodcp\dados, simplesmente digite:


use Argentina51.dta

J que os bancos de dados em Stata usam a extenso ".dta", voc pode abrir o banco sem digitar a extenso:
use Argentina51

Se algum outro banco j estiver aberto, preciso utilizar a opo "clear" para limpar a memria do Stata:
use c:\cursodcp\dados\Argentina51.dta, clear

Como vimos, o comando para abrir um banco "use". Se no houver nenhum banco aberto, utiliza-se:
use arquivo.dta

Se o desejo for descartar tudo que estiver na memria, utiliza-se:


use arquivo.dta, clear

Para salvar um banco pela primeira vez, utiliza-se:


save arquivo.dta

6 Se o arquivo j existir, e voc quiser gravar o banco por cima do anterior:


save arquivo.dta, replace

Ou seja, um banco salvo somente com o comando "save", tornando difcil perder os dados originais. Mesmo se o comando "save" no for usado intencionalmente, o Stata recusar gravar o banco por cima do original, se a opo "replace" no for colocada.

7. Reportando dados bsicos


Para mostrar o sumrio do banco de dados, com nome, tipo e rtulo das variveis:
describe

e
describe p501-p511

Para mostrar o sumrio mais detalhado das variveis do banco:


codebook

Outra forma de mostrar informaes sobre as variveis do banco, com ilustrao de quantidade de nmeros negativos, positivos e "missings", alm de um pequeno grfico de ramos e folhas (com distribuio da varivel entre os seus valores) com o seguinte comando:
inspect

Para contar quantos legisladores pensam que os riscos para consolidao da democracia so muito altos em decorrncia da crise econmica (p502=4) e da dvida externa (p506=4):
count if p502==4 & p506==4

Para mostrar o banco na tela de resultados do Stata, utilize o comando "list". Para mostrar as variveis que indicam a opinio dos legisladores do partido UCR (partido=2) sobre as possveis vantagens de um regime democrtico (p201 e p202 originrias da pergunta P2 na pgina 1 do questionrio), digite o comando:
list p201 p202 if partido==2
| p201 p202 | |---------------------| | la posib la posib | | la prote la resol | | la prote la posib | | la prote la posib | | la prote el respe | |---------------------| | la prote la resol | | la prote la posib | | la prote el respe | | la prote la mayor | | la prote la posib | |---------------------| | la prote la mayor | | el creci la posib | | la prote la posib | | la prote la posib | | la posib la prote | |---------------------| | la prote la posib | | la mayor el creci | | la resol la mayor | | el respe el creci | | el respe la posib | |---------------------| | la posib la prote | | la posib la resol |

21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 97. 98. 99. 100. 101.

7
102. | la prote la posib | 103. | la prote el respe | +---------------------+

Se o rtulo da pergunta dificultar a visualizao, utilize a opo "nolabel":


list p201 p202 if partido==2, nolabel
| p201 p202 | |-------------| | 9 3 | | 2 8 | | 2 9 | | 2 6 | | 2 5 | |-------------| | 2 8 | | 2 3 | | 2 5 | | 2 4 | | 2 9 | |-------------| | 2 4 | | 1 9 | | 2 9 | | 2 9 | | 9 2 | |-------------| | 2 9 | | 4 1 | | 8 4 | | 5 1 | | 5 6 | |-------------| | 3 2 | | 6 8 | | 2 6 | | 2 5 | +-------------+

21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 97. 98. 99. 100. 101. 102. 103.

Para mostrar o banco em uma tela separada, utilize o comando "browse". Como no exemplo anterior:
browse p201 p202 if partido==2 browse p201 p202 if partido==2, nolabel

Para visualizar todo o banco, simplesmente digite:


browse

Para editar um banco, utilizasse o comando "edit" da mesma forma que o "list" e "browse". O comando "edit" pode ser acessado com o cone "Data Editor" da barra de ferramentas. Sem a utilizao da opo "nolabel", as variveis que aparecem em preto no possuem rtulos, aquelas que aparecem em azul possuem o rtulo visualizado, e as que apresentam a cor vermelha so variveis nominais (string ou character). possvel obter estatsticas bsicas de variveis com o comando "summarize" que o mesmo que "sum". Podemos analisar as respostas quanto aos temas que podem representar uma ameaa ao risco de consolidao da democracia (p501 a p511):
summarize p501-p511
Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------p501 | 104 1.596154 .6464125 1 4 p502 | 104 3.144231 .8409226 1 4 p503 | 104 2.048077 .9791993 1 4 p504 | 103 3.048544 .8561043 1 4 p505 | 104 2.509615 .9552633 1 4

8
-------------+-------------------------------------------------------p506 | 103 3 .9801961 1 4 p507 | 104 3.086538 .7896242 1 4 p508 | 103 2.203883 .7965517 1 4 p509 | 103 3.38835 .8311699 1 4 p510 | 103 2.84466 .9472073 1 4 -------------+-------------------------------------------------------p511 | 103 2 .8631906 1 4

Note acima que essas variveis variam de 1 (Nada) a 4 (Muito). bom estar ciente que poderia haver casos iguais a 8 (No sabe=NS) e 9 (No respondeu=NC), o que enviesaria a anlise. Uma anlise de percentil poderia ser feita com a opo "detail" que o mesmo que "d":
summarize p501-p511, detail

Variveis nominais so automaticamente retiradas do sumrio pelo Stata. Para ordenar um banco de dados por uma varivel ou conjunto de variveis, utilize a opo "sort":
sort partido

Para realizar uma tabela de uma varivel, utilize o comando "tabulate", que o mesmo que "tab". As opes de "nolabel", "if" e "missing" tambm podem ser utilizadas:
tab p501 if p501!=1, nolabel missing

Para realizar um cruzamento entre partido poltico e a varivel p501:


tab partido p501

Para gerar tabelas simples para cada uma das variveis listadas:
tab1 partido p501-p511

Para gerar tabelas com cruzamentos entre duas variveis para todas combinaes possveis:
tab2 partido p501 p502

Para obter a mdia, desvio padro e freqncia da varivel p501 em cada partido:
tab partido, summarize(p501)

8. Manipulao de dados
Transformar varivel numrica em varivel nominal ( string), utilize o comando "decode":
decode partido, generate(nomepart)

Transformar varivel nominal em varivel numrica, utilize o comando "encode":


encode nomepart, generate(numpart)

Verificando o que foi feito:


browse partido nomepart numpart

O comando "tostring" no exige a criao de uma nova varivel para transformar uma varivel numrica para nominal. Isso s funciona se a varivel no tiver rtulo ( label):
tostring nestu, replace

O comando "destring" pode converter todas variveis nominais para numricas em um nico comando:
destring, replace

9 Alocar determinadas variveis para o comeo do banco:


order p501-p511

Mover uma varivel para uma posio anterior segunda varivel indicada no comando:
move entrev pais

Colocar em ordem alfabtica as variveis listadas e mov-las para o comeo do banco:


aorder legisbis partido departam

Para excluir uma varivel ou conjunto de variveis do banco, utilize a opo "drop". Foi escolhido o nmero do estudo (nestu), pois ele no varia no banco de dados:
drop nestu

Note que s exclumos a varivel da cpia do banco que est na memria RAM, e no a que est originalmente no disco. Para remover observaes do banco, utilize o comando "drop" com indicao da primeira e ltima observaes a serem retiradas. Por exemplo, vamos remover as observaes de 5 a 10:
drop in 5/10

Essa remoo pode tambm ser feita de outras formas. Por exemplo, vamos remover aqueles que consideram que as relaes entre as foras armadas e o governo (p501=1) no apresentam risco para a consolidao da democracia:
drop if p501==1

ou
drop if p501!=2 & p501!=3 & p501!=4 & p501!=.

ou
drop if p501<2

ou
drop if p501<2 & p501>=1

No Stata, o "missing" o maior nmero (ao contrrio do SAS), por isso o comando "drop if p501<2" no exclui os valores de p501 iguais a "missing". possvel tambm escolher por manter determinadas variveis no banco com o comando "keep":
keep if p501!=1

ou
keep if p501==2 | p501==3 | p501==4 | p501==.

Somente recapitulando: == igual != diferente > maior >= maior/igual < menor <= menor/igual & E | OU

You might also like