You are on page 1of 13

Captulo

Criao de Bancos de Dados


Angelo Giuseppe Roncalli da Costa Oliveira

INTRODUO
As pesquisas epidemiolgicas, assim como todas as pesquisas de carter quantitativo, pressupem uma seqncia de etapas que vo do planejamento da pesquisa at a elaborao do relatrio final, passando pela coleta e processamento dos dados. Uma atribuio precpua da estatstica aplicada aos estudos epidemiolgicos a consolidao de dados obtidos de amostras ou populaes de modo que estes possam ser lidos e interpretados em seu conjunto. Desse modo, a etapa subseqente coleta de dados a construo de um banco em que tais dados sejam organizados de forma a facilitar as tarefas de anlise. Este captulo abordar as estratgias necessrias para a construo de bancos de dados em pesquisas epidemiolgicas, dando especial destaque tabulao eletrnica a partir dos principais programas de gerenciamento de dados.

grau de instruo e moradia so exemplos de variveis categricas (Berqu, 1981).

PRINCPIOS GERAIS PARA A CRIAO DE BANCOS DE DADOS


Com os recursos tecnolgicos atualmente disponveis, no se admite mais que os dados envolvidos em pesquisas epidemiolgicas sejam tabulados manualmente. Alm de demorada, desgastante e limitada, a tabulao manual submete o estudo a um risco elevado de erros. Com o advento e a disseminao da informtica, a tabulao eletrnica tornou a anlise de dados epidemiolgicos muito mais rpida, eficiente e segura. Com isso, a descrio e a anlise dependem, fundamentalmente, de uma cuidadosa elaborao do banco de dados da pesquisa. A correspondncia entre o banco de dados e o instrumento da coleta de dados na pesquisa facilita a digitao e, posteriormente, a anlise dos dados. Outras recomendaes importantes so: 1. Estabelecimento de cdigos para as variveis categricas. A codificao das variveis pode ser efetuada durante a construo do instrumento de coleta de dados. Caso isso no tenha sido feito, a codificao poder ser realizada por ocasio da entrada dos dados em uma base eletrnica. Os cdigos devem ser, preferencialmente, numricos e com um nico dgito, a no ser, obviamente, quando se trabalha com variveis quantitativas que demandam outras escalas de medida. Podem ser usadas letras como cdigos, quando o nmero de categorias passa de 10, ou quando necessrio estabelecer uma diferenciao entre as categorias, como o caso dos registros de condio dentria, em que os cdigos numricos dizem respeito aos dentes permanentes e as letras correspondem aos dentes decduos. A utilizao de cdigos numricos facilita bastante a digitao, pelo fato de permitirem

ENTENDENDO AS VARIVEIS
As pesquisas epidemiolgicas envolvem o estudo de caractersticas que no so distribudas de modo uniforme na populao. O conceito de varivel refere-se justamente a estas caractersticas populacionais no uniformes, que se prope descrever e analisar no mbito das pesquisas epidemiolgicas. Grosso modo, varivel pode ser definida como a expresso numrica de qualquer evento da natureza. tudo aquilo que se deseja estudar e que pode ser traduzido em nmeros, seja atravs de contagem, mensurao ou classificao. As variveis, portanto, esto associadas a eventos contbeis, mensurveis ou classificveis; e, considerando a natureza complexa dos objetos de estudo da epidemiologia, possuem limitaes diretamente proporcionais subjetividade do evento. Ao contarmos uma certa quantidade de eventos ou medirmos alguns deles, geramos variveis ditas quantitativas; ao classificamos os eventos obtemos variveis do tipo categricas. Peso, altura, CPO, glicemia so exemplos de variveis quantitativas e sexo, etnia,

Criao de Bancos de Dados

399

efetuar a digitao exclusivamente atravs do teclado numrico do computador, uma estratgia muito utilizada por digitadores profissionais. 2. Criao de cdigos de excluso. Embora alguns programas de bancos de dados ignorem as clulas deixadas em branco na anlise, recomenda-se evitar deixar a varivel sem preenchimento, para evitar confuso. A maioria dos programas permite que um determinado cdigo, por exemplo o algarismo 9, seja interpretado como informao no disponvel (missing), o que facilita bastante a anlise. 3. Utilizao de dados quantitativos brutos. Na medida do possvel, o dado deve ser captado em sua expresso numrica primria, evitando categorias estabelecidas a priori. Esta recomendao til tanto na construo do instrumento de coleta de dados, como na criao do banco informatizado. Ao se avaliar a renda mensal familiar, por exemplo, mais prtico captar a renda em reais para, somente durante a anlise estabelecer as faixas de renda ou transformao em outra unidade, como salrios mnimos. Ao se obter a informao j includa em faixas pr-estabelecidas, perde-se a informao original, alm de haver o risco de uma distribuio heterognea da varivel entre os elementos amostrais. A classificao de faixas de renda (por exemplo, menos de um salrio mnimo, de um a dois e dois ou mais salrios mnimos) pode ser muito til para pesquisas envolvendo populao de baixa renda, mas teria pouca utilidade em bairros de classe mdia alta. Outro exemplo diz respeito escolaridade, que pode ser expressa em nmero de anos de estudo, evitando a obteno da informao por graus (ensino fundamental, mdio e superior). 4. Critrios de validao de entrada. Os programas de bancos de dados permitem a criao de critrios de validao de entrada de dados. Isso particularmente importante quando diferentes digitadores contribuem para a informatizao dos dados e diminui consideravelmente os erros de digitao. 5. Verificao de erros de digitao. O cumprimento da recomendao anterior reduz o risco de erros de digitao. Mesmo assim, podem ocorrer erros quando se digitam dados vlidos porm no correspondentes ao registro que consta na ficha de coleta. Em alguns casos, recomenda-se a digitao dupla ou mesmo tripla para minimizar o risco de erros. Aps o banco pronto, ainda deve ser realizada uma avaliao, por amostragem, do percentual de erros de digitao. A simples verificao da distribuio de freqncia das variveis em estudo possibilita a

identificao de valores aberrantes, possivelmente fruto de erros de digitao ou anotao, permitindo assim sua correo. 6. Criao de pgina de cdigos. Em funo das recomendaes anteriores, importante criar uma tabela em que sejam explicitadas as informaes relativas ao banco de dados, particularmente os cdigos empregados. Em alguns programas, como o SPSS ou o Microsoft Excel, essa informao faz parte da estrutura do banco. Quando for necessrio disponibilizar o banco de dados em uma linguagem de uso comum para diferentes programas de informtica, como os arquivos de extenso DBF, necessrio apresentar em anexo a tabela de cdigos correspondente, como exemplificado no Quadro 1. Criando um banco de dados H uma quantidade considervel de programas de bancos de dados. Alguns so mais sofisticados e exigem conhecimentos de programao, sendo mais aplicveis s reas comercial e financeira. Especificamente para pesquisas epidemiolgicas, existem bons programas que permitem a construo do banco de dados e sua posterior anlise. A despeito de cada um deles possuir suas especificidades, a lgica de criao dos bancos de dados muito semelhante entre eles, bastando, na maioria dos casos, seguir as recomendaes anteriores. Descreveremos aqui as informaes mais importantes para a criao de bancos em trs dos mais populares programas disponveis, o Microsoft Excel, o SPSS (Statistical Package for Social Science) e o Epi-Info. Utilizando o Microsoft Excel O Microsoft Excel uma conhecida planilha eletrnica integrada ao pacote de aplicativos de escritrio mais utilizado em computadores pessoais no Brasil, o Microsoft Office. Na verdade, o Excel no um programa de banco de dados e, em princpio poderia no ser o aplicativo mais adequado para trabalhar com dados epidemiolgicos. Contudo, a facilidade de seu uso, sua versatilidade e popularidade permitem a construo de bancos de dados relativamente simples, quando se trabalha com dados numricos e / ou categricos. Para questionrios mais complexos, com campos descritivos, recomenda-se utilizar programas especficos para questionrios, como o Epi-Info ou, caso se tenha em mente alguma anlise de carter qualitativo, h outras opes como o Evoc ou Alcest. Mas, para estudos envolvendo o clculo de medidas de tendncia central e de disperso, bem como freqncias absolutas e percentuais, o Excel uma boa opo, embora no contemple recursos para anlises de inferncia.

Criao de Bancos de Dados

400

QUADRO 4.1 Varivel UF FLUOR

Descrio das variveis constantes em um banco de dados


Descrio Unidade da Federao Presena de gua Fluoretada Tipo Categrica Nominal Categrica Nominal Categorias Cdigo do IBGE 1- Fluoretado 2- No-Fluoretado 9- Sem Informao 1- Pblica 2- Privada 9- Sem Informao Dado numrico 1- Masculino 2- Feminino 9- Sem Informao 0- Hgido 1- Cariado 2- Restaurado com crie 3- Restaurado sem crie 4- Extrado por crie 5- Extrado por outras razes 9- No examinado

ESCOLA

Tipo de Escola

Categrica Nominal

IDADE SEXO

Idade em anos Sexo

Quantitativa Discreta Categrica Nominal

DENTAL16

Cdigo CPO para dente 16

Categrica Nominal

Fonte: Exemplo retirado do banco de dados do Projeto SBBrasil 2003 (Brasil, 2004).

Outra vantagem do Excel que o formato XLS de seus arquivos passvel de leitura direta por boa parte dos programas estatsticos, como o SPSS, o S+ ou o Statistica. Alm disso, pode exportar para outros formatos, como o Dbase (DBF - Data Base File) um padro quase universal de bancos de dados. Ademais, em geral, seus arquivos no so muito grandes (a no ser quando se exagera nas formataes de cores e linhas), o que facilita a troca de informaes em meio virtual. O Excel tem uma capacidade razovel de armazenamento de dados, e serve bem a muitas finalidades das pesquisas epidemiolgicas. O limite de linhas em uma planilha de 65.536; o que significa que pesquisas com um nmero de unidades amostrais superior a este limite tero que recorrer a outros programas. Sua capacidade de armazenamento para variveis bastante considervel, permitindo o uso de at 256 colunas.

anlise de dados e construo de tabelas e grficos, no sero tratadas neste captulo. 1. Definio das variveis Em primeiro lugar, devem ser definidas as variveis que constituiro o banco de dados, com suas respectivas codificaes, conforme indicado anteriormente. Essas variveis preenchero toda a primeira linha da planilha, sendo cada linha subseqente reservada para o preenchimento das informaes relativas a cada elemento da amostra. importante observar que, embora o programa aceite nomes com tamanho ilimitado, recomenda-se algumas precaues ao nomear as variveis. Entre essas precaues, sugere-se no exceder oito caracteres, bem como evitar o uso de cedilha, acentos, traos (a no ser o trao subscrito ou underline) e espaos. Isso se justifica para facilitar o processo de exportao do arquivo para outras plataformas, as quais solicitam essas restries. O SPSS, por exemplo, apenas aceita os primeiros oitos caracteres registrados para os nomes de variveis, e o Epi-Info aceita at 10 caracteres. Do mesmo modo, ao se utilizar o Epi-Info em sua verso 6.04 em MS-DOS, somente caracteres padro sero aceitos. Alm disso, ao serem criadas variveis com nomes de extenso reduzida, o banco fica menor e mais fcil de ser utilizado.
()

ETAPAS PARA A CONSTRUO DE BANCOS NO EXCEL


Considera-se que o leitor possua conhecimentos bsicos sobre o funcionamento de planilhas eletrnicas(*), como as operaes comuns aos programas do pacote Microsoft Office, como salvamento de arquivos, impresso, formatao, entre outras. Consideraes mais complexas, relativas
( )

Foi utilizada, para os exemplos deste captulo, a verso 2002 para Windows XP. Verses anteriores para Windows 98 ou da famlia do Office 2000 podem apresentar ligeiras diferenas na apresentao visual e nas funes.

O MS-DOS (Microsoft Disk Operating System), foi um dos primeiros Sistemas Operacionais a serem utilizados em computadores pessoais. Tinha uma interface ainda pouco amigvel e hoje est praticamente em desuso com o advento do Sistema Windows.

FIG. 4.1. Exemplo de banco de dados no Excel. O banco de dados apresentado como exemplo, a seguir, o produto de um formato de pesquisa muito comum em Epidemiologia em Sade Bucal, o levantamento epidemiolgico. As variveis que constam no arquivo advm da ficha bsica proposta pela OMS e adaptada recentemente para o Projeto SBBrasil 2003 (vide o captulo 3 da primeira parte). Observe que, na planilha, foram includas as variveis na primeira linha com o cuidado de criar uma varivel IDENT (Identificao), onde os elementos amostrais so devidamente numerados. 2. Validando a entrada de dados Aps criar a estrutura do banco de dados e antes de comear a digitao, importante acrescentar alguns aperfeioamentos disponibilizados pelas ferramentas do Excel. Em primeiro lugar, como em qualquer banco de dados, podem ser criadas regras de validao para a entrada dos dados, o que agiliza o processo e evita erros de digitao. Para criar estas regras, marca-se a coluna da varivel, clica-se em Dados e escolhe-se a opo Validao. Em seguida abre-se uma caixa de dilogo como a ilustrada a seguir, que exemplifica a validao da varivel Tipo de Escola. Na primeira interface de dilogo que se abre (usualmente denominada orelha) o item Configuraes permite que se informe que cdigos podem ser aceitos para aquela varivel. H diversas opes para se realizar esta operao, como escolher uma lista, estabelecer um intervalo numrico, entre outras. Para o caso em que se trabalha com listas de cdigos, deve-se colocar esta lista de cdigos em outro ponto da planilha e informar, na caixa de dilogo, onde se encontra essa informao.

FIG. 4.2 Caixa de dilogo das funes para validao da entrada de dados no Excel.

Criao de Bancos de Dados

402

FIG. 4.3 Aspecto da planilha aps a validao, quando a clula selecionada. Na orelha Mensagem de entrada pode-se optar pela visualizao de uma mensagem de ajuda informando os cdigos vlidos, que aparece quando o cursor passa pela clula. Este recurso particularmente til em bancos um pouco mais complexos e que sero trabalhados por digitadores externos. Finalmente, a orelha Alerta de erro permite que se customize a mensagem que surgir quando da tentativa de entrada de um dado que no seja vlido (veja nas Figura 4.2 e 4.3). 3. Criando painis e agilizando o processo de digitao A seguir, a criao de painis outro importante recurso de formatao da planilha, que facilita a digitao. Como a primeira linha da planilha corresponde ao nome das variveis, interessante que esta primeira linha esteja sempre visvel durante a navegao, o que geralmente no acontece quando se tem um banco de dados com mais de 30 elementos amostrais. O mesmo vale para a primeira coluna, a qual sempre destinada para os cdigos de identificao. Um recurso para manter linhas e colunas sempre visveis a criao e o congelamento de painis. Para esta finalidade, seleciona-se a clula que limita a linha e coluna (em geral a B2) e, no menu Janela, escolhe-se a opo Congelar painis. Como resposta, o programa cria uma demarcao abaixo da primeira linha e direita da primeira coluna (veja Figura 4). 4. Utilizao da ferramenta Formulrios Outra opo que facilita a digitao no Excel oferecida pelo recurso de Formulrios. Clicando em Dados e em seguida em Formulrios, aparece uma janela como ilustrada na Figura 5. Todas as clulas da primeira linha so identificadas como variveis e os dados podem ser digitados como num programa de banco de dados. Dentre as desvantagens desta opo, est o fato de que ela s permite trabalhar com no mximo 25 variveis. Para bancos com maior nmero de variveis, os dados devero ser digitados diretamente na planilha. Alm disso, ao se utilizar o modo formulrio, perdem-se as informaes de validao.

Criao de Bancos de Dados

403

FIG. 4.4 Passos para a criao e congelamento de painis.

FIG. 5.5 Janela de entrada de dados da opo Formulrios.

Criao de Bancos de Dados

404

Utilizando o SPSS O SPSS (Statistical Package for the Social Sciences) um dos principais produtos da SPSS Inc. uma empresa de software sediada em Chicago e com atividades na rea de sistemas de informtica desde o fim da dcada de 1960 (SPSS, 2004). Trata-se de um programa bastante utilizado na rea acadmica para anlises estatsticas, ao lado do SAS (Statistical Analysis System) e do Statistica. O SPSS tem uma interface parecida com a do Excel, e permite a entrada de dados visualizando o banco de dados como um todo. Contudo, por se tratar de um programa especfico para anlise de dados, possui inmeras outras potencialidades. Dentre as facilidades para operaes com arquivos, suas verses mais recentes permitem ler arquivos de praticamente todos os programas mais importantes, como o prprio Excel e outras planilhas eletrnicas como Lotus, alm do formato Dbase (.dbf). Sua grande desvantagem o preo muito elevado, fator que, na maioria dos casos, restringe sua aplicao para usurios corporativos. Etapas para a construo de bancos no SPSS Uma das vantagens de programas especficos de bancos de dados facilitar a definio de variveis. Neste sentido, a primeira medida a se tomar definir as variveis. A tela de abertura do SPSS, quando se opta pela abertura de um banco de dados novo, tem duas modalidades de exibio (ou views): a visualizao dos dados (Data View) e das variveis (Variable View). O exemplo a seguir advm do mesmo banco ilustrado no item anterior quando discutimos o Excel. Pode-se observar que, no Variable View, cada varivel definida a partir dos seguintes parmetros (veja na Figura 6): Name: Nome da varivel. Conforme discutimos anteriormente, deve-se limitar a oito caracteres, sem utilizao de cedilhas, acentos e espaos. Type: Tipo de varivel. Existem diversos tipos disponveis, porm os mais utilizados so o formato String, para variveis categricas, e o Numeric, para dados quantitativos, alm de diferentes opes para o registro de datas. Trata-se de uma propriedade importantes, pois ir definir a forma como o programa interpretar o dado. Uma varivel do tipo String, por exemplo no permite operaes matemticas nem a obteno de medidas de tendncia central e de variabilidade; para sua anlise, s podero ser obtidas freqncias. Width: Tamanho do campo. Deve ser informado com quantos caracteres formada cada categoria da varivel. Por exemplo, se estamos trabalhando com renda e o mximo encontrado foi de 20 mil reais, ento o campo dever ter 5 algarismos. Embora colocar um tamanho maior que o necessrio no atrapalhe a anlise, importante se ater ao nmero correto, pois isso ir economizar bytes, gerando um banco de dados menor e, conseqentemente, de mais fcil manuseio. Decimals: Nmero de casas decimais. Aplicvel somente para as variveis numricas, um complemento da especificao anterior. Label: Rtulo da varivel. Deve-se colocar o nome que descreve a varivel e que dever aparecer quando as anlises forem solicitadas. Caso no seja informado, aparecer o nome da varivel. Values: Valores atribudos aos dados. Aplica-se s variveis categricas, e muito importante na hora da gerao dos relatrios. A Figura 7 mostra um exemplo de codificao para a varivel Tipo de Escola. Missing: Informao no disponvel. Quando, por algum motivo, no se tem o dado disponvel, deve-se entrar com um valor que indique a ausncia de informao. importante que seja informado, neste item, qual o valor que referencia esta condio, para que o programa o exclua dos clculos. Measure: Escala de medida. Trata-se de um complemento do tipo de varivel. H as opes Scale, quando os dados advm de medidas quantitativas, Nominal, para dados categricos nominais e Ordinal, para variveis categricas do tipo ordinal. Uma vez finalizado o processo de definio das variveis, pode-se prosseguir com a entrada dos dados.

Criao de Bancos de Dados

405

Figura 6. Tela do Variable View do SPSS.

Figura 7. Caixa de dilogo para atribuio dos valores das categorias da varivel Tipo de Escola. Algumas diferenas entre o SPSS e Excel Uma diferena importante que existe na elaborao de bancos no Excel e no SPSS diz respeito s ocasies em que se pretende avaliar a associao entre dados das variveis dependentes e independentes. Para o SPSS, as categorias da varivel independente (grupos de estudo, por exemplo) devem ser identificadas como variveis especficas; enquanto no Excel, cada cruzamento da varivel dependente com a independente deve ser codificado como uma varivel especfica no banco. Para ficar mais claro, vamos utilizar o seguinte exemplo: um pesquisador deseja verificar o efeito de bochechos com diferentes substncias sobre o ndice de sangramento gengival em trs momentos distintos (antes do uso, imediatamente aps e um ms depois do uso). Neste caso, temos, como varivel dependente, os valores do ndice de sangramento gengival e, como independentes, o grupo (as trs diferentes substncias) e o tempo (antes, logo aps e um ms depois). O banco de dados desta pesquisa construdo no Excel teria a estrutura mostrada na Figura 8 a seguir.

Criao de Bancos de Dados

406

Figura 8. Modelo de entrada de dados para o Excel. Pode-se observar que so criadas nove variveis oriundas de todos os cruzamentos da varivel dependente com as duas independentes, gerando nove combinaes possveis (ROMA_LB = Rom na linha-base, CLOREX_LB = Clorexidina na linha-base, PLAC_LB = Placebo na linha-base, ROMA_AP = Rom imediatamente aps e assim por diante). Desse modo, as estatsticas descritivas podero ser obtidas colocando-se as frmulas abaixo do ltimo valor (na linha 13). Do mesmo modo, as anlises estatsticas podem ser realizadas informando as colunas em que se encontram os dados que se deseja testar. Este mesmo banco teria que ser estruturado no SPSS de uma forma diferente, para considerar tempo e grupo como variveis. Neste caso, ele ficaria com o formato ilustrado na Figura 9. Observe que, neste caso, apenas trs variveis so criadas, a dependente (Sangramento Gengival, ou sang) e as independentes (tempo e grupo). Os tempos foram codificados como 1 Linha-Base, 2 Imediatamente aps e 3 Um ms depois. Os grupos foram codificados como 1 Rom, 2 Clorexidina e 3 Placebo. Esse procedimento necessrio pelo fato de a anlise no SPSS exigir, como entrada, a especificao das variveis dependente e independente, de modo diferente do Excel. Assim, importante decidir qual programa ser utilizado para a anlise, e projetar o banco de dados de forma apropriada antes de comear a digitao.

Criao de Bancos de Dados

407

Figura 9. Modelo de entrada de dados para o SPSS. Utilizando o Epi-Info O Epi-Info foi criado ainda em meados dos anos 1980s pelo Centers for Disease Control and Prevention (CDC) sediado em Atlanta, EUA. Foi desenvolvido por Andrew Dean e colaboradores com o objetivo de servir de suporte para entrada e processamento de dados epidemiolgicos, para uso em Sade Pblica (Dean, 1994; Dean et al, 2004). um programa de domnio pblico, ou seja, sua distribuio livre e gratuita, podendo ser copiado de stios da Internet em vrias partes do mundo, sendo o principal deles o do prprio CDC (www.cdc.gov/epiinfo) Desde suas verses iniciais, ainda em ambiente MS-DOS, o Epi-Info foi adquirindo popularidade crescente, e hoje usado em mais de 180 pases. Segundo as ltimas informaes divulgadas no stio do CDC, at 2003, cerca de 1 milho de downloads haviam sido realizados e h registros da traduo de seu manual para 13 lnguas diferentes. A partir do ano 2000, foi lanada uma verso para ambiente Windows, a qual no agradou muito no incio, em funo de falhas ainda presentes. Uma verso aperfeioada foi lanada em 2002, a qual ficou conhecida como Epi-Info 2002. A verso mais recente a 3.3, disponvel no CDC desde outubro de 2004. A lgica da construo de bancos no Epi-Info semelhante de outros programas, como o SPSS, e tambm est sujeita s recomendaes relativas estruturao e codificao das variveis. Contudo, um grande diferencial a interface do Epi-Info para a entrada de dados. Ao contrrio dos programas em que o nome das variveis informado na primeira linha e os dados so digitados diretamente na planilha, o Epi-Info permite que se construa um formulrio com o mesmo aspecto da ficha utilizada para a coleta dos dados, o que facilita bastante o processo de digitao (CDC, 2002). Construindo bancos de dados no Epi-Info O exemplo a seguir tomou como base o modelo de coleta de dados do Projeto SBBrasil, em que o instrumento de coleta era composto por uma ficha de exame com os dados de sade bucal e um questionrio socioeconmico e de acesso a servios (Brasil, 2004). O Epi-Info, em sua verso para ambiente Windows, trabalha com o conceito de projetos; ou seja, possvel manter, em um nico arquivo, diversos modelos de questionrio, denominados views. No nosso exemplo, o projeto deu origem ao nome do arquivo (SBBrasil_Exemplo) e o primeiro view foi denominado FichaExame. Esta uma vantagem interessante, pois cada questionrio pode ser gravado em uma tabela de dados distinta, porm todos so mantidos em um mesmo arquivo, o que pode ser til quando se trabalha com pesquisas de carter multicntrico. Alm disso, possvel criar diversas pginas em um mesmo questionrio, de modo a organizar melhor a entrada de dados. A Figura 10 exemplifica o incio da construo do modelo de entrada de dados. Na tela de abertura do EpiInfo, escolhe-se a opo Make view. Clicando em File New solicitado o nome do Projeto, que ser salvo como nome do arquivo. Em seguida, em uma nova janela, deve-se entrar com o nome do questionrio (view). A partir da, define-se cada campo de entrada, de acordo com a ficha da coleta de dados. Clicando com o boto direito do

Criao de Bancos de Dados

408

mouse, abre-se uma janela em que as definies de campo podem ser especificadas (veja Figura 10). Seus principais elementos so os seguintes: Question of prompt: Rtulo do campo. Aqui deve ser colocada a denominao do campo da forma como desejamos que aparea no questionrio. possvel, por intermdio do boto, direita do campo (Font for Prompt) formatar a fonte, com relao ao tamanho e tipo, de acordo com os tipos de fonte disponveis no computador. Field or Variable: Caractersticas da varivel. De modo anlogo ao SPSS, define-se aqui as caractersticas da varivel (numrica, texto, data etc.), incluindo seu padro de entrada (nmero de caracteres ou algarismos) e o tipo de fonte. Field name: Nome da varivel. Coloca-se o nome como se deseja que a varivel seja armazenada. Novamente, recomenda-se a utilizao de caracteres-padro em nmero mximo de 10. este o nome que aparecer na tabela de dados, quando da exportao do banco para outros formatos. Code Tables: Para variveis codificadas em modo texto (Text), padro utilizado para as variveis categricas, possvel definir os cdigos vlidos. Funciona do mesmo modo que a opo Values do SPSS e as opes de validao do Excel.

Figura 10. Caixa de dilogo das definies dos campos de entrada no Epi-Info. Para melhor organizar o questionrio, assemelhando-o ficha de coleta, possvel criar grupos de campos. No caso do exemplo, a ficha original continha um cabealho, informaes gerais, e campos especficos dos ndices utilizados. Neste caso, os campos podem ser agrupados de modo a separ-los, de acordo com estas categorias. Para criar grupos, preciso, primeiro, marcar o conjunto de campos que se deseja agrupar. Em seguida clica-se em Insert e depois em Group. Na caixa de dilogo que se abre, basta informar o nome do campo e definir algumas caractersticas de formatao como a cor do campo. A Figura 11 ilustra a forma final da tela de entrada de dados da primeira parte da ficha. Observa-se que possvel construir um questionrio muito semelhante ficha de coleta e com um padro esttico agradvel.

Criao de Bancos de Dados

409

Figura 11. Tela de entrada de dados aps definio de campos e grupos. Ainda com relao organizao do questionrio, importante informar ao programa a ordem de entrada dos dados. De modo geral, medida em que so criados os campos, o Epi-Info estabelece a ordem de criao como a ordem de entrada. Contudo, vezes, em funo da posio na grade, ou mesmo quando se utilizam recursos de copiar e colar, a ordem de entrada pode variar. Nestes casos, antes de se efetuar a entrada de dados, importante checar a ordem de entrada clicando em Edit e, em seguida em Order of Field Entry (Taborder). A caixa de dilogo mostrar o conjunto de campos e a sua seqncia. Para mudar para a seqncia desejada, basta marcar o campo e usar as opes Up e Down nos botes direita (Figura 12).

Figura 12. Caixa de dilogo da ordenao da entrada dos campos. Finalmente, o mdulo de entrada de dados do Epi-Info tem uma ferramenta adicional para a criao de pginas. Em alguns casos, um mesmo questionrio pode ter vrias partes ou uma pesquisa pode utilizar questionrios diferentes, e pode ser desejvel o armazenamento de todos os dados em um nico banco. Na janela esquerda do modo de edio de questionrio (vide Figura 10), esto disponveis as opes para o gerenciamento de pginas. Clicando em Add page uma nova pgina ser criada e, a partir da procede-se da mesma forma. Tendo concludo o delineamento do questionrio, procede-se entrada dos dados por intermdio do mdulo Enter. No prprio modo de edio, escolhe-se a opo File e Enter data. Para usurios do Epi-Info 6.04 para DOS Usurios tradicionais do Epi-Info em sua verso para MS-DOS (a ltima foi a 6.04d, janeiro de 2001) podem encontrar dificuldades de adaptao verso para Windows. Isso pode ser devido ao fato de as mudanas terem se dado no apenas no aspecto da plataforma, mas tambm em sua concepo. O Epi-Info para DOS trabalhava com a idia de questionrios individualizados especficos para cada tipo de pesquisa e com um modelo de banco de dados esttico. Na verso Windows, a lgica da organizao passa pela concepo de projetos e de bancos de dados dinmicos, podendo-se criar vrias tabelas de dados em um mesmo arquivo. Contudo, seus mecanismos de entrada e processamento de dados ficaram infinitamente melhores e mais seguros. A validao de entrada, em substituio criao e arquivos com extenso CHK da verso DOS resultou mais fcil e rpida. desnecessrio sublinhar os ganhos em termos de uma interface mais amigvel e uma qualidade esttica superior.

Criao de Bancos de Dados

410

Apesar de a nova verso permitir o gerenciamento de bancos de dados criados com as verses anteriores, o novo padro de arquivo (extenso MDB), o qual semelhante ao produzido pelo Microsoft Access, pode apresentar incompatibilidades com arquivos gravados em formato da verso para DOS (extenso REC). Do mesmo modo, a importao de questionrios da verso antiga (extenso QES) trabalhosa, em especial quando os questionrios foram elaborados de forma complexa. Referncias Bibligrficas Berqu ES, Souza JMP, Gotlieb SLD. Bioestatstica. 2. ed. So Paulo: EPU, 1981. BRASIL. Ministrio da Sade. Projeto SBBrasil 2003. Braslia, 2004. Capturado na Internet: www.sbbrasil.cjb.net. Dean AG et al. Epi Info. Database and statistics software for public health professionals. Atlanta, EUA: Center for Disease Control and Prevention. verso 3.2.2, 2004. Dean AG. Microcomputers and the future of epidemiology. Public Health Reports 1994;109(3):439-41. Center for Disease Control and Prevention. Epidemiology Program Office. Epi Info users' manual. Atlanta: CDC, 2002. SPSS. Statistical Package for the Social Sciences. Chicago, 2004. Capturado na Intenet: www.spss.com.

You might also like