Professional Documents
Culture Documents
INTRODUO
Observao
Desenvolvimento da teoria
Figura 1.
A Estatstica participa em duas fases:
1. Na tomada de observaes.
2. Na comparao das observaes com as predies a partir da teoria.
CRAMER(8) , por outro lado, resume o papel da Estatstica no mtodo
cientfico em trs funes principais. Segundo ele, a maior parte das aplicaes
ordinrias de uma teoria matemtica (da estatstica) pode ser classificada em
relao a trs aspectos; descrio, anlise e predio. Essas funes da
Estatstica coincidem com os objetivos das Cincias Experimentais, que segundo
HEMPEL(9) so: descrever um particular fenmeno no mundo que percebemos e
estabelecer princpios gerais por meio dos quais esse fenmeno possa ser
explicado e previsto.
Pode-se concluir, base do que foi exposto, que da qualidade e correo da
metodologia estatstica empregada decorre como conseqncia imediata a
validade das concluses obtidas pelo mtodo experimental. Evidentemente a
adequao e correo de mtodos estatsticos no condio suficiente, porm
necessria para que concluses derivadas de experimentos sejam vlidas do ponto
de vista cientfico.
referncias bibliogrficas
10
11
12
13
14
15
Outras finalidades da cincia, alm da teoria e explicao, foram propostas: a finalidade da cincia melhorar o destino do homem; - a finalidade da
psicologia e sociologia ajudar a melhorar a sociedade humana... .
Colocar o bem-estar humano como finalidade fundamental da cincia,
conduz finalmente a um desgaste da prpria cincia e conseqente diminuio
da compreenso dos fenmenos fsicos e humanos.
1.7. Variveis.
Uma das maiores dificuldades ao abordar um assunto novo o seu
vocabulrio. No se inventam e se usam palavras novas apenas; velhas palavras
so usadas de maneira nova e diferente. Este, naturalmente, o caso da cincia.
Teremos que nos familiarizar com termos e expresses que so usados
constantemente na pesquisa psicolgica, sociolgica, educacional... .
As definies raramente so interessantes para o leitor. Mas so essenciais
porque virtualmente impossvel conversar inteligentemente sobre cincia e
pesquisa sem usar termos abstratos e tcnicos desconhecidos do leitor... Os
cientistas comportamentais usam termos como amostra casual, "variveis
independentes", "manipulao experimental" e "significncia estatstica". Ao
passo que tais expresses so fceis e familiares para o cientista, podem ser
estranhas, perturbadoras e mesmo assustadoras para o leigo.
Nosso objetivo, agora, nessa introduo apresentar o conceito de varivel:
como qualquer coisa que podem ser classificadas em duas ou mais categorias.
"Sexo" uma varivel, o tipo de varivel mais simples porque existe apenas em
duas categorias, masculina e feminina. "Preferncia religiosa, preferncia
poltica, e "classe social" so variveis com mais de duas categorias". Tais
variveis so chamadas de variveis categricas. Tm por caracterstica o fato de
todos membros de uma categoria - todos os do sexo feminino, por exemplo serem considerados iguais no que diz respeito quela varivel. Outros exemplos
so nacionalidade, raa, escolha ocupacional.
Se uma propriedade de objetos pode ser medida, ela pode ser uma varivel.
Ser "medida", por ora, significa que algarismos podem ser atribudos a pessoas
diferentes ou objetos diferentes com base na posse de quantidades de alguma
propriedade ou caracterstica. Altura e peso so exemplos fceis e bvios. Mas
podemos atribuir os algarismos 1, 2, 3, 4 e 5 a determinadas crianas com base em
sua suposta ansiedade, 5 significando muita ansiedade, 4 uma boa quantidade de
ansiedade e assim at 1, que significa pouca ansiedade. Se pudermos fazer isso,
temos a varivel "ansiedade". Em termos de senso comum a varivel algo que
varia. Ou pode ser dito que uma varivel uma propriedade que assume valores
diferentes. A varivel sexo foi mencionada acima. Pode-se atribuir 1 ou 0 aos
indivduos, dependendo de serem homens ou mulheres. Mesmo atribuindo-lhe
somente dois algarismos 1 e 0, sexo uma varivel.
16
17
18
19
20
todo lapso de lngua indica uma represso? E como podemos medi-los, assumindo
que indiquem represso?
1.13. Explicao cientfica, teoria e relaes.
Em cincia queremos explicar fenmenos naturais. Por exemplo, queremos
explicar "preconceito", o que quer dizer que vamos dizer como nasce, por que
nasce, como caminha, o que o afeta, o que ele afeta e assim por diante.
Explicar alguma coisa, pelo menos satisfatoriamente, certamente uma das
tarefas mais difceis que podemos empreender. Mais que isto, literalmente
impossvel explicar tudo sobre algum fenmeno, ou sobre conjunto de fenmenos.
E explicar tudo sobre preconceitos, por exemplo, simplesmente no possvel,
principalmente se quisermos que boa parte de nossa explanao venha apoiada em
evidncia emprica. Em outras palavras, a "verdade" absoluta para sempre
impossvel. Mas aproximaes razoveis a explicaes de fenmenos naturais
podem ser dadas de maneira cientfica satisfatria.
O nico meio, ento, de explicar alguma coisa, determinar de que maneira
esta coisa se relaciona com outras coisas. Assim a explicao do preconceito
significa descobrir como o preconceito se relaciona com outros fenmenos
naturais.
21
22
1.15. Casualizao.
Todo experimento tem uma idia fundamental por detrs: testar o efeito de
uma ou mais variveis independentes sobre uma varivel dependente.
Suponhamos que um educador queira testar a eficcia relativa de dois
mtodos de ensino de certas operaes aritmticas. A varivel independente
mtodos de ensino e a dependente o desempenho em aritmtica. Digamos que o
experimentador disponha de um bom teste de realizao aritmtica, a medida da
varivel dependente. Ele especifica cuidadosamente o que far com os dois
mtodos de ensino - denominando-os mtodo A1 e mtodo A2. Isto , ele define
operacionalmente Y, a medida de desempenho em aritmtica e as condies
experimentais, A1 e A2. Nada disto novo para ns.
Agora, entretanto, ele precisa dar um jeito de preparar dois grupos de alunos
e deve fazer isso de tal forma que possa assumir que, antes do experimento
comear, os grupos sejam estatisticamente "iguais" em todas as variveis
possveis, que possam afetar a varivel dependente (desempenho em aritmtica).
Se ele no puder garantir que os grupos sejam iguais antes de comear o
experimento, as concluses que tirar depois sero questionveis. Se os grupos no
forem iguais, ento o resultado final poder ser devido a outra influncia ou
influncias outras que a manipulao da varivel independente. Suponhamos que
a inteligncia afete o desempenho em matemtica - o que de fato acontece - e que
um dos dois grupos, sem o conhecimento do pesquisador, tenha crianas que em
mdia sejam mais inteligentes do que as do outro grupo. Da, depois de feito o
experimento, suponhamos que a mdia de realizao aritmtica do primeiro grupo
seja maior que a mdia do segundo grupo. Esta mdia mais alta pode ser devida
inteligncia superior do grupo e no manipulao experimental. Efeitos
indesejveis como este devem ser controlados se o pesquisador quiser chegar a
resultados em que possa confiar.
Suponhamos ainda que inteligncia e sexo afetem a realizao em aritmtica.
Um meio usado para equalizar grupos experimentais, para controlar efeitos
indesejveis, foi equalizar os grupos designando-lhes sujeitos sistematicamente
de sorte que as variveis independentes ficassem distribudas igualmente entre os
grupos. No caso particular de sexo e inteligncia, por exemplo, o pesquisador
pode medir a inteligncia das crianas com um teste de inteligncia e distribuir as
crianas de inteligncia comparvel entre os dois grupos, igualmente. Se ele tiver
um total de seis crianas (muito pouco, claro), e seus QIs forem 121, 119, 106,
109, 94 e 95 ele poder colocar as de QI 121, 106 e 94 em A 1 e as de QI 119, 109
e 95 em A2. Com isto os grupos ficaro aproximadamente iguais em inteligncia.
23
24
25
1. 20. Controle
O experimento cientfico uma das maiores invenes de todos os
tempos. tambm a fonte mais segura de conhecimentos e de compreenso dos
fenmenos naturais, outras coisas mantidas constantes.
Os motivos no so difceis de compreender. O principal e central expresso
pela palavra "controle". Num experimento bem conduzido, o controle
relativamente grande. Mas o que significa "controle" em um contexto
experimental? Basicamente significa a definio, delimitao, restrio e
isolamento das condies da situao de pesquisa de maneira a maximizar a
confiana na validade emprica dos resultados. As possibilidades de explanaes
alternativas dos fenmenos em estudo so minimizadas.
Mas, testar explicaes ou hipteses alternativas, uma forma poderosa e
indispensvel de controle cientfico, no uma prerrogativa exclusivamente
experimental. Tal teste pode ser e feito em pesquisa no-experimental.
Entretanto, mais caracterstico e mais exeqvel na pesquisa experimental que na
pesquisa no experimental, porque os pesquisadores podem ter controle quase
total sobre o que podem fazer e como o fazem.
26
27
28
29
30
31
32
33
Resultados Imaginrios(*) do Experimento de Privao do sono (a) com e (b) sem Efeitos
Randmicos
Tempo de reao a estmulos visuais em milisegundos
(a) Com efeitos randmicos
(b) Sem efeitos randmicos
Privados de sono
Sono Normal
Privados de sono
Sono Normal
450
420
450
420
470
450
450
420
430
400
450
420
420
440
450
420
480
390
450
420
Mdia = 450
Mdia = 420
Mdia = 450
Mdia = 420
(*) S. Miller, op.cit., p26
34
35
36
Deve estar claro, a esta altura, que o rigoroso controle das variveis do
sujeito, esboado nas sees prvias, nem sempre pode ser realizado. Temos de
recorrer muitas vezes a um terceiro mtodo de controle o plano de grupos
independentes o qual geralmente menos sensvel aos efeitos da VI, mas pode
ser livremente usado em quase todo e qualquer experimento.
Nesse plano, os sujeitos so divididos em dois grupos inteiramente
separados, na base de um procedimento estritamente randmico; isto , cada
sujeito tem uma probabilidade igual de ser colocado num grupo ou no outro. Isso
pode ser feito pedindo a cada sujeito que retire um nmero de um chapu,
havendo tantos nmeros quantos sujeitos. Os sujeitos que retirarem nmeros pares
so ento designados para uma condio e os que ficaram com os nmeros
mpares ficam na outra condio. Alternativamente, poder-se-ia usar uma tabela
de nmeros aleatrios ou uma srie de lanamentos de uma moeda para alcanar
os mesmos fins. Uma tcnica obviamente no randmica seria colocar todos os
sujeitos do sexo feminino numa condio e todos os do sexo masculino na outra.
No to bvio, mas igualmente no randmico o procedimento de destinar as
primeiras filas de uma sala cheia de sujeitos a uma condio e, as filas de trs,
outra condio. Pode-se facilmente admitir-se a existncia de uma diferena
sistemtica, digamos, em personalidade, entre sujeitos que preferem os lugares da
frente numa sala e os que se sentam atrs.
Desde que os sujeitos sejam alocados ao acaso s duas condies, possvel
esperar que os grupos estejam razoavelmente bem equilibrados no tocante s
variveis de sujeito. Quer dizer, eles devem ter aproximadamente os mesmos
nveis gerais de inteligncia, extroverso, ateno, entusiasmo, criatividade, etc.
Note-se que a randomizao de forma alguma assegura que os dois grupos
estejam perfeitamente equilibrados em qualquer varivel de sujeito (ao contrrio
dos planos de medidas repetidas e de sujeitos pareados). Tudo o que podemos
dizer que no haver um vis sistemtico em favor de um grupo contendo, por
exemplo, mais extrovertidos que em outro grupo. Em longo prazo, se
continussemos indefinidamente a distribuio randmica, todas as diferenas
seriam equilibradas. Mas, dado o pequeno nmero de sujeitos tipicamente
disponveis para experimentos psicolgicos, no podemos esperar que isso ocorra.
Portanto, cumpre-nos procurar decidir se a diferena entre os nossos dois grupos
de escores devida VI ou, simplesmente, s variveis irrelevantes que no se
equilibram totalmente no processo de randomizao. Quanto maior for a variao
causada pelas variveis de sujeito, mais difcil se torna essa deciso. Da a nossa
anterior advertncia de que a variao randmica pode absorver os efeitos da
VI.
Ao contrrio dos planejamentos prvios, o plano de grupos independentes
no nos permite remover os efeitos das variveis de sujeito da variao randmica
de fundo. Logo, este planejamento algo impreciso. Usando tcnicas mais
avanadas, possvel aperfeioar o plano bsico de grupos independentes. Um
aperfeioamento que pode ser realizado, entretanto, mesmo pelo principiante,
37
38
nos relutantes quanto ao seu uso, exceto para variveis suscetveis de produzirem
grandes flutuaes no desempenho. Por exemplo, manteramos provavelmente
constante o rudo de fundo num experimento sobre a percepo de sons fracos;
mas talvez no considerssemos valer a pena faz-lo num experimento de
memria ou um estudo de soluo de problemas.
Alm do esforo envolvido, haver algumas variveis que no podem
simplesmente, serem mantidas constantes. Por exemplo, pode ser necessrio testar
sujeitos em dias diferentes da semana ou utilizar muitos experimentadores no
decurso de um experimento. Podemos at mudar algumas variveis
intencionalmente, digamos, os veculos usados num experimento de conduo, a
fim de dar uma aplicabilidade mais geral s concluses. O modo de lidar com tais
variveis equilibrar os seus efeitos em ambas as condies do experimento; quer
dizer, aplicar o mesmo padro de mudanas a cada condio. Assim, se dois
experimentadores foram empregados, devemos assegurar-nos de que a metade dos
sujeitos, em cada grupo, foi testada por cada experimentador. Esse procedimento
elimina a varivel experimentador como fonte de vis , mas os seus efeitos no
so completamente eliminados; alguns sujeitos sero testados por um
experimentador e alguns pelo outro. Se a variao causada por isso suscetvel de
obscurecer o efeito experimental, podemos tomar providncia para remov-la
da anlise mas isso requer tcnicas mais avanadas. O ponto importante, porm,
que as variveis controladas desse modo no podem produzir mudanas
sistemticas na varivel dependente.
Tal como no caso das varveis de sujeito, existe um limite para o nmero de
fatores que podem ser autocontrolados por esses mtodos mais rigorosos. Num
experimento tpico, seria apenas vivel controlar uma pequena proporo das
variveis situacionais por equilibrao ou mantendo-as constantes. Por
conseguinte, precisamos de uma tcnica para limpar todas as variveis
situacionais impossveis de controlar de outras formas. Essa tcnica ,
naturalmente, a randomizao. No caso das variveis situacionais, isso significa
testar os nossos sujeitos numa ordem randmica em vez de lidar com uma
condio de cada vez. Desta forma, quaisquer variveis que possam mudar
sistematicamente com o decorrer do tempo, como o estado de nimo do
experimentador ou o funcionamento do aparelho, afetaro por igual as duas
condies. Ao assegurarmo-nos de que todas essas variveis situacionais esto
mudando aleatoriamente de um sujeito para outro, evitamos quaisquer diferenas
sistemticas entre as condies, mas os efeitos randmicos subsistem para
obscurecer o principal efeito experimental. No h muita coisa que possamos
fazer a esse respeito existem alguns fatores randmicos operando em todos os
experimentos e temos simplesmente de esperar que os efeitos da varivel
independente sejam suficientemente robustos para suplantar as variaes
aleatrias nos dados.
39
1.32. Experimento sem o grupo controle (ou outro grupo para comparao): possvel?
Um experimento requer, no mnimo, dois grupos experimentais. Esses dois
grupos podem ser designados como "experimental" e de "controle", ou de A1 e A2,
ou de outra maneira conveniente. Os dois grupos so dois aspectos de alguma
varivel. Se a varivel, por exemplo, for reforamento, ento os dois grupos
podem ser reforamento regular" e reforamento casual", ou reforamento
macio" e "reforamento regular". Naturalmente, um experimento pode ter mais
de dois grupos experimentais.
A base da exigncia de no mnimo dois grupos experimentais
muitssimo importante. Um verdadeiro experimento deve ter no mnimo uma
comparao. Sem dvida, em qualquer estudo tem que haver ao menos uma
comparao. Digamos que um pesquisador deseje aumentar a habilidade de
resolver problemas por um mtodo especial. Ele usa o mtodo com um grupo de
estudantes, por um mtodo especial. Ele usa o mtodo com um grupo de
estudantes, talvez sua prpria classe, e observa, depois que o usou, que a soluo
de problemas do grupo melhorou. Embora este procedimento seja satisfatrio para
demonstraes prticas, inadequado cientificamente. O motivo : com apenas
um grupo no h segurana de que algo alm do mtodo do pesquisador no tenha
influenciado e ajudado a melhorar a capacidade de resolver problemas.
Por exemplo, o mero fato de ensinar alguma coisa aos alunos no que se
refere a resolver problemas pode ter um efeito salutar. Ou o mtodo usado pelo
pesquisador pode simplesmente ter sido um bom veculo para seu estilo pessoal de
ensino, e foi seu estilo pessoal de ensino que ajudou na soluo de problemas, e
no o mtodo. Qualquer mtodo que o pesquisador, como professor, achasse
adequado funcionaria da mesma forma. Alm disso, muito provvel que a
habilidade de os sujeitos resolverem problemas tenha melhorado como resultado
de sua exposio ao problema. Ou, depois de um certo perodo de tempo, os
sujeitos poderiam ter melhorado com qualquer mtodo; sua compreenso dos
vrios aspectos da soluo de problemas pode ter amadurecido.
Pode bem ter sido o mtodo que tenha ajudado na soluo de problemas, mas
jamais isso poder ser dito sem ambigidade enquanto no for usado pelo menos
mais um grupo. A ento, pode-se comparar os resultados obtidos com o mtodo
com os resultados obtidos sem o mtodo - com todas as outras condies mantidas
iguais.
Em resumo, um delineamento de pesquisa tendo apenas um grupo
experimental sempre insatisfatrio teoricamente. Se eu disser ao pesquisador
que no foi o mtodo que melhorou a soluo de problemas, antes, que foi sua
personalidade e entusiasmo, para os quais o mtodo funcionou como veculo, o
que ele poder dizer? Nada! Pelo menos nada convincente. Se ele tivesse usado
um segundo grupo experimental, cujos membros tivessem todos as mesmas
40
41
42
agriculture, they are the plots that happen to be available; in industry, they are the
materials available on the day set aside to run the experiment. So, they goal of an
experiment is not, and usually cannot be, the estimation of some population
parameter or parameters. The goal is to see if treatment A differs from treatment
B. If it does differ on these experimental units, the question of generalizability to
different experimental units is still open. That is why scientists do not take a result
too seriously until it is replicated a number of times. If you read carefully (in good
newspapers) you will see cautios like This result comes from a single study, so
do not stop eating charcoaled hamburgers until more information is available.
Sample surveys, on the other hand, usually involve random samples from a welldefined population, with a goal of estimating some parameter of that population,
like a proportion or mean. Comparisons can be made in surveys, like comparing
the proportions of Democrats and Republicans favoring a certain issue, but these
comparisons have a different flavor from those in an experiment. In the survey
example, you are actually estimating the difference between two population
parameters.
The distinction between random ASSIGNMENT in an experiment and random
SELECTION in a sample survey is fundamentally important to the understanding
of these basic designs, and mostly glossed over (or stated incorrectly) in
introductory books. (I have just been reading the draft NCTM Standards 2000 and
they get it mixed up as well. One statement says In repeated experiments, infer
the structure of the population through drawing repeated samples. I understand
the intent here, but mixing experiments with sampling to infer something about a
population lends to the confusing of these two designs and their intended
purposes).
43
44
desenvolvida. A sociedade moderna tem uma arma poderosa para colecionar fatos
e testar teorias e hipteses.
A maioria dos levantamentos no para testar relaes entre as variveis,
porm, para descrev-las. Os levantamentos descritivos procuram determinar a
incidncia e distribuio das caractersticas e opinies de populaes de pessoas,
obtendo e estudando as caractersticas e opinies de amostras pequenas e
presumivelmente representativas de tais populaes. So usadas amplamente pelo
governo, pelas firmas e organizaes. O propsito bsico dos levantamentos
usados desta forma no cientfico, mas antes orientado para ao e parra
diretrizes de ao. Entretanto, os levantamentos descritivos tm tido efeitos muito
fortes sobre a pesquisa comportamental em geral, principalmente atravs de seu
procedimento sofisticadssimos de amostragem e entrevista. J discutimos
amostragem aleatria e suas caractersticas. Para fins prticos altamente
desejvel que as amostras estudadas sejam representativas. Desejamos dizer que o
resultado obtido em um estudo de grande escala representativo. Se a amostra for
sem dvida representativa, ento, os resultados obtidos por meio dela podem ser
generalizados para toda a populao. Se 80 por cento de uma amostra respondem
favoravelmente a uma questo sobre uma possvel diretriz do governo, por
exemplo, acredita-se que, se se fizesse a mesma pergunta a todas as pessoas de um
pas, um estado, uma cidade ou uma organizao, perto de 80 por cento delas
seriam favorveis.
H vrias maneiras de tirar amostras para fins de levantamento, mas a nica
que d uma razovel garantia geral de ser representativa alguma forma de
amostra aleatria. Freqentemente os levantamentos usam o que se denomina
procedimento de amostragem aleatria estratificada, que mostrou vrias vezes ter
uma alta probabilidade de ser representativa.
1.36. A importncia dos levantamentos
Tanto para os objetivos cientficos de estudar relaes quanto para objetivos
de ao prtica e orientada para a tomada de decises, mas particularmente parra o
ltimo.
Levantamentos em geral so pesquisas aplicadas: so feitos para objetivos
prticos e especficos, comumente para obter informao na qual basear decises
ou aes.
........................................................................................................
45
Dear Ivan,
An experiment involves random assignment of treatments to experimental
units for the purpose of comparing treatments. The classical clinical trial used to
compare treatments on humans is a good example.
A sample survey involves the random selection of units from a well-defined
population for the purpose of estimating some parameter that describes that
population, such as a mean or proportion. The common opinion or election poll is
a good example.
An observational study looks at data as it becomes available, with no
assignment of treatments and often no random selection of units.
Experiments can be used to prove cause and effect; observational studies
cannot because of the potential biases and confounding effects.
There is not general agreement on the definition of observational study.
Most would say, I think, that a sample survey is not the same as an observational
study, especially if it was based on a good design.
hope this helps.
Dick Scheaffer
46
47
48
49
50
Parte 2. EXPERIMENTO
2.1 A finalidade de um experimento
A finalidade de um experimento (referimo-nos ao experimento comparativo e
no ao experimento absoluto*) identificar uma relao causal entre a varivel
independente** e a varivel dependente***. Ao manipular uma varivel
independente e ao medir os seus efeitos sobre a varivel dependente: isto , aps
obtivermos a resposta ao estmulo provocado pela varivel independente - temos
como caracterizar um experimento.
* ...um experimento absoluto tem por finalidade determinar a grandeza absoluta de alguma
constante fsica ou a absoluta existncia ou no existncia de algum fenmeno. Um
experimento comparativo****, pelo contrrio, efetuado para comparar os valores relativos
de vrias constantes e restringe-se s diferenas, ou talvez s razes, entre elas. Por exemplo,
a primeira transmisso da voz humana sem fio, j foi suficiente para estabelecer
absolutamente que os programas de rdio eram possveis. Pelo contrrio, muitos
experimentos comparativos foram efetuados a fim de se chegar aos modelos atuais de
aparelhos transmissores e receptores. Em experimentos comparativos, o objetivo comparar
dois ou mais estmulos chamados de tratamentos. Os tratamentos so designados s
unidades do material experimental, que resultam em respostas, em observaes.
** Varivel independente: aquela varivel cujo valor o investigador controla diretamente. Por
exemplo, se voc alimenta um grupo de crianas com dietas base de baixo ou alto teor de
clcio e ento mede o ndice CPO, a quantidade de clcio uma varivel independente.
uma varivel que se supe influenciar outra varivel, chamada de dependente. Os cientistas
fazem predies a partir de variveis independentes para variveis dependentes. Eles dizem,
por exemplo, "Se os professores elogiarem as crianas, o trabalho escolar das crianas
melhorar". Os termos vm da matemtica, da expresso: y = a + bx. Onde y a var.
dependente e x a independente.
*** Varivel dependente: a varivel em anlise, aquela varivel cujo valor o investigador
mede, mas no a controla diretamente. Por exemplo, se voc alimenta um grupo de crianas
com dietas base de baixo ou alto teor de clcio e ento mede o ndice CPO, a varivel
dependente o ndice CPO. Poderamos dizer, tambm, que a varivel dependente a sade
bucal definida operacionalmente mediante o ndice CPO.
Tratamentos
(var. indep.)
Teor de Clcio
unidade
experimental
crianas
Observaes
(var. depend.)
ndice CPO
51
52
53
54
Demogrficos
QI / Personalidades
____________________________________________________________
Altura
Renda
QI
Peso
Tamanho da famlia Necessidade de Aprovao
Destreza manual Etnia
Introvertido
Sexo
Educao
Ansiedade
Fora
Religio
Desejo de dominar
Veloz ao correr
Ocupao
Personalidade marcante
As variveis de sujeito podem criar problemas na interpretao dos
resultados de um experimento. Porque essas variveis no so manipuladas pelo
pesquisador ao realizar o experimento. Quando em um experimento tivermos duas
variveis independentes: uma controlada pelo pesquisador (porque este designa de
forma aleatria os indivduos aos grupos) e outra de sujeito (essa varivel no
designada pelo pesquisador aos grupos, fixada antes que os indivduos entrem
no experimento), ento, as relaes de causa-efeito, relaes causais s podero
ser estabelecidas entre a varivel dependente e aquela outra varivel independente
no de sujeito.
2.7. Exemplo de um experimento com varivel individual (de sujeito).
Um psiclogo est interessado em conhecer a eficcia relativa de duas
formas de terapia: a comportamental e a de psicanlise; frente aos problemas de
ansiedade e depresso. Ele seleciona pacientes com depresso e com ansiedade,
aleatoriamente, da populao. Depois, cria as variveis terapia comportamental e
psicanlise, ou seja, designa de forma causal, simultaneamente, um grupo de
pacientes com ansiedade para serem submetidos aos dois tipos de terapia, e, um
grupo de pacientes com depresso para serem submetidos aos dois tipos de
terapia.
O psiclogo no designou os pacientes s duas formas de terapia, e, ento,
criou a ansiedade e a depresso. Os sujeitos foram selecionados para o
experimento porque eles j se encontravam ansiosos ou deprimidos. Se o
55
56
57
58
"Casualize
possvel:
onde
seja
- selecione os sujeitos ao
acaso;
- designe os sujeitos aos
grupos ao acaso;
- designe os tratamentos
experimentais aos grupos ao
acaso".
59
60
61
62
Existem tratamentos
que no podem ser sorteados s unidades
experimentais, devido a sua natureza. Como exemplo, vamos imaginar que um
pesquisador pretenda estudar o efeito de hbitos orais nocivos (como chupar o
polegar) sobre a m ocluso dentria. Ora, no possvel sortear as crianas que
devero adquirir o hbito oral nocivo e as que no devero adquirir esse hbito,
para construir os grupos tratado e controle. Para um estudo deste tipo, o
pesquisador precisa observar indivduos que tm, ou tiveram o hbito, e
indivduos que no tm, ou nunca tiveram esse hbito.
Os tratamentos sabidamente prejudiciais no devem ser sorteados s
unidades experimentais, mesmo que o sorteio seja tecnicamente possvel. Como
exemplo, lembremos que nos estudos dos efeitos da subnutrio sobre o
crescimento no se sorteiam as crianas que iro receber dieta deficiente. No
entanto, existem vrios estudos que comparam o crescimento de crianas
subnutridas com o crescimento de crianas adequadamente alimentadas.
Por outro lado, preciso lembrar que os estudos observacionais constituem a
nica forma de estudar efeitos colaterais das diferentes terapias. Como exemplo,
63
basta lembrar que os testes de drogas so feitos com ratos de laboratrio. Estes
testes podem mostrar se uma quantidade grande de droga, administrada durante
um curto perodo de tempo, provoca reao adversa em ratos de laboratrio. A
constatao de reao indesejvel constitui aviso contra o uso da droga. No
entanto, a segurana da droga no fica garantida pelo simples fato de que no se
observou reao adversa nos ratos em experimentos de laboratrio. Ainda, esses
testes no so suficientes para mostrar se doses pequenas da droga, administradas
por um perodo longo de tempo a doentes com determinada patologia, tm efeitos
colaterais indesejveis. Ento s existe uma forma de estudar os efeitos colaterais
de uma droga: submeter os indivduos ao dessa droga. No entanto, os
experimentos clnicos no so suficientemente grandes para detectar pequenos
desvios da normalidade ou para detectar efeitos colaterais que ocorram apenas
raramente. Ento, algumas contra-indicaes s podem ser detectadas atravs de
estudos observacionais.
3.3) Cuidados na inferncia
64
65
66
67
30.00
Nmero de casos
de poliomielite
vero
20.00
10.00
in v e r n o
0.00
0.00
4.00
8.00
12.00
68
69
70
71
72
Para Reflexo
#1) importante ter em mente que a anlise estatstica e o delineamento de
uma pesquisa esto intimamente ligados. Pode-se dizer que, se muitas vezes uma
anlise malfeita pe a perder um bom delineamento, bastante difcil qualquer
tipo de anlise estatstica remediar um delineamento malfeito.
Sobre possveis vantagens de estudos experimentais em relao a estudos
no experimentais, necessrio assinalar que existem situaes em que
impossvel se propor um experimento, algumas vezes por razes de ordem tica,
outras simplesmente por razes de ordem tcnica.
verdade que as relaes de causa e efeito so mais consubstanciadas
quando testadas atravs de experimentao; deve-se lembrar, contudo, que em
experimentos h sempre o risco de artificialidade, ganhando-se em validade
interna, mas s custas, s vezes, da validade externa. Na verdade, o progresso
cientfico feito por ambas as vias, dependendo ainda (e talvez principalmente)
de pesquisadores capazes de formular hipteses a serem testadas,
experimentalmente ou no(BERQU, E. S. et al. - Bioestatstica, E.P.U. 1980, p.
146-7).
#2) Almost all observed associations between two variables are influenced
by other variables lurking in the background. Therefore association does not
imply causation. In assessing evidence for causation, the key question is How
were the data produced? and the gold standard is the randomized comparative
experiment.
Quase todas associaes entre duas variveis so influenciadas por outras variveis de
confundimento (estranhas). Portanto associao no implica causalidade. Ao avaliar a
evidncia de causalidade, a questo decisiva :Como os dados foram produzidos? E a prova
de ouro o experimento comparativo casualizado.
(David S. Moore, Teaching Beginners as a Mirror of the Discipline, p.3)
http://www.stat.purdue.edu/~dsmoore/articles/
http://www.stat.purdue.edu/~dsmoore/articles/NewZealand.pdf
#3) Variation is everywhere: individuals vary, repeated measurements on the
same individual vary. Therefore conclusions are uncertain. Our intuition about
uncertainty is weak for example, we tend to draw unwarranted conclusions from
short-term irregularity. Statistical methods take account of uncertainty and
correct our intuition.
A variao est presente em toda parte: os indivduos variam, medidas repetidas no
mesmo indivduo variam. Portanto as concluses so incertas. A nossa intuio sobre
incertezas fraca por exemplo, tendemos a tirar concluses no confiveis das
variabilidades de curta durao. Os mtodos estatsticos levam em conta a incerteza e
corrigem a nossa intuio.
73
http://www.stat.purdue.edu/~dsmoore/articles/
http://www.stat.purdue.edu/~dsmoore/articles/WildPfannkuch.pdf
http://www.stat.purdue.edu/~dsmoore/articles/
http://www.stat.purdue.edu/~dsmoore/articles/WildPfannkuch.pdf
74
the mean by itself is not a sufficient summary of a distribution. But after that
variability is brushed aside as attention focuses on estimating the mean, and
students are taught that standard deviation is a nuisance parameter that must be
estimated if one is to do a proper hypothesis test on the men or calculate a
confidence interval for the mean or perform a comparison of means. Some
introductory courses teach ANOVA, which although it pays tribute to variability
in its name, is really about the simultaneous comparison of means from several
populations.
falls on educators to consider how conceptions of variation aid or hinder
how students learn statistical thinking variation is the fuel to statistical
imagination Statistical imagination begins when variation is observed.
www.stat.auckland.ac.nz/serj
Statistics Education Research Journal 3(2), 7-16, 2004.
(SERJ3(2)_Gould.pdf)
#8)
http://mathforum.org/kb/thread.jspa?
forumID=67&threadID=208332&messageID=741338#741338
75
#9)
http://mathforum.org/kb/thread.jspa?forumID=67&threadID=203965&messageID=736368#736368
76
Isaac Newton blows everybody out of the water with the Principia and says
experimentation is the way to go, period.
Note:
At
this
time,
c.
1700,
experimentation
observation
The psychologists in the 19th century and the agriculture people in the late 19th &
early 20th century gathered all sorts of data and did experiments (= made
Fisher, in the first quarter of the 20th century, hired to analyze years of the fruits of
labor (so to speak) of agriculture experiments ( =observations &
their incredible capability of direct control in the lab, may not need
to rely on randomization as a method of increased control.
Now, all of this is arm-chair history and philosophy on my part what we REALLY
need is a Renaissance Man to address this question.
-- Chris Olsen
George Washington High School
77
78
(d) This is a poor experiment because we didnt give the remedy to people without the flu to
assess its effect in a control group.
(e) This is a poor experiment because the sample size is likely to be too small to detect anything
but a gross improvement in measuring the proportion of people reporting an improvement.
Solution: d
.....................................................................................................................................................
5. A survey is to be undertaken of recent nursing graduates in order to compare the
starting salaries of women and men. For each graduate, three variables are to be recorded
(among others) u sex, starting salary, and area of specialization.
(a) Sex and starting salary are explanatory variables; area of specialization is a response
variable.
(b) Sex is an explanatory variable; starting salary and area of specialization are response
variables.
(c) Sex is an explanatory variable; starting salary is a response variable; area of specialization is
a possible confounding variable.
(d) Sex is a response variable; starting salary is an explanatory variable; area of specialization is
a possible confounding variable.
(e) Sex and area of specialization are response variables; starting salary is an explanatory
variable.
Solution: c
........................................................................................................................................
6. Which of the following is CORRECT?
(a) We do not need to randomize if our sample size is sufficiently large.
(b) A large sample size always ensures that our sample is representative of the population.
(c) If all other things are equal, we need a larger sample size for a larger population.
(d) In a properly chosen sample, an estimate will be less variable with a large sample size and
hence more precise.
(e) In random samples, the randomization ensures that we get precise and accurate estimates.
Solution: d
........................................................................................................................................
7. An experimenter wishes to test whether or not two types of fish food (a standard fish
food and a new product) work equally well at producing fish of equal weight after a 2month feeding program. The experimenter has 2 identical fish tanks (1 & 2) to put fish in
and is considering how to assign the 40 tagged fish to the tanks. To properly assign the
fish, one step would
be to:
(a) put all the odd tagged numbered fish in one tank, the even in the other, and give the standard
food type to the odd numbered ones
(b) obtain pairs of fish whose weights are virtually equal at the start of the experiment and
randomly assign one to the group tank 1, the other to tank 2 with the feed assigned at random to
the tanks.
(c) to proceed as in as in (b), but put the heavier of the pair into tank 2.
(d) assign the fish at random to the two tanks and give the standard feed to tank 1.
(e) not to proceed as in (b) because using the initial weight in (b) is a non-random process. Use
the initial length of the fish instead.
Solution: d
79
8. A researcher wishes to compare the effects of 2 fertilizers on the yield of a soybean crop.
She has 20 plots of land available and she decides to use a paired experiment using 10
pairs of plots. Thus, she will:
(a) use a table of random numbers to divide the 20 plots into 10 pairs and then, for each pair,
flip a coin to assign the fertilizers to the 2 plots.
(b) subjectively divide the 20 plots into 10 pairs (making the plots within a block as similar as
possible) and then, for each pair, flip a coin to assign the fertilizers to the 2 plots.
(c) use a table of random numbers to divide the 20 plots into 10 pairs and then use the table of
random numbers a second time to decide upon the fertilizer to be applied to each pair.
(d) flip a coin to divide the 20 plots into 10 pairs and then, for each pair, use a table of random
numbers to assign the fertilizers to the 2 plots.
(e) use a table of random numbers to assign the 2 fertilizers to the 20 plots and then use the table
of random numbers a second time to place the plots into 10 pairs.
Solution: b
..
9. A student wishes to examine the effect of wing width and wing length on the length of
flight of a paper airplane. There are 4 different models of airplanes. Which of the
following is NOT correct?
(a) A factor (such as wing width) is an experimental variable under control of the experimenter.
(b) The order of flights was randomized to remove the influence of any other variables upon the
flight distance of each flight.
(c) It would be better to make four copies of each model of plane to give some feel for the
plane-to-plane variations. Flying a single copy four times gives information about the internal
variation.
(d) Interaction between two factors means that the effect of a factor at one level depends on the
level of the second factor.
(e) Planned experiments (where randomization can take place) is one of the strongest pieces of
evidence in try to establish a causal relationship.
Solution: b - randomization does not remove influences - makes them equal in all groups
10. An experiment was conducted where you flew paper airplanes after modifying wing
depth and wing length. There were four different models of airplane. One design
consideration was the choice between flying each plane four times or making four copies of
each model, each of which is flown once. Which of the following is NOT correct?
(a) Flying multiple copies of each model (i.e. separate planes of each model) could give
information on variability in flight due to fabrication effects (i.e. how you made the plane).
(b) Flying a single copy of each model four times could give information on variability in flight
due to changes in initial launch conditions.
(c) The differences in flight length among the different models gives information on the
effects of the design factors - wing depth and wing length.
(d) The response variable is flight length; the explanatory variables are wing depth and wing
width.
(e) Interaction between the effects of wing depth and wing width implies that the effects of wing
depth are the same for all wing widths.
Solution: e
.
80
11. An experiment was designed an experiment to investigate the effect of the amount of
water and seed variety upon subsequent growth of plants. Each plant was potted in a clay
plot, and a measured amount of water was given weekly. The height of the plant at the end
of the experiment was measured. Which of the following is not correct?
(a) The response variable is the plant height.
(b) The explanatory variables are the amount of water and seed variety.
(c) Randomization was used to eliminate the effect of other possible factors upon the growth of
the plants.
(d) A possible uncontrollable factor in this experiment is any nutrients that might be present in
the clay pots.
(e) Designed experiments give the best evidence of cause-and-effect relationships.
Solution: c - randomization does not remove influences - makes them equal in all groups
.
12. A survey was conducted by visiting a student parking lot to estimate the proportion of
cars that were red. Which of the following is NOT correct?
(a) If the sampled stall was empty, we can simply choose another stall, at random, to take its
place because it is not likely that the stall being vacant is related to a car being red.
(b) The sample would be representative of the population if 100 cars were chosen regardless if
randomization was used or not.
(c) Even though a random sample was taken from cars in the parking lot, the sample may not be
representative of the cars driven by SFU students because the decision to park in B-lot is selfselected.
(d) If another sample of cars was chosen, it is likely that a different proportion of cars that are
red would be obtained.
(e) The confidence interval computed gave a 95% confidence interval for the true proportion of
cars that were red in the population of cars that park in B-lot (assuming that the sample was
selected using the 3 Rs).
Solution: b
13. A survey was done to estimate the proportion of cars that are red and are Japanese
made in the City of Vancouver by taking a random sample of size 25 from a student
parking lot at Simon Fraser University. Which of the following is NOT CORRECT:
(a) This sample may not be representative of the cars in Vancouver because mainly students
park at SFU.
(b) If the particular stall is vacant, we can simply select another stall at random because it is
unlikely that a stall is vacant is related to the color or manufacturer of the car.
(c) It would be dangerous to simply select the first 25 stalls in the lot closest to the Applied
Science Building because there are a number of stall reserved for service vehicles whose
primary color is white.
(d) Different students obtained different answers for their sample proportions. This is an
example of a sampling distribution for an estimator.
(e) The margin of error will depend upon the total number of cars in the lot when we did the
sample.
Solution: e
..
16. An experiment was conducted where you analyzed the results of the plant growth
experiment after you manipulated the amount of water and seed variety. Which of the
following is correct?
81
(a) We randomized the plants to plots to eliminate any effect of hidden variables.
(b) We could determine the best combination of water and seed variety by examining the
difference in the plant height in the final week of the experiment.
(c) The variability in growth among plants of the same variety who received the same amount of
water was constant over time.
(d) The growth of a particular plant in week 3 is likely to be independent (unrelated) of the
growth of the same plant in week 2.
(e) The growth of the plants was linear over time.
Solution: b
..
19. An experiment to measure the effect of giving growth hormones to girls affected by
Turners Syndrome was carried out recently in Vancouver. All 34 girls in the study were
given the growth hormone and their heights were measured at the time the hormone was
given and again one year later. No measurements were made on their final adult heights.
Which of the following is NOT a problem with this experiment?
(a) there was no blinding
(b) there was no control group
(c) nonresponse bias
(d) there was insufficient attention to the placebo effect
(e) Because final heights were not measured, it would be impossible to
tell if the hormone affected final height or only accelerated growth
and made no difference to final height.
Solution: c
.
22. An experiment was conducted by the Schwarz family to look at the yield of popcorn
(total grams that popped when 15g of popcorn were heated) when two variables (the type
of popcorn: gourmet or plain) and the amount of oil (little or lots) was used. A profile plot
of the results is below:
82
(b) The two explanatory factors are the amount of oil and the type of popcorn. The response
variable is the yield of popcorn.
(c) The difference in yield between gourmet and plain popcorn is estimated to increase by about
6 g when lots of oil was used.
(d) There was little change in the yield for plain popcorn when either little or lots of oil were
used.
(e) An interaction would exist if the increase in yield from going from little to lots of oil were
the same for both types of popcorn.
Solution: e
83
In one study subjects were randomly given either 500 or 1000 milligrams of
vitamin C daily, and the number of colds they came down with during a
winter season was noted.
In a second study people responded to a questionnaire asking about the
average number of hours they sleep per night and the number of colds they
came down with during a winter season.
a. The first study was an experiment while the second was an observational
study.
b. The first study was an observational study while the second was a
controlled
experiment.
c. Both studies were controlled experiments.
d. Both studies were observational studies.
e. None of the above is a correct statement.
What is the correct answer? And why?
The answer is a.
The first study has randomization and a treatment imposed. This is an
experiment.
The second study is only asking question not imposing a treatment. With
out a treatment, this is an observational study.