Professional Documents
Culture Documents
FICHA TCNICA:
Ttulo: Estatstica, muitas aplicaes em Excel e poucas frmulas
Autor: Jos Joaquim Dias Curto
c Jos Joaquim Dias Curto
Prefcio xi
A estatstica sempre por perto xiii
1 Coisas simples mas necessrias 1
1.1 Gnero e Salrio: so a mesma coisa? . . . . . . . . . . . . . . 1
1.1.1 Dados qualitativos . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Dados quantitativos . . . . . . . . . . . . . . . . . . . 4
1.2 Dados de sries cronolgicas, seccionais e em painel . . . . . . 4
1.2.1 Variveis discretas e contnuas . . . . . . . . . . . . . . 5
1.3 Apresentao dos dados: em tabelas, por classes... . . . . . . 6
1.4 Preparar o Excel . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.1 Suplemento Analysis ToolPack . . . . . . . . . . . . 8
1.4.2 Outros suplementos para o Excel . . . . . . . . . . . . 10
1.4.3 Funes de estatstica . . . . . . . . . . . . . . . . . . 11
1.5 Ficheiros de dados . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Breve caraterizao dos funcionrios da PIXIES . . . . . . . . 13
1.7 procura de dados para analisar . . . . . . . . . . . . . . . . 21
Apndices 63
Apndice 2.A Clculo dos percentis em Excel . . . . . . . . . . . . 63
i
NDICE
Apndices 129
Apndice 3.A Momentos e parmetros de ordem de uma distribuio129
ii
NDICE
iii
NDICE
Apndices 279
Apndice 7.A Efeitos marginais e Elasticidades . . . . . . . . . . . 279
Apndice 7.B Funes exponencial e logartmica . . . . . . . . . . 281
7.B.1 Propriedades das funes . . . . . . . . . . . . . . . . 283
7.B.2 Propriedades das derivadas das funes . . . . . . . . 284
7.B.3 O conceito de elasticidade . . . . . . . . . . . . . . . . 285
Bibliograa 331
v
i
Lista de Tabelas
v
LISTA DE TABELAS
vi
Lista de Figuras
vii
LISTA DE FIGURAS
viii
5.4 Teste T para amostras emparelhadas . . . . . . . . . . . . . . 191
ix
x
Prefcio
H j vrios anos que leciono e coordeno disciplinas (agora designadas
unidades curriculares, UCs) em cursos de ps-graduao e em mestrados exe-
cutivos. As designaes so variadas (Estatstica Aplicada, Tcnicas Quanti-
tativas para Finanas, Pesquisa e Anlise de Dados, Anlise de Dados e Infor-
mao, Mtodos Quantitativos Aplicados s Vendas, Mtodos Quantitativos
Aplicados, etc.) mas todas andam volta da matemtica, da estatstica e
da econometria, as matrias mal-amadas da maior parte dos estudantes. No
que eles no vejam interesse nos temas lecionados, mas o problema so as
bases... Assustam-se com a equao da curva de Gauss, estranham a palavra
ln, perguntam como que passo para o outro lado da equao e pedem,
quase sempre, para explicar outra vez e/ou mais devagar.
Muitos j no tm matemtica desde o 9o ano, outros tiveram at ao 12o
ano mas j no se lembram de quase nada e muitos j deram tudo mas o
tempo encarregou-se de lhes limpar a memria...
Perante este cenrio, e quando as aulas comeam, muitos dos alunos tm
uma expectativa quase catastrca sobre o resultado nal: O que que vai
acontecer?, Se calhar vou chumbar... E fazem muitas perguntas O profes-
sor chumba muitos alunos?, As notas so muito baixas?, preciso saber
muita matemtica? Eu j no me lembro de quase nada..., E estatstica?
J foi h tantos anos...
Mas depois da primeira aula, e pelo menos at bem prximo do exame,
a calma regressa e quase todos admitem que sou capaz!. Deve ser porque
o mtodo de lecionao lhes transmite coragem e conana. A exposio das
matrias, mais baseada em nmeros do que em letras, relativiza o carter
abstrato das letras e as frmulas complexas, assustadoras e desmobiliza-
doras reduzem-se ao que essencial. Para alm disto, e antes de qualquer
frmula se revelar intimidatria, h sempre uma explicao prvia que a con-
textualiza na matria e que permite, atravs de palavras, compreender a sua
necessidade e perceber todos (ou quase todos...) os elementos (abstratos) que
a compem. Como j devem ter reparado, a utilizao da palavra frmulas
uma forma suave de me referir matemtica...
Mas para a acalmia ser denitiva ainda necessrio dar muitos exemplos
de situaes reais onde as matrias lecionadas podem ser aplicadas (e assim
xi
realar a utilidade respetiva) e libert-los da necessidade de fazer contas
sempre que os clculos envolvem frmulas mais complexas. Essa tarefa ca
a cargo do computador e dos programas utilizados: nas aulas os alunos
aprendem a trabalhar com o suplemento Analysis ToolPack do Excel e com
o SPSS. Outros ainda, dependendo do curso e da UC lecionada, utilizam
tambm o EViews. Sempre que possvel as aulas decorrem num laboratrio
de informtica com computadores disposio, mas h tambm cursos em que
os alunos so convidados a trazer o computador pessoal e a instalar o SPSS.
Em qualquer dos casos os alunos servem-se do computador para produzir
resultados a partir dos programas utilizados.
ou no este o mtodo que mais serve a quem frequenta uma ps-
graduao ou um mestrado executivo? Tenho a certeza que sim. Para estes
alunos e para as empresas onde trabalham, e espero que estejam a per-
ceber, os fundamentos matemticos no so assim to importantes... O que
importa que saibam utilizar os programas para produzir informao a par-
tir dos dados disponveis e que sejam capazes de interpretar os resultados de
forma a tirar o mximo proveito dessa informao. E est claro que este
o objetivo principal do mtodo que utilizo.
E agora o porqu deste livro. Ao longo destes anos tenho preparado e
disponibilizado materiais luz deste mtodo: frmulas quanto baste, cpias
de janelas do Excel (para ilustrar os comandos) e texto muito objetivo no
sentido de apresentar conceitos, descrever mtodos e... comentar resultados.
Penso que chegou o momento de lhes dar uma arrumao e apresent-los
sob a forma de livro esperando que, pela sua simplicidade e objetividade,
possa constituir um instrumento de trabalho para todos aqueles que utilizam
a estatstica como mtodo de apoio tomada de deciso.
Termino este prefcio agradecendo, primeiro, aos grandes mestres e pro-
fessores (portugueses) por me terem ajudado a perceber alguma coisa de
estatstica: Bento de Jesus Caraa, Tiago de Oliveira, Bento Murteira, Da-
niel Mller, Silva Ribeiro, Filomena Pimenta, Dinis Pestana, Elizabeth Reis e
Ivette Gomes. E em segundo, a todos os meus alunos pela estima, dedicao
e carinho que me merecem. Espero poder continuar a contar com eles (os que
j foram e os que ho-de vir a ser...) para comentar, encontrar coisas menos
explcitas, identicar erros (se os houver...) e contribuir assim para uma nova
edio ainda mais de acordo com as necessidades dos leitores: prossionais
que encaram os mtodos estatsticos no como um bicho de sete cabeas
mas como ferramentas importantes na anlise e tratamento de dados. Ainda
um obrigado muito especial Filipa pela capa bonita que inventou.
xii
A estatstica sempre por perto
Todos os dias recorremos matemtica e estatstica, mesmo que no
nos demos conta. No supermercado utilizamos a soma para saber quanto
gastmos e a diferena para calcular o troco. Na bomba de gasolina multipli-
camos o preo pelos litros de combustvel para saber quanto que vo custar
os prximos quilmetros a andar de carro. Em casa dividem-se as 8 pastilhas
pelos quatro lhos do casal (apesar do mais velho reclamar uma quantidade
maior...).
Mas a matemtica no se esgota nestas coisas simples da vida... Muito
do bem bom que temos hoje, e que aumentou de forma considervel nos
ltimos anos, deve-se matemtica. Sim, no tenham dvidas! Como no
estamos aqui para destacar as benfeitorias da matemtica, sugiro que leiam
os livros de Guillen (1995) e Stewart (2003) para me darem razo1 .
Apesar de no ser fcil separar a estatstica da matemtica, o nosso en-
foque a estatstica e o grande objetivo evidenciar como ela faz parte das
nossas vidas.
Comeamos pelo Totoloto (apesar do Euromilhes estar na moda...). Jo-
guei outra vez esta semana e... nada! No tenho sorte nenhuma. Pois... a
probabilidade de sair o totoloto, por cada aposta jogada, de 1 em 13983816,
ou seja, 0.00000007151, e quase impossvel ser bafejado pela sorte (a
Santa Casa, e os que dela dependem, que no nos ouam...). Alis, h mesmo
quem diga que maior a probabilidade de ser atropelado por um carro do que
sair o totoloto. Mas h tambm quem diga que ele sai, sai! Portanto, no
um acontecimento impossvel.
Quando vamos ao futebol queremos que o nosso clube ganhe. Mas nunca
sabemos antes do jogo se tal vai acontecer. Para a vitria ser certa, sem-
pre se pode comprar o rbitro... Mas, independentemente do rbitro e da
capacidade dos nossos jogadores, h sempre fatores aleatrios (imprevisveis,
mas que ainda assim tm uma probabilidade de acontecer) que inuenciam o
1 J Galileu (1564-1642) no distante sculo XVII acreditava que a matemtica seria a chave para
a compreenso do universo. Newton, Bernoulli, Faraday, Clausis e Einstein, entre tantos outros,
viriam a dar-lhe razo. Para Galileu o grande livro do universo estava escrito em linguagem
matemtica.
xiii
resultado (por exemplo, o nosso melhor avanado lesionou-se e a equipa no
marcou golos). Portanto, quando se entra no estdio a esperana grande
mas a incerteza no resultado ainda maior.
Probabilidade, aleatrio e acontecimento so termos comuns que tm fun-
damento na estatstica, como se explica mais adiante. Certo, incerto e espe-
rana tambm no lhes so estranhos. Mas no se ca por aqui...
Quando pergunta ao lho (ou ao amigo) a nota que teve no exame de
fsica e ele lhe responde: 12, no h razes para grande entusiasmo. Mas se
ele disser que a mdia da turma foi 6, a a coisa muda de gura e at lhe
pode dar um abrao de parabns!
A mdia talvez o melhor exemplo da nossa convivncia com a esta-
tstica pela frequncia com que utilizada. Quantos quilos tem este saco
de laranjas? O fornecedor disse que o peso mdio de cada saco so dois
quilos. Em mdia quanto tempo demoras a chegar escola? Cerca de 30
minutos. At o banco regista o saldo mdio da sua conta bancria...
E j que falamos de bancos, o que vai fazer com os 5000 euros que pou-
pou no timo ano? Se no os gastar, sempre pode fazer uma aplicao que
lhe proporcione algum rendimento. Na hora de decidir revela-se o quanto
afoito e destemido (aquilo que em nanas se designa por averso ao risco).
Se optar por um depsito a prazo, o banco d-lhe 2% ao m de uma ano (que
representam 100 euros). Se comprar obrigaes da empresa BAUHAUS, a
taxa do cupo 4% (o dobro em euros: 200) e pode tambm comprar, cota-
o de 5 euros, 1000 unidades de participao (UP) do fundo de aes CURE
de um banco a operar em Portugal (a informao que consta do prospeto do
fundo, e que nos interessa, apresentada na gura 1).
Neste caso no possvel antecipar o valor do rendimento pois depende
da cotao das UP no momento da venda. Nesta data pode ganhar e ter
uma mais-valia, perder e incorrer numa menos-valia ou car em casa se a
cotao das UP estiver acima, abaixo ou nos 5 euros. Se a cotao estiver nos
6 euros, por exemplo, tem uma rendibilidade de 20%. Fantstico, vai ganhar
1000 euros!... Mas tambm pode acontecer o contrrio e o preo baixar para
os 4 euros. Neste caso perde 1000 euros e, ao nal de um ano, dos 5000 euros
iniciais restam apenas 4000... Ou seja, do depsito a prazo para as aes o
risco do seu investimento vai aumentando.
O termo risco pode at nem lhe ser familiar, mas percebe, de certeza, que
a possibilidade de ter um rendimento elevado maior nas aes. Alis, se
atentar na informao do prospeto, a rendibilidade do fundo foi de 13.94%
e 25.18% nos ltimos 12 e 24 meses, respetivamente, bem acima dos 2% e
4% oferecidos pelo depsito bancrio e pelas obrigaes. Mas leia tambm
a nota que se apresenta: as rendibilidades representam dados passados, no
constituindo garantia de rendibilidade futura. Alis, tambm est escrito que
xiv
Figura 1: Rendibilidade e Risco de um Fundo de Aes
o valor das UP pode cair e... neste caso incorre numa perda. Portanto, mais
arriscado aplicar os 5000 euros no fundo de aes, pois com o depsito a
prazo ou as obrigaes esto garantidos o capital inicial mais 100 ou 200 euros
de juros, respetivamente (admitindo que o banco e a empresa BAUHAUS no
vo falncia). Os nanceiros chamam risco possibilidade da coisa correr
mal e de perder parte (ou at mesmo a totalidade) do capital investido. Nos
casos do BES e do BANIF, por exemplo, os acionistas perderam tudo...
Ora bem, o risco das nanas 1 mas so da estatstica as formas de
o quanticar. A medida mais utilizada o desvio-padro, como se apresenta
mais adiante, e antes de ser uma medida de risco uma medida de disperso,
designao dada pela estatstica a um conjunto de medidas para aferir sobre
a variao do fenmeno em causa. Se olhar novamente para a informao
do prospeto, e mesmo que no saiba o que o desvio-padro (mas que car
a saber mais adiante), as colunas Classe de risco e Escalo de risco so bem
claras sobre o perigo que investir no fundo de aes. Nos ltimos 2 anos
o risco foi superior a 18% ( como se pudssemos dizer, apesar de no ser
totalmente correto, que o valor das UP tanto pode subir como descer 18%) e
est na penltima classe de risco (risco elevado). Para melhor contextualizar
os 18%, e admitindo que o banco do depsito a prazo e a empresa BAUHAUS
no vo falncia, ao m de um ano receber os 5000 euros mais os juros
vencidos. Portanto, o risco 0%, que compara com os 18% do fundo de aes.
L esto o risco e a estatstica por detrs de uma deciso importante que
1 Da metereorologia, da medicina, da engenharia...
xv
pode tomar: comprar ou no as unidades de participao daquele fundo.
E para no me tornar chato ao defender a minha dama deixo apenas
mais trs exemplos da nossa familiaridade com a estatstica. No dia 9 de
agosto a temperatura em Vilamoura atingiu os 40o , coisa muito rara nos
ltimos 20 anos. Em estatstica estes valores pouco frequentes merecem uma
ateno especial e designam-se por outliers1 , se quisermos utilizar o termo em
ingls, ou valores extremos. A amplitude trmica (AT) diria na Beira Baixa
muito elevada. A AT (no confunda com Autoridade Tributria...) a
diferena entre as temperaturas mxima e mnima dirias e na estatstica esta
diferena constitui tambm uma medida de disperso designada por intervalo
de variao. Na minha empresa cerca de 95% dos funcionrios ganham entre
1200 e 3800 euros. O que quer dizer que o salrio dos restantes 5% inferior
a 1200 ou superior a 3800 euros. No sei se o fez, mas para chegar concluso
este patro pode ter recorrido distribuio normal, mais um instrumento
muito importante da estatstica.
E podamos continuar... mas penso que j os convenci da convivncia
e da importncia da estatstica no nosso dia a dia. E prometo que vai
descobrir muitas outras coisas onde a estatstica j , ou vir a ser, impor-
tante para a sua tomada de deciso. A aplicao dos 5000 euros j foi um
princpio... mas para j vamos estrutura deste livro.
No prximo captulo comea-se (de forma ligeira...) a falar dos dados,
o objeto da estatstica: classicao e formas de apresentao. Dene-se
varivel e prepara-se o Excel para utilizao futura (sempre na perspetiva
da estatstica...). Calculam-se e interpretam-se as frequncias absolutas e
relativas, o valor da moda e constri-se o primeiro histograma.
No captulo 2 introduz-se e aplica-se a generalidade das medidas de esta-
tstica descritiva para ajudar a famlia Pereira na compra de um automvel,
para analisar as vendas e os resultados lquidos das 30 maiores empresas de
sistemas de informao em Portugal no ano 2011 e para avaliar o risco e a
rendibilidade do ndice PSI20 e das aes das empresas SONAE e REN.
No captulo 3 discutem-se e aplicam-se os instrumentos estatsticos para
lidar com os fenmenos de natureza aleatria, introduzindo os conceitos de
probabilidade, varivel aleatria e distribuio de probabilidade. A seguir
descrevem-se com algum detalhe e aplicam-se as distribuies tericas mais
importantes: Binomial, Poisson, Normal, t-Student, F-Snedecor, etc. O ca-
ptulo termina com a simulao de vendas de uma empresa considerando-se
as distribuies Triangular, Normal e Exponencial para modelo probabilstico
terico das quantidades vendidas de trs produtos.
A distino entre amostra e populao constitui o mote do captulo 4.
1 Apesar de ser um termo em ingls, e por aparecer de forma recorrente no texto, a partir de agora
a palavra outlier vai deixar de ser apresentada em itlico.
xvi
Se no se consegue chegar a toda a populao, pelo menos pode recolher-se
uma amostra, o mais representativa possvel daquela populao. Explica-se
tambm a diferena entre parmetro e estatstica e fala-se de distribuies por
amostragem das estatsticas mais importantes: mdia, varincia e proporo
amostrais, no esquecendo o teorema do limite central (que ajuda que ele
nos d!...). A partir das distribuies por amostragem possvel deduzir
intervalos de conana para os parmetros e calcular tambm a dimenso
de uma amostra aleatria simples tendo em conta a dimenso da populao
(se conhecida...), o nvel de conana e o erro amostral em que se pretende
incorrer.
O captulo 5 trata dos testes de hipteses, comeando por apresentar as
abordagens do intervalo de conana e dos testes de hipteses na realizao
de inferncias sobre determinada populao. Distinguem-se ensaios de signi-
cncia de testes de hipteses e explica-se o signicado dos erros tipo I e II na
tomada de deciso. Por ltimo, procede-se descrio e aplicao de alguns
testes, nomeadamente o teste t para a diferena de mdias com o propsito de
avaliar o efeito das aes de formao nas vendas dos lojistas de uma empresa
portuguesa, e os testes mais populares (Jarque-Bera e Kolmogorov-Smirnov)
para aferir sobre a normalidade da distribuio de uma varivel aleatria.
Nos trs captulos seguintes andamos s voltas com a relao entre gran-
dezas econmicas e nanceiras. Se o preo de um bem aumentar, qual
o efeito expectvel sobre a quantidade vendida? Bem, se no for um da-
queles bens mesmo essenciais (po, por exemplo), as vendas devem baixar
(que se cuidem as empresas fornecedoras...). No captulo 6 apresentam-se e
aplicam-se as anlises de correlao e regresso linear simples. Com a pri-
meira consegue-se avaliar o tipo (linear ou no linear), o sentido (direta
ou inversa) e a intensidade (forte ou fraca) da relao. Para isso costuma
recorrer-se a uma representao grca (diagrama de disperso) e a uma me-
dida (coeciente de correlaao simples). A anlise de regresso linear, por
ser mais completa, permite avaliar como que a variao de uma varivel
impacta na variao da outra (se o preo do po aumentar 10 cntimos, qual
a reduo expectvel no valor da vendas). Neste captulo discute-se ainda o
mtodo dos mnimos quadrados ordinrios, as propriedades dos estimadores,
os pressupostos do modelo de regresso linear simples e a inferncia estatstica
atravs dos testes t e F .
Uma vez que as relaes no lineares so tambm bastante comuns entre
variveis de natureza econmica e nanceira, no captulo 7 so analisadas ou-
tras funes de regresso que, apesar de constiturem relaes no lineares na
sua forma original, podem ser convertidas em funes lineares nos parmetros
atravs de transformaes adequadas (a transformao logartmica a mais
utilizada). Para isso so propostas formas funcionais alternativas para a fun-
xvii
o de regresso conhecidas vulgarmente por lin-lin, log-lin, lin-log e log-log.
Tambm se analisam relaes polinomiais e inversas bem como a alterao
na escala dos dados e o seu impacte nas estimativas dos mnimos quadrados
ordinrios.
E o modelo de regresso linear mltipla (captulo 8) pe m a esta pe-
quena odisseia... um modelo mais completo (com mais variveis expli-
cativas) para responder melhor complexidade da vida real. Fala-se ou-
tra vez do mtodo dos mnimos quadrados ordinrios, do R2 , dos testes t
e F e introduzem-se novas medidas: coeciente de determinao ajustado,
coecientes estandardizados, coecientes de correlao parcial, etc. Por m,
avaliam-se de forma mais formal os pressupostos do modelo de regresso linear
atravs dos procedimentos estatsticos mais comuns (quase sempre baseados
em testes de hipteses).
E mesmo mesmo a acabar... faz-se um apanhado das referncias biblio-
grcas. Espero no me ter esquecido de nenhuma... mas se tal acontecer, as
minhas sinceras desculpas a quem cou injustamente de fora.
xviii