Professional Documents
Culture Documents
INTRODUO AO CAPTULO
entre os contedos optamos pela juno. Ele encerra a Estatstica Descritiva e serve como introduo Estatstica Inferencial, pois no estudo desse item, est incluindo, em quase todos os tpicos, as Medidas de Disperso atravs da utilizao principalmente do Desvio Padro. Iniciaremos, ao estudo das Medidas de Posio Central, nesse momento analisaremos os seguintes temas: Mdia, Moda, Mediana e as Separatrizes. No segundo momento, trabalharemos as Medidas de Disperso, onde nosso foco ser o Desvio Padro nas medidas de disperso absoluta e o Coeficiente de Variao nas medidas de disperso relativa. Vale pena ressaltar que todos os exemplos resolvidos tambm so comentados da maneira mais simples e detalhada possvel, para uma melhor compreenso por parte do aluno. De um modo geral daremos um tratamento especial s situaes de clculo tanto nas Medidas de Posio Central e tambm Medidas de Disperso, quando no estudo das Distribuies de Freqncia para Dados Agrupados, pois aqui h a exigncia de equaes, tornando mais trabalhoso o aprendizado desse assunto. Lembre-se, s trabalhoso mais no difcil!
53
Para resumir a quantidade de informao contida em um conjunto de dados, os estatsticos definem medidas que descrevem, atravs de um s nmero, caractersticas de dados. Algumas dessas medidas descrevem a tendncia central, isto , a tendncia que os dados tm de se agrupar em torno de certos valores.
De modo geral, as Medidas de Posio Central caracterizam-se pelo fato de seus resultados tenderem, em geral, a agrupar-se em torno dos valores centrais em uma D.F. Por exemplo, quando um educador revela que a mdia da turma foi 8,5 na disciplina de Estatstica, na verdade ele est mostrando que tal valor representa no somente a nota de um aluno, mas tambm a caracterstica de todos os alunos que realizaram sua avaliao. Com base nesse resultado podemos, entre outras coisas, por meio de um parmetro (mdia de aprovao) estabelecido pela Instituio de Ensino, se essa turma est abaixo, acima ou na mdia de aprovao. Dentre as Medidas de Posio Central, podemos destacar: Mdia, Moda, Mediana e as Separatrizes.
54
Analisaremos aqui, trs situaes: a) CONJUNTO DE VALORES: Quando a mdia calculada a partir dos dados brutos ou de um rol. Somam-se todas as variveis e divide-se por sua quantidade. Nesse caso tem-se a mdia chamada aritmtica simples:
x=
xi n
x MDIA xi VARIVEIS
n QUANTIDADE DE VARIVEIS
Ex.: Calcule a mdia para o tempo (em horas) de diversas cirurgias realizadas em certo hospital, sabendo que os dados coletados foram: 3, 5, 8, 12, 7, 12, 15, 18, 20.
x=
55
x=
x xi
x i .Fi N
MDIA
VARIVEL
xi
16 17 19 20 22 23 24 25
Fi
3 3 2 4 2 3 3 5 25
xi . Fi
48 51 38 80 44 69 72 125 527
x=
xi.Fi
Vale ressaltar que em algumas situaes principalmente quando o resultado for divulgado a pessoas leigas o valor calculado13 no retrata a realidade com coerncia, apesar da varivel idade, ser quantitativa contnua, devemos fazer, nesse caso, uma restrio e considerar o valor estimado14, logo usando o bom senso conclumos que a idade mdia dos pacientes internados igual a aproximadamente 21anos.
13 14
Oriundo de clculos numricos. O que depende da estima ou apreo em que se tem um objeto.
56
x=
X i .Fi N
MDIA
Classes
Fi 5 8 7 9 13 6 2 50 N
16 23 30 37 44 51 58
23 30 37 44 51 58 65
x=
Xi.Fi
57
Em algumas situaes a moda utilizada para a mensurao da mdia e mediana, assim nos assegura Kirsten & Rabahy (2006, p.46) ao comentar sobre a mesma: [...] pode ser utilizada quando se deseja ter a noo aproximada da mdia aritmtica: quanto maior o nmero de observaes que apresenta valor idntico, maior a possibilidade da mdia aritmtica estar prxima a esse valor. Daremos nfase a duas situaes, na anlise da moda: as Distribuies de Freqncia para dados no agrupados e dados agrupados.
a) PARA UMA D.F DE DADOS NO AGRUPADOS: Nesse caso, s basta saber que a Moda dada pela varivel que possui maior freqncia absoluta.
Ex1: Mo = 5 (unimodal) Xi Fi 3 4 5 6 7
3 5 10 9 4
Xi Fi
3 4 1 8
5 4
6 7 8 9 3 8 5 6
3 4 2 2
5 2
6 7 2 2
58
b) PARA UMA D.F DE DADOS AGRUPADOS: Aqui, impossvel identificar o valor exato da Moda, a olho nu, como no caso anterior, pois a varivel est disposta em uma classe a Moda pode assumir qualquer um dos infinitos valores em uma classe logo necessrio o uso de um modelo matemtico para encontrar o resultado, mas primeiro preciso determinar a classe modal (classe que possui maior freqncia absoluta), para assim resolvermos o problema. Existem alguns modelos matemticos para o clculo da moda, autores como Kirsten & Rabahy (2006), Costa Neto (2002) e outros, sugerem a frmula de Czuber. Faremos uma adaptao na equao claro sem alterar sua estrutura para tornar mais fcil a interpretao dos valores que iro compor a equao na efetuao dos clculos:
Mo = l +
l
1 2
1 .h 1 + 2
DIFERENA
IMEDIATAMENTE ANTERIOR.
DIFERENA
IMEDIATAMENTE POSTERIOR.
AMPLITUDE DA CLASSE.
59
Classes
Fi 5 8 7 9 13 6 2 50
16 23 30 37 44 51 58
23 30 37 44 51 58 65
MTODO DE RESOLUO
Devemos encontrar a Classe Modal (possui maior freqncia absoluta) e, em seguida, efetuar o clculo para o valor da Moda.
Qntd Mulheres
ndice de VO2
Classes
Fi 5 8 7 9 13 6 2 50
16 23
Classe Modal
23 30 37 44 51 58 65
Mo = 44 +
30 37 44 51 58
Portanto, conclumos que a maioria das mulheres com idades variando de 20 a 29 anos, possui o ndice de VO2 igual a 49,6 ml(kg.min).
60
a) CONJUNTO DE VALORES: Quando a mediana calculada a partir dos dados brutos ou de um rol, devemos verificar a quantidade de elementos (n) da mesma:
n + 1 Se n for mpar: o rol admite apenas o termo que ocupa a posio 2 Ex.: Calcular a mediana do conjunto X: 3, 5, 8, 12, 7, 12, 15, 18, 20.
MTODO DE RESOLUO
i) Organizaremos os dados em um Rol: 3, 5, 7, 8, 12, 12, 15, 18, 20. ii) Calcularemos o termo segundo a equao mencionada anteriormente:
9 +1 =5 2
Verificamos que o resultado da mediana ocupa a 5 posio, isto , a mediana vale 12. Observe, se o ltimo valor da mediana fosse 345, isso no afetaria o resultado encontrado.
61
MTODO DE RESOLUO
i) Organizaremos os dados em um Rol: 3, 5, 7, 8, 12, 16, 15, 18, 18, 20. ii) Calcularemos o valor da mediana segundo a mdia aritmtica entre 12 e 16 ento temos que:
12 + 16 = 14 2
Portanto nossa Mediana igual a14.
b) PARA DADOS NO AGRUPADOS: Como neste caso as variveis j esto devidamente organizadas, a anlise feita com base no tamanho da amostra (N) e a ajuda das freqncias acumuladas (fac), segundo dois casos: 1 caso (N mpar): Para Silva (1999a), mediana o termo que ocupa a posio N + 1 .
2
Ressaltamos que a varivel correspondente ao valor da Mediana s ser encontrada por meio da ajuda das fac.
Ex.: Calcule a idade para 50% dos pacientes internados em certo Hospital, por patologias relacionadas rea da Ortopedia, segundo a D.F abaixo:
Idades (anos) Qntd de Pacientes
xi
16 17 19 20 22 23 24 25
Fi
3 3 2 4 2 3 3 5 25
62
Idades (anos)
Qntd de Pacientes
xi
16 17 19 20 22 23 24 25
Fi
3 3 2 4 2 3 3 5 25
fac
3 6 8 12 14 17 20 25 -
25 + 1 = 12,5 2
Primeiro devemos calcular as devidas freqncias acumuladas, aps, devemos efetuar a expresso numrica acima e obter a ordem do termo correspondente a mediana, em seguida, procuraremos esse resultado na coluna da fac. De uma maneira prtica, aps o clculo do termo, devemos procur-lo na coluna das freqncias acumuladas, quando o valor no se encontra (nesse caso 12,5), devemos considerar o valor imediatamente maior ao calculado (nesse caso 14). Portanto a varivel equivalente 22.
2 caso (N par): Silva (1999a), mediana admite dois valores centrais que ocupam as posies
N N e +1 2 2
Ex.: Calcule o peso para 50% das crianas avaliadas em um teste para um diagnstico de obesidade, segundo a D.F abaixo:
Paso (Kg) Qntd de Crianas
xi
25 32 43 46 50 52 58
Fi
3 3 5 1 2 3 4 21
63
xi
25 32 43 46 50 52 58
Fi
3 3 5 1 2 3 4 21
fac
3 6 11 12 14 17 21 -
21 = 10,5 2
21 + 1= 11,5 2
Primeiro devemos calcular as devidas freqncias acumuladas, aps, efetuar as expresses numricas acima e obter a ordem dos termos correspondentes, em seguida, procuraremos esses resultados na coluna da fac, como no caso anterior. Assim encontramos as variveis 43 e 46. Agora, s calcular a mdia aritmtica entre esses dois resultados e encontrar o valor da mediana, ou seja:
Md =
43 + 46 = 44,5 Kg 2
c) PARA UMA D.F DE DADOS AGRUPADOS: Assim como na Moda, nesse caso, exige um modelo de clculo para obtermos a mediana. Quanto a metodologia de clculo procederemos da mesma maneira, ou seja, primeiro precisamos determinar a classe em que se encontra a Mediana (classe Mediana). Essa classe determinada pelo que denominamos como identificador da classe Mediana (
N 2
O modelo matemtico que lembramos! receber uma adaptao, mas sem alterar sua essncia utilizado para o calculo da mediana o seguinte:
N fant 2 .h Md = l + Fi
l fant Fi
64
h N
N 2
Ex.: Calcule o valor do ndice de VO2 em ml(kg.min) para 50% das mulheres com idades variando de 20 a 29 anos, segundo a D.F abaixo:
ndice de VO2 Qntd Mulheres
Classes
Fi 5 8 7 9 13 6 2 50
16 23 30 37 44 51 58
23 30 37 44 51 58 65
MTODO DE RESOLUO
para a freqncia acumulada, em seguida calcularemos o identificador da classe mediana para determinar a mesma, veja:
ndice de VO2 Q
ntd
Mulheres
Classes
Fi
5 8 fant 7 9 13 6 2 50
16 23 30
Classe Mediana
23 30 37 44 51 58 65
fac 5
13 20 29 42 46 50 65
50 = 25 2
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe mediana na coluna da fac. Utilizando a maneira prtica, o nmero imediatamente superior ao calculado (25) o nmero 29, logo a classe Mediana a quarta classe, de cima para baixo.
37 44 51 58
Md = 37 +
Portanto, conclumos que 50% das mulheres com idades variando de 20 a 29 anos, possui o ndice de VO2 igual a 40,9 ml(kg.min). SEPARATRIZES
So valores que dividem uma srie de dados ordenados em quatro, cinco, dez e cem partes iguais. Essas medidas tm ligao com a mediana, pois a mesma, tambm considerada uma separatriz. Segundo Silva (1999a, p. 89):
[...] a mediana que divide a seqncia ordenada em dois grupos, cada um deles contendo 50% dos valores da seqncia, tambm uma medida separatriz. Alm da mediana, as outras medidas separatrizes que destacaremos so: quartis, quintis, decis e percentis.
Daremos aqui nfase aos quartis e percentis e tambm sua analise considerando somente as Distribuies de Freqncia para dados agrupados.
Os quartis so calculados a partir de uma adequao na equao da mediana, assim como, seu procedimento de clculo. Ressaltamos que o Segundo Quartil igual Mediana, pois o mesmo se encontra tambm no centro da seqncia de valores. A equao geral para o Quartil dada por:
K .N fant 4 .h QK = l + Fi
66
QK l fant
QUARTIL K
QUARTIL, K representa a ordem do quartil (K= 1, 2 OU 3) LIMITE INFERIOR DA CLASSE QUE CONTM O QUARTIL K FREQUNCIA ACUMULADA DA CLASSE ANTERIOR CLASSE QUE CONTM O
Fi h N
FREQUNCIA ABSOLUTA DA CLASSE QUE CONTM O QUARTIL K AMPLITUDE DA CLASSE QUE CONTM O QUARTIL K TAMANHO DA AMOSTRA. IDENTIFICADOR DA CLASSE QUE CONTM O QUARTIL K
k .N 4
Ex.: Com base na D.F abaixo, calcule o valor do ndice de VO2 em ml(kg.min) limite, para as mulheres com idades variando de 20 a 29 anos, segundo categorias: a) Categoria A, formada por 25% das mulheres; b) Categoria B, formada por 50% das mulheres; c) Categoria C, formada por 75% das mulheres;
ndice de VO2 Qntd Mulheres
Classes
Fi 5 8 7 9 13 6 2 50
16 23 30 37 44 51 58
23 30 37 44 51 58 65
67
= l
N 4 +
Fi
f ant .h
para a freqncia acumulada, em seguida calcularemos o identificador da classe do Q1 para determinar a mesma, veja:
ndice de VO2 Qntd Mulheres
Classes
Fi 5 8 7 9 13 6 2 50
16
Classe Q1
23 30 37 44 51 58 65
fac 5 13 20 29 42 46 50 -
fant
50 = 12,5 4
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe do Q1 na coluna da fac. Utilizando a maneira prtica, o nmero imediatamente superior ao calculado (12,5) o nmero 13, logo a classe do Q1 a segunda classe, de cima para baixo.
23 30 37 44 51 58
Q 1 = 23 +
Portanto, conclumos que a categoria A (25% das mulheres) possui um limite para o ndice de VO2 igual a 30,9 ml(kg.min).
68
devemos ressaltar que a separatriz utilizada ser o Segundo Quartil (Q2) que j foi dito, igual a Mediana. Como esse exemplo o mesmo utilizado no clculo da Mediana, ento temos que: Md=Q2= 40,9 ml(kg.min), Portanto, conclumos que a categoria B (50% das mulheres) possui um limite para o ndice de VO2 igual a 40,9 ml(kg.min).
Item c: Ao calcularmos o limite de VO2 mx. para esse percentual (75%)
devemos ressaltar que a separatriz utilizada ser o Terceiro Quartil (Q3), onde devemos seguir o mesmo procedimento utilizado no item a, isto :
1 passo: Devemos personalizar a equao para o Terceiro Quartil, logo:
= l
3 .N 4 +
Fi
f ant .h
para a freqncia acumulada, em seguida calcularemos o identificador da classe do Q3 para determinar a mesma, veja:
ndice de VO2 Q
ntd
Mulheres
Classes
Fi 5 8 7 9 13 6 2 50
16 23 30 37
Classe Q3
23 30 37 44 51 58 65
fac 5 13 20 29 42 46 50 -
3 . 50 = 37,5 4
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe do Q3 na coluna da fac. Utilizando a maneira prtica, o nmero imediatamente superior ao calculado (37,5) o nmero 42, logo a classe do Q3 a quinta classe, de cima para baixo.
fant
44 51 58
Q 3 = 44 +
69
Os percentis so calculados a partir de uma adequao na equao da mediana, assim como, seu procedimento de clculo. Ressaltamos que o Segundo Quartil e a Mediana tem o mesmo valor do Qinquagsimo Percentil (P50), pois o mesmo se encontra tambm no centro da seqncia de valores. A equao geral para o Percentil :
K .N f ant 100 .h PK = l + Fi
PK l
PERCENTIL, K representa a ordem do percentil (K= 1,..., 99) LIMITE INFERIOR DA CLASSE QUE CONTM O PERCENTIL K
70
Classes
Fi 5 8 7 9 13 6 2 50
16 23 30 37 44 51 58
23 30 37 44 51 58 65
MTODO DE RESOLUO
Ao calcularmos o limite de VO2 mx. para esse percentual (10%) devemos ressaltar que a separatriz utilizada ser o Dcimo Percentil (P10):
1 passo: Devemos personalizar a equao para o Primeiro percentil, logo:
P 10
10 . N f ant 100 .h =l + Fi
para a freqncia acumulada, em seguida calcularemos o identificador da classe do P10 para determinar a mesma, veja:
ndice de VO2 Qntd Mulheres
Classes
Classe P10
Fi 5 8 7 9 13 6 2 50
16 23 30 37 44 51 58
23 30 37 44 51 58 65
fac 5 13 20 29 42 46 50 71
10 .50 =5 100
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe do P10 na coluna da fac. Utilizando a maneira prtica, verificamos que a classe do P10 a primeira. Nesse caso no h freqncia acumulada anterior, isto , fant = 0.
P10 = 16 +
(5 0 ) . 7 = 23 ml (kg. min )
5
Portanto, conclumos que 10% das mulheres, possuem um limite para o ndice de VO2 igual a 23 ml(kg.min). MEDIDAS DE DISPERSO OU VARIABILIDADE
As medidas de Posio Central no so suficientes para avaliar um resultado no que tange a variabilidade15, preciso um complemento para que se tenha noo exata de quanto os dados esto ou no afastados em relao a um ponto de referncia (nesse caso, a mdia). Para Costa Neto (2002, p.24): A informao fornecida pelas medidas de posio necessita em geral ser complementada pelas medidas de disperso. Estas servem para indicar o quanto os dados se apresentam em torno da regio central. Portanto as Medidas de Disperso completam com maior mincia as informaes fornecidas pelas Medidas de Posio Central, isto , avaliam a representatividade da mdia em um conjunto de dados. As Medidas de Disperso classificam-se em duas: medidas de disperso
absolutas (Amplitude Total, Desvio Mdio, Varincia e Desvio Padro) e medida de disperso relativa (Coeficiente de Variao).
Para iniciarmos esse tpico, devemos lembrar que em suma, a palavra disperso est ligada ao grau de afastamento, ou seja, quanto mais afastado da mdia, mais disperso haver. Por outro lado, precisamos associar uma palavra antnima ao grau de proximidade a homogeneidade. Quanto mais prximo da mdia, mais homogeneidade haver. Considere, por exemplo, os trs tipos de variveis abaixo:
15
72
Ambos possuem mdia igual a 70. Vamos fazer primeiramente uma analise, levando em considerao a homogeneidade, em seguida, faremos uma concluso acerca da disperso. Anlises: a) O conjunto W mais homogneo que S e T, pois seus elementos so iguais a mdia; b) O conjunto S mais homogneo que T, pois seus elementos esto mais prximos da mdia em relao aos de T; c) O conjunto T o menos homogneo dentre todos, pois seus elementos esto muito distantes da mdia; Concluses: a) O conjunto W possui disperso nula; b) O conjunto S menos disperso que T; c) O conjunto T o mais disperso todos. Logo, ficou claro como funcionam as anlises de homogeneidade e disperso dos elementos em relao mdia. Tambm podemos verificar que a pesar desses conjuntos terem a mesma mdia, possuem caractersticas bem distintas segundo sua variabilidade. claro que na vida real, no analisamos dessa maneira os dados estatsticos, dispomos de ferramentas de diversos nveis, desde o mais simples at o mais rebuscado, utilizado em trabalhos cientficos.
73
AMPLITUDE TOTAL (AT) a Medida de Disperso mais simples de todas. Analisa em seu clculo, apenas os valores extremos da seqncia numrica. Vejamos duas situaes: a) PARA UMA D.F DE DADOS NO AGRUPADOS: a diferena entre o maior e o menor valor, observado na D.F ou conjunto de valores (dispostos em Rol). Matematicamente, podemos escrever a Amplitude total como:
AW= 70 70 = 0, disperso nula; AS= 72 68 = 4, menos disperso que T; AT= 160 5 = 155, mais disperso dentre todos.
b) PARA UMA D.F DE DADOS AGRUPADOS: a diferena entre o ponto mdio da primeira classe pelo ponto mdio da ltima classe na D.F:
Classes
13 16 19 22 25 28 16 19 22 25 28 31
Fi
8 15 7 3 12 5 50
74
Primeiramente devemos calcular os Pontos Mdios da primeira a ltima classe, respectivamente, em seguida, efetuar o clculo e obter o resultado para a Amplitude Total, segundo a equao apresentada. Logo temos que:
Qntd Pacientes
Classes
13 16 19 22 25 28 16 19 22 25 28 31
Fi
8 15 7 3 12 5 50
Xi
14,5 29,5 -
Como a amplitude total s analisa os valores extremos da srie no considerando os valores intermedirios, ela no vista como um parmetro para efeito de exatido, nos resultados. Para Vieira (2003, p.62): A amplitude no mede bem a disperso por uma razo bem simples: para calcul-la, usam-se apenas os valores extremos. importante que todos os dados sejam usados nos clculos da medida de disperso.
75
Aluno B
2 3 4 5 6
6,5
ALUNO A
10 9,5 9 8,5 8 7,5 7 6,5 6 5,5 5 4,5 4 3,5 3 2,5 2
ALUNO B
8,0 7,2
10 9,5 9 8,5 8 7,5 7 6,5 6 5,5 5 4,5 4 3,5 3 2,5 2
9,5
7,0
7,5
7,8
7,5
NOTAS
NOTAS
6,5
AVALIAES
AVALIAES
Note que a Amplitude Total para os dois alunos a mesma At = 6 1= 5, porm note que nos grficos, as notas para o aluno A so bastante regulares (bem prximas uma das outras), enquanto as notas do aluno B so mais diversificadas (bem distintas entre si), isto , as notas tm maior variabilidade para o aluno B do que para o aluno A, embora a Amplitude Total no tenha captado esse importante fato.
DESVIO MDIO (Dm) Desvio corresponde ao conceito matemtico de distncia. Segundo Cardoso (2007, p.136): Os desvios so afastamentos nos dados. O ponto de referncia para efetuar-se o clculo dos desvios ou afastamentos nos dados a mdia aritmtica dos desvios.
76
dada pela mdia aritmtica dos quadrados dos desvios. Notaes: quando a seqncia de dados representarem uma populao ento a varincia ser representada por
ser indicada por S2, vale ressaltar , que a denominao da letra S na simbologia da Varincia assim como do Desvio Padro, que veremos a seguir, oriunda da palavra Space (na lngua inglesa significa espao, distncia, etc.). Aqui trabalharemos apenas com a varincia amostral. Aqui analisaremos trs situaes: a) CONJUNTO DE VALORES: Quando a varincia calculada a partir dos dados brutos ou de um rol, devemos verificar a quantidade de elementos (n) da mesma. Usaremos a seguinte expresso:
S2 =
( x )
n 1 n
Ex.: Calcular a Varincia para o tempo (em meses) na preparao, de atletas para uma competio, onde os valores so: 4, 6, 4, 6, 5, 5.
77
Primeiramente devemos criar uma tabela com os itens n, x e x2 para facilitar os clculos matemticos, ento:
n x
4 6 6 4 6 5 5
16 36 16 36 25 25 154
S2 =
154
(30 ) 2
= 0,8 meses 2
6 6 1
30
x2
Logo esses atletas possuem uma varincia para o tempo de preparao acerca de uma competio igual a 0,8 meses2.
d) PARA UMA D.F DE DADOS NO AGRUPADOS: Nesse caso, leva-se em considerao a mdia e o tamanho da amostra D.F:
S2 =
(x
x . Fi N 1
2 i
Ex.: Calcular a Varincia para as idades (em anos) de crianas com problemas de desnutrio segundo a D.F abaixo:
Idade de crianas Qntd de crianas
xi
3 4 5 6 7
Fi
2 5 7 4 4 22
78
xi
3 4 5 6 7
Fi
2 5 7 4 4 22
xi . Fi
6 20 35 24 28 113
x=
colunas (xi x )2 e (xi x )2. Fi, para assim ento procedermos ao clculo para a Varincia:
Idade de crianas Qntd de crianas
xi
3 4 5 6 7
Fi
2 5 7 4 4 22
xi . Fi
6 20 35 24 28 113
(xi x )2
4,4 1,2 0 0,8 3,6 -
(xi x )2. Fi
8,8 6 0 3,2 14,4 32,4
S2 =
79
S2
(X =
2 i
.Fi
) (x)
Ex.:Calcular a Varincia para a quantidade de comprimidos (referente a vitamina C) ingerida por atletas do Atletismo segundo a D.F abaixo:
Comprimidos ntd Ingeridos (no ms) Q Atletas
Classes
13 16 19 22 25 28 16 19 22 25 28 31
Fi
8 15 7 3 12 5 50
MTODO DE RESOLUO
Classes
13 16 19 22 25 28 16 19 22 25 28 31
Fi
8 15 7 3 12 5 50
Xi
14,5 17,5 20,5 23,5 26,5 29,5 -
Xi . Fi
116 262,5 143,5 70,5 318 147,5 1058
x=
Xi. Fi
80
Classes
13 16 19 22 25 28 16 19 22 25 28 31
Fi
8 15 7 3 12 5 50
Xi
14,5 17,5 20,5 23,5 26,5 29,5 -
Xi . Fi
116 262,5 143,5 70,5 318 147,5 1058
X2 . Fi
1682 4593,8 2941,8 1656,8 8427 4351,3 23652,7
S2 =
Xi. Fi X2. Fi
COMENTRIO: Aps o clculo da varincia nota-se que a unidade da varivel em questo est elevada ao quadrado, portanto, em algumas situaes, a anlise dos dados no tem sentido. Assim comenta Vieira (2003, p.65-66): Como medida de disperso, a varincia tem a desvantagem de apresentar unidade de medida igual
ao quadrado da unidade de medidas de dados. [...] Isso acontece porque a
varincia obtida a partir da soma de quadrados dos desvios. Logo, se a unidade de medida dos dados expressa em comprimidos exemplo acima a varincia expressa em comprimidos quadrados. Para corrigir essa deficincia utiliza-se o emprego do Desvio Padro.
81
Matematicamente definido como a raiz quadrada da varincia. Segundo Callegari-Jacques (2003, p.36):
Uma dificuldade com a varincia, como medida descritiva da disperso, o fato de no poder ser apresentada com a mesma unidade com que a varivel foi medida [...]. A soluo extrair a raiz quadrada positiva da varincia, j que, com isso, se volta unidade original da varivel. Essa nova medida de variabilidade denominada desvio padro.
Notaes: quando a seqncia de dados representarem uma populao ento o desvio padro ser representada por
amostra ser indicado por S. Aqui trabalharemos apenas com o desvio padro amostral. Logo temos que:
S = S2
Ex.: Para os exemplos mostrados anteriormente (tempo de preparao de atletas, idade de crianas com desnutrio e comprimidos ingeridos por atletas) no estudo da varincia, calcule os respectivos desvios padro.
MTODO DE RESOLUO
82
COEFICIENTE DE VARIAO (Cv) uma medida de disperso relativa (expresso em percentual) que analisa o grau de concentrao em torno da mdia para sries distintas. Para CallegariJacques (2003), quando analisamos duas amostras para a mesma varivel, podemos comparar os desvios padro verificando onde ocorreu maior variao, porm, a situao muda quando se trata de variveis distintas, neste caso, devemos utilizar uma medida de disperso independente da unidade de mensurao da varivel, chamada coeficiente de variao. definido como a razo entre o desvio padro e a mdia, calculado atravs da expresso:
Cv =
S .100 x
O Coeficiente de Variao se configura como uma medida de disperso mais completa quando comparado s mediadas de disperso absoluta. Assim comenta Silva (1999a, p.121-122):
Como a medida de disperso relativa leva em considerao a medida de disperso absoluta e a mdia da srie, uma medida mais completa que a medida de disperso absoluta. Portanto, a medida de disperso relativa prevalece sobre a medida de disperso absoluta. Podemos afirmar que a srie que tem a maior disperso relativa, tem de modo geral a maior disperso.
Vamos analisar essa situao por meio do estudo de caso abaixo. Ex.: Em uma academia, o salrio dos estagirios de Educao Fsica do sexo masculino em mdia de R$ 400,00 com desvio padro de R$ 150,00 enquanto que as estagirias ganham em mdia R$ 300,00 com desvio padro de R$ 120,00. Determine quem possui o salrio mais homogneo (menos disperso).
MTODO DE RESOLUO 83
ambos os sexos:
Logo o salrio das estagirias apresenta maior variabilidade, ou seja, os estagirios possuem os salrios mais homogneos. Observe que o desvio padro (medida de disperso absoluta) para o salrio dos estagirios maior que no salrio das estagirias, mas nem por isso, deixou de possuir menor disperso. Quando analisamos uma srie de valores, de maneira individual, podemos utilizar um parmetro para medir a disperso por meio do Coeficiente de Variao Analisando individualmente uma srie, podemos classific-la com mdia, baixa ou alta disperso segundo os parmetros abaixo:
Se Cv 10% BaixaDisperso Se 10% < Cv 20% Mdia Disperso Se Cv > 20% Alta Disperso
84