Professional Documents
Culture Documents
Generalidades
O coeficiente de correlao no mede a relao
-2
causa-efeito entre duas variveis, apesar de que essa relao possa estar presente. Por exemplo, uma correlao fortemente positiva entre as variveis X e Y no significa afirmar que variaes da varivel X provocam variaes na varivel Y, ou vice-versa. O coeficiente de correlao sozinho no identifica a relao causa-efeito entre as duas variveis; entretanto, numa regresso linear a relao causaefeito deve ser definida no incio da anlise. simples entre duas amostras ou variveis aleatrias.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
-3
variveis contnuas sintetizado por um coeficiente de correlao conhecido com "R de Pearson . Onde so aceitas as seguintes hipoteses:
isto , y e x devem variar livremente. A distribuio de freqncia conjunta (isto , a distribuio de valores dos pares x, y) Normal ou Gaussiana.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
Caracteristicas do Coeficiente R
O coeficiente de correlao tem duas
propriedades que caracterizam a natureza de uma relao entre duas variveis.
-4
-5
Coeficiente de correlao
Mede a intensidade e a direo da relao linear entre duas variveis.
-6
O intervalo de r vai de 1 a 1.
Se r est prximo a 1, h uma forte correlao negativa.
0
Se r est prximo de 0, no h correlao linear.
1
Se r est prximo de 1, h uma forte correlao positiva.
O coeficiente de determinao
O coeficiente de determinao, r2, a razo entre a variao explicada em y e a variao total em y. Variao explicada Variao total O coeficiente de correlao entre as faltas e a nota final era r = 0,975. O coeficiente de determinao r2 = 0,975)2 = 0,9506.
-7
Interpretao: cerca de 95% da variao nas notas finais pode ser explicada pelo nmero de vezes que o aluno falta. Os outros 5% so inexplicados e podem dever-se a um erro amostral ou outras variveis, como inteligncia, tempo dedicado ao estudo etc.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
Dados da problematizao
- 11
Dados da problematizao
numero
1 2 3
- 12
universidade (classificao)
1 1 2,1
Estudante
Jim C. Ed Karen
secundrio (classificao)
80 82 84
4
5 6 7 8 9 10 11 12 13
Marcia
Peter Beverly Tom Mare Sid Jim L. Linda AI John
85
87 88 88 89 90 91 91 92 94
1,4
2,1 1,7 2 3,5 3,1 2,4 2,7 3 3,9
14
15
Susan
Ann Marie
FACENSA Estatstica (aula 5)
96
98
Prof. Neide Pizzolato Angelo
3,6
4
- 13
- 14
- 15
cursos secundrios, com diferentes critrios de avaliao. A motivao e a capacidade podem modificar-se com o decorrer do tempo. Os programas universitrios diferem, tanto na dificuldade como nos critrios de avaliao. H, sem dvida, alguma variao aleatria.
Prof. Neide Pizzolato Angelo
- 16
n xy x y n x
2
n y
- 17
Clculo do R
R 15 3400 ,5 1.335 37 ,5 15 119165 1335
2
- 18
15 107 ,75 37 ,5
51007 ,5 50062 ,5 1787475 1782225 1616,25 1406,25 945 945 0 ,90 5250 210 72 ,46 14 ,49
Funo do Excel
CORREL(matriz1;matriz2)
A funo estatstica CORREL Retorna o coeficiente de
correlao dos intervalos de clula da matriz1 e matriz2.
- 19
- 20
Interpretao de R
Usado para determinar se havia no exemplo anterior algum
relacionamento linear entre a situao do estudante no curso secundrio e sua situao na universidade. positivo entre os dois conjuntos de valores (quando uma variavel aumento a outra tambm). Como R est prximo de + 1,00, parece que as duas variveis esto relacionadas de forma quase perfeita.
- 21
- 23
REGRESSO LINEAR
Regresso Linear
- 24
analisada a reta que melhor explica essa relao, tendo previamente definido a varivel independente e a varivel dependente. De forma geral a varivel independente ser a mais fcil de ser obtida e a varivel dependente a mais dficil de ser obtida Todos os dias, a mdia se encarrega de informar resultados de anlises e pesquisas do tipo: O valor da empresa depende do lucro futuro, a taxa de juro depende da inflao. O salrio depende da escolaridade do trabalhador etc.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
- 25
encontrar uma funo linear que permita: Descrever e compreender a relao entre uma varivel dependente e uma ou mais variveis independentes (regresso mltipla, que no ser vista). Projetar ou estimar uma varivel em funo de uma ou mais variveis independentes; por exemplo, as vendas para diferentes valores de investimento em propaganda, a demanda em funo do preo unitrio e do investimento em propaganda etc.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
Exemplo 1
- 26
analisar a relao entre o investimento realizado em propaganda e as vendas das lojas da rede, para realizar projees de vendas de futuros investimentos em propaganda. A tabela seguinte registra uma amostra representativa extrada dos registros histricos das lojas de tamanho equivalente, com os valores de Propaganda e Vendas em milhes. Analisar a possibilidade de definir um modelo que represente a relao entre as duas variveis ou amostras.
Soluo
- 27
Para analisar a relao entre as duas variveis na planilha Exemplo 1, foi construdo o grfico de disperso das vendas anuais em funo do investimento anual em propaganda. Nesse grfico pode-se ver que, nos ltimos dez anos, o aumento de investimento em propaganda gerou aumento das vendas, e vice-versa.
600 500 400 300 200 100 0 0 10 20 30 Propaganda 40 50
Vendas
Soluo (continuao)
- 28
Essa reta uma das muitas possveis retas que poderiam ser
ajustadas.
- 29
y = a + bx
importante observar que, da mesma forma como a mdia
resume uma varivel aleatria, a reta de regresso resume a relao linear entre duas variveis aleatrias e, conseqentemente, da forma como a mdia varia entre amostras do mesmo tamanho extradas da mesma populao, as retas tambm variaro entre amostras da mesma populao.
- 31
- 32
- 33
- 34
- 35
- 36
Posicionando o mouse sobre um dos pontos do grfico e clicando o boto direita do mouse selecione adicionar linha de tendncia
- 37
- 38
- 39
- 40
possvel representar o comportamento das vendas em funo do investimento em propaganda com um modelo linear e realizar projees. para obter os coeficientes dessa reta de regresso?
Mas qual o critrio utilizado pelo comando linha de tendncia A resposta a essa questo que os coeficientes
de regresso minimizam a soma dos quadrados dos desvios dos valores da amostra y com relao aos correspondentes valores da reta de regresso (Mtodo dos Mnimos Quadrados). amostrado se alguns dos pontos do grfico de disperso no esto contidos na reta de regresso? Essa questo ser respondida mais adiante.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
a e b da reta
Coeficientes de Regresso
Duas importantes caractersticas da equao linear
so: o coeficiente angular da reta ( b) e o coeficiente linear da reta em determinado ponto (a). Uma equao linear tem a forma:
- 41
y = a + bx
onde a e b so valores que se determinam com base
nos dados amostrais; a coeficiente linear da reta, e b o coeficiente angular. A varivel y a varivel que deve ser predita, e x o valor predito, isto , preferencialmente deve-se utilizar x como a varivel mais acessvel (mais fcil de ser obtida) e y a varivel menos acessvel (mais difcil de ser obtida).
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
- 42
uma equao linear. Por isso, em geral necessrio desenvolver um trabalho preliminar para determinar se um modelo linear adequado. O processo mais simples consiste em fazer o grfico dos dados e ver se uma relao linear parece razovel e aps analisar o coeficiente de Correlao Linear. modelo linear, as alternativas so procurar um modelo no-linear conveniente, ou transformar os dados para a forma linear.
- 43
- 46
250
240 Receita 230
220
210 200 190 180 1,5 2,0 2,5 Investimento em publicidade
Prof. Neide Pizzolato Angelo
um mnimo 3,0
- 48
- 49
Coeficiente b Substituindo os resultados parciais obtidos na planilha do slide anterior: 10 112 . 455 270 3 . 800 b 9,7381 2 10 8 . 302 270 Coeficiente a Substituindo os resultados parciais obtidos na planilha do slide anterior :
a 3 . 800 9, 7381 270 117 ,07 10
- 50
Funo do Excel
INTERCEPO(val_y; val_x)
- 51
- 52
Funo do Excel
- 53
INCLINAO(val_y; val_x)
A funo estatstica INCLINAO retorna o coeficiente b
da reta de regresso linear considerando os valores das amostras informados nos argumentos val_conhecidos_y e val_conhecidos_x.
- 54
- 55
- 56
Projeo
- 57
Exemplo 3
- 58
- 59
Funo do Excel
- 60
os valores na ordem correta, o argumento val_conhecidos_y se refere aos valores da varivel dependente y, e o argumento val_conhecidos_x aos valores da varivel independente x. matrizes ou referncias que contenham nmeros.
FACENSA Estatstica (aula 5) Prof. Neide Pizzolato Angelo
Funo do Excel
- 61
- 62
- 63
Observaes finais
- 65