You are on page 1of 167

Fundamentos Quantitativos

Liderana e Gesto de Equipes

Parte 1 Curso Bsico para Tcnicas Multivariadas

Liderana e Gesto de Equipes

OBJETIVO DA PARTE 1
Fornecer uma base conceitual para acompanhamento dos mdulos que apresentam as tcnicas multivariadas Inclui os mdulos 1, 2 e 3

Liderana e Gesto de Equipes

Metodologia da Anlise Quantitativa


Definir Problema Desenvolver Modelo Obter Dados Desenvolver Soluo Testar Soluo Analisar Resultados
Fundamentos Quantitativos

Modelamento Matemtico

Implementar Aes

Modelamento Matemtico
Representam a realidade (se exatos); Ajudam decisores a formular problemas; Previso de conseqncias; Podem economizar dinheiro e tempo nas decises; Etc.
Fundamentos Quantitativos

VANTAGE NS

Modelamento Matemtico

DESVANTAGE NS (simplificao da Baseia-se num modelo

realidade, limitaes); Dificuldade de obteno de dados; Desconsidera aspectos qualitativos, percepes; Rejeio de quem no entende ou se sente ameaado; e
Fundamentos Quantitativos

Mdulo 1 Conceitos Gerais

Liderana e Gesto de Equipes

Introduo Anlise Quantitativa

Contedo
Unidades, medidas e os nmeros Interpretao de tabelas Construo e interpretao de grficos

Fundamentos Quantitativos

Introduo Anlise Quantitativa


ESCALAS DE MENSURAO
ESCALA MTRICA : a escala em que a origem e a unidade correspondem a grandezas concretas do mundo real. Pode ser uma escala relativa ou intervalar (ex: temperatura 0C). Pode ser uma escala absoluta ou escala da razo (ex: idade). So grandezas associadas a variveis mtricas (mensurveis). ESCALA ORDINAL: indica dominncia e direo (ex: classes de idade, classes de renda, nvel de satisfao alto/ mdio/ baixo). Podem corresponder a grandezas originalmente associadas a variveis mtricas e tambm a medidas de prioridade. ESCALA NOMINAL: qualquer rtulo ou nome que serve para discriminao. Pode ser dicotmica (ex: consumidor ou no / 0 ou 1) ou polinomial (ex: casado, solteiro ou vivo).
Fundamentos Quantitativos

Introduo Anlise Quantitativa


Variveis Determinsticas e Variveis Aleatrias Variveis determinsticas: So aquelas em que conhecemos o valor exato, no se tratando de uma estimativa. Variveis aleatrias: So aquelas nas quais no temos o valor precisamente determinado, podendo estar dentro de um espectro de valores provveis. Variveis Aleatrias Discretas e Variveis Aleatrias Contnuas Variveis Aleatrias Discretas: So aquelas em que os valores provveis so numerveis, ou seja, podem ser postos em lista {x1,x2,x3, ...}. Exemplo: A soma dos valores do arremesso simultneo de dois dados. Varivel Aleatrias Contnuas: So aquelas em que a varivel pode tomar todos os valores possveis dentro de um intervalo definido. Exemplo: Tempo de durao de uma lmpada que comeou a ser usada.
Fundamentos Quantitativos

Introduo Anlise Quantitativa

Unidades, Medidas e Nmeros

Fundamentos Quantitativos

Introduo Anlise Quantitativa


Tabelas
VARIVEIS INDEPENDENTES (x) VARIVEL DEPENDENTE (y)

Fundamentos Quantitativos

Introduo Anlise Quantitativa


Tabelas - Exemplo
Aluguel de casas destinadas a repblicas, em funo da distncia ao campus universitrio e idade do imvel Unidades
Distncia (km) 0 3 8 4 0,5 10 1,5 6 1 2 9 5 2,5 8 5,5 Idade (anos) 1 30 23 5 6 38 35 40 25 15 2 9 7 3 20 Aluguel (R$) 900 600 400 700 850 300 650 400 700 750 500 600 750 500 550

Variveis Explicativas ou Independentes (x)

Varivel Explicada ou Dependente (y)

Fundamentos Quantitativos

Representao Grfica
Grficos normalmente trazem a informao de forma visual e prontamente interpretvel. Exemplos de grficos a serem trabalhados nesta disciplina: Grfico de Disperso (Scatter Plot) Histograma
Fundamentos Quantitativos

Grficos
Normas para a construo de grficos
Todo grfico deve ter Ttulo e Escala. A escala deve ser adequada ao objeto de estudo. O ttulo deve ser acima do grfico. Eixo Horizontal = Abscissa (x). Eixo Vertical = Ordenada (y). Em cada eixo identificar a varivel representada. No eixo horizontal (x) apresentamos a varivel independente ou varivel explicativa

Fundamentos Quantitativos

Grficos
Ordenada (y)

Eixos dos Grficos

Abscissa (x)
Fundamentos Quantitativos

Grficos
Leitura de Grficos
35000

Vendas R$1000

400000

Demanda anual (unidades)

30000

390000

25000

380000

370000 20000 360000 15000 350000 10000

340000

5000

330000

Ano
0 1996 1998 2000 2002 2004 2006 2008 320000 1000 1100 1200 1300 1400 1500

Preo (R$)
1600 1700

Fundamentos Quantitativos

Grfico de disperso
Evoluo de Vendas
R$ milhes R$ milhares

4 3 2 1 0 1985 1990 1995 2000 2005

Objetiva visualizar tendncia


Fundamentos Quantitativos

Histograma
Mostra dados de distribuio de Freqncia ou Freqncia Relativa Freqncia: grfico de barras. Freqncia relativa: grfico de barras (totalizando 100%). mais til. ideal para dados Quantitativos em Classes.
Fundamentos Quantitativos

Histograma - Exemplo
25 Freqncia (%)

Unidades vendidas por dia


149 h < 153 153 h < 157

20

15

10

. . .

177 h < 181 181 h < 185

0 151 155 159 163 167 171 175 179 183 Altura (cm)

Abscissa: ESCALA ORDINAL - indicando direo (ex: classes de altura) Ordenada: ESCALA MTRICA Explicitando a freqncia absoluta ou relativa (%).
Fundamentos Quantitativos

Histograma - Exemplo
25 Freqncia (%)

Unidades vendidas por dia

20

15

10

0 151 155 159 163 167 171 175 179 183 Altura (cm)

O Histograma procura apresentar atravs de classes, o comportamento aproximado de uma varivel aleatria contnua (no caso, a altura).
Fundamentos Quantitativos

Mdulo 2
FUNES MATEMTICAS

Liderana e Gesto de Equipes

Funes Matemticas
OBJETIVOS DO MDULO
Apresentar as funes lineares como elementos fundamentais no modelamento de situaes tpicas de negcios.

Liderana e Gesto de Equipes

Funes Matemticas Exemplo


f (x) = 2 * + 4

1 2 3 4

6 8 10 12

Fundamentos Quantitativos

Introduo Anlise Quantitativa


Quantidade (1000 unidades) Custos Totais (R$)

371 390 330 421 351 311 319 407 398 342 363 383

371.641,00 381.759,00 348.280,00 392.891,00 356.412,00 330.545,00 330.652,00 395.274,00 382.775,00 358.363,00 369.913,00 371.972,00

Funes Matemticas
y = f(x) CT = f(Q)
Custo Total: Varivel dependente ou explicada Volume: Varivel independente ou explicativa
420.000,00 Custo Total (R$)

O custo total de produo funo crescente do volume produzido, ou seja, quanto maior a produo, maiores so os gastos em material, mo de obra, etc. Como expressar esta funo?
Fundamentos Quantitativos

Custo x Quantidade

400.000,00

380.000,00

360.000,00

CT = 148833 + 593,82xQ

340.000,00

320.000,00 Quantidade (1000un) 315 340 365 390 415 440

300.000,00 290

Introduo Anlise Quantitativa


Funes Matemticas
FUNES CRESCENTES E DECRESCENTES Diz-se que a funo f crescente (decrescente) no intervalo [a,b] se, decrescente para qualquer x1e x2 de [a,b] com x1<x2, se tenha f(x1) < f(x2) ( f(x1) > f(x2) ). y y

x
Fundamentos Quantitativos

Introduo Anlise Quantitativa


Funes Matemticas
INTERCEPTO Pontos da forma (x,0) ou (0,y) so chamados interceptos da funo. Os pontos da forma (x,0) so os pontos onde a curva encontra com o eixo das abscissas (razes da funo). Analogamente, os pontos (0,y) so os pontos onde a curva encontra com o eixo das ordenadas. y

x
Fundamentos Quantitativos

Introduo Anlise Quantitativa


Funo Linear: Reta
Equao da reta:

y = a x +

a maior que zero

mesmo "a "

a maior que zero

b
Fundamentos Quantitativos

a = 0 a menor que zero

Introduo Anlise Quantitativa


Funo Linear: Reta

Equao de primeiro grau: y = a x + a : coeficiente angular

Mostra a variao de Y para cada unidade de variao de X

a tangente do angulo da reta Quanto maior a mais inclinada a reta Se a positivo ---> reta crescente Se a negativo --> reta decrescente Se a zero.........Y no depende de X --> reta paralela ao eixo X ... na altura do valor b !!

b : coeficiente de interseco ou intercepto


Fundamentos Quantitativos

Funo Linear Exemplo 1


O custo fixo de produo de um dado produto de R$ 1.000,00. J o seu custo varivel de R$ 5,00 a unidade. Pede-se:
1 - Identifique qual a funo que representa o custo total de produo; 2 - Represente graficamente, no plano cartesiano, a funo obtida; 3 - Identifique os interceptos da funo e interprete seus valores; 4 - Interprete o valor do coeficiente angular no contexto do problema; 5 - Identifique os intervalos de crescimento (ou decrescimento) da funo; e 6 - Qual o custo total de produo para 50 unidades.

SOLUO

Fundamentos Quantitativos

Funo Linear Exemplo 1


SOLUO Custo Total = Custo Fixo + Custo Varivel CT(x) = 1.000 + 5 * x , onde x = nmero de unidades produzidas.
Para cada unidade produzida, o custo total aumentar em R$ 5,00, mantido o custo fixo constante.

A funo crescente para qualquer x R.

1000 -200
Fundamentos Quantitativos

CT (50) = 1.000 + 5 * 50 CT (50) = 1.250 x

Funo Linear Exemplo 2


Sabe-se que o custo total de produo de um outro produto de R$ 100.000,00 para 5.000 unidades produzidas. O custo fixo da empresa de R$ 50.000,00. Admitindo que a funo de custo total linear, pede-se:
1 - Identifique qual a funo que representa o custo total de produo; 2 - Represente graficamente, no plano cartesiano, a funo obtida; 3 - Identifique os interceptos da funo e interprete seus valores; 4 - Interprete o valor do coeficiente angular no contexto do problema; 5 - Identifique os intervalos de crescimento (ou decrescimento da funo); e 6 - Qual o custo total de produo para 8.000 unidades.

SOLUO

Fundamentos Quantitativos

Mdulo 3
ESTATSTICA DESCRITIVA Introduo a Inferncia Correlao

Liderana e Gesto de Equipes

OBJETIVOS DO MDULO
Apresentar o ferramental bsico para anlise de dados em que se apia os modelos de inferncia estatstica. Apresentar os conceitos introdutrios relativos inferncia estatstica.

Liderana e Gesto de Equipes

Estatstica Descritiva
Contedo
Terminologia Bsica Medidas de Tendncia Central Medidas de Disperso Conceitos de Inferncia Correlao

Fundamentos Quantitativos

Terminologia Bsica
Tendncia Central de um conjunto de dados a tendncia das medidas destes dados em se acumular em torno de certos valores numricos. Disperso uma medida de espalhamento dos dados

Fundamentos Quantitativos

Medidas de Tendncia Central


Medidas de Tendncia Central para utilizao neste curso

Mdia Aritmtica Moda

Fundamentos Quantitativos

Mdia Aritmtica
a soma das medidas dividida pelo nmero de elementos do conjunto de dados.

x=
Fundamentos Quantitativos

x
i =1

Exemplo
Calcule a mdia dos seguintes grupos de dados: 1, 2, 3, 4, 5 e 2, 3, 3, 3, 4

Fundamentos Quantitativos

Amostra x Populao

x
Fundamentos Quantitativos

Moda
a medida que ocorre com maior freqncia no conjunto de dados. Exemplo: notas de degustadores de vinho: 8, 7, 9, 6, 8, 10, 9, 9, 5, 7. Moda: 9
Fundamentos Quantitativos

Moda
Indica onde os dados tendem a se concentrar. til para dados qualitativos (Ex. notas de jurados). Pode haver mais de uma ou no ter sentido (Ex. pesquisa de lazer).

Fundamentos Quantitativos

Exemplo
Preferncia do produto A (em %) colhida em diversas regies do Brasil por meio de uma pesquisa de mercado. 56, 63, 64, 65, 66, 69, 71, 57, 64, 66, 64, 65, 66, 66, 68 e 72.
N = 16 x = 1042 Mdia = 65,125 Moda =66
Fundamentos Quantitativos

Medidas de Disperso
Medida de Disperso para utilizao neste curso:

Varincia Desvio Padro

Fundamentos Quantitativos

Varincia
Volta ao exemplo anterior Dados: 1, 2, 3, 4, 5 e 2, 3, 3, 3, 4

x=3
-2, -1, 0, 1, 2

( xi x) =
-1, 0, 0, 0, 1

Medidas individuais de disperso

Como condensar estas medidas???


Fundamentos Quantitativos

Varincia

s =
2

(x i x)
i =1

n 1

Fundamentos Quantitativos

Desvio Padro

s= s
Fundamentos Quantitativos

Amostra x Populao

s s

Fundamentos Quantitativos

Outliers
Medida incorreta; Outra populao; ou Peculiaridades (exame cuidadoso).
Observao: O critrio para a definio de outliers varia muito conforme os autores. De maneira geral, considera-se como um Outlier, uma medida acima de 3 desvios-padro da mdia.

Fundamentos Quantitativos

Exerccio
Suponha que um certo programa de TV tenha um ndice de audincia mdio de 10,2 pontos, com desvio-padro de 0,9 pontos, numa distribuio normal (Gauss). Um determinado Instituto de Pesquisa afirma ter medido 15,1 pontos num teste. Comente este resultado luz da interpretao do desvio padro e de outliers. Quais os limites mximos esperados?

Fundamentos Quantitativos

Desvio-padro: interpretao
Distribuio Normal Aproximadamente 68% das medidas caem dentro de mdia 1 s. Aproximadamente 95% das medidas caem dentro de mdia 2 s. Aproximadamente 99,7% das medidas caem dentro de mdia 3 s.

Fundamentos Quantitativos

Desvio-padro: interpretao
Distribuio Normal
34% 34%

13,5% 0,15% 2,35%

13,5% 2,35% 0,15%

x 3s
z = -3

x 2s z = -2

x s
z = -1

x
z=0

x +s z=1

x + 2s z=2

x + 3s z=3

Fundamentos Quantitativos

Medida relativa de amostra

( x x) z= s
Distncia em desvios-padro da mdia
Transforma qualquer distribuio normal em uma distribuio normal padronizada: = 0 e = 1 N(0,1)
Fundamentos Quantitativos

Inferncia - Conceitos Bsicos


Populao: Conjunto de unidades na qual o estudo se interessa. Amostra Subconjunto da populao. Amostra Representativa Subconjunto da populao cujas caractersticas ocorrem na mesma proporo da populao.

Fundamentos Quantitativos

Inferncia - Conceitos Bsicos


1
Mdia: Medida de tendncia central Desvio Padro: Medida de disperso Como estimar a mdia de uma populao?
x1 : mdia.amostra1 s1 : desvio padro.1 x 2 : mdia .amostra 2 s 2 : desvio padro.2 x 3 : mdia .amostra 3 s 3 : desvio padro.3

: mdia : desvio-padro
Fundamentos Quantitativos

Inferncia - Conceitos Bsicos

xB

x+B

INTERVALO DE CONFIANA

B: margem de erro para um certo nvel de confiana

Fundamentos Quantitativos

Inferncia - Conceitos Bsicos

pB

p+B

INTERVALO DE CONFIANA B: margem de erro para um certo nvel de confiana


Exemplo: O candidato mais votado obteve, atravs do resultado de uma amostragem de boca de urna, 52% de inteno de voto. Sabendo que a pesquisa apresentou uma margem de erro de 3% , com 95% de confiana, o que pode ser dito com relao ao resultado final?
Fundamentos Quantitativos

Inferncia - Conceitos Bsicos


Inferncia sobre o coeficiente angular da reta
Tendncia observada: Crescimento
40 35 30

Vendas (um)

Visto tratar-se de uma amostra, ser necessrio inferir se o coeficiente angular positivo. Haver uma margem de erro. E se o resultado obtido for: a = 4,5 5,1 com 95% de confiana?

25 20 15 10 5 0 0 1 2 3 4

Desconto (%)
5 6

Neste caso no poderamos afirmar com 95% de confiana que o preo influi nas vendas deste produto. E se fosse: a = 4,5 0,8 ? Fundamentos Quantitativos

Correlao entre Variveis


Coeficiente de Correlao (r) calculado a partir de uma amostra
Nmero entre [1 , +1] Mede o grau de relao linear entre duas variveis
= 1 : relao linear positiva entre duas variveis = -1 : relao linear negativa entre duas variveis > 0 : indica o grau de relao linear positiva entre duas variveis < 0: indica grau de relao linear negativa entre duas variveis
n = 0: ausncia de relao linear entre as duas variveis

r=

(x
i =1

x )( yi y )
n

( xi x ) 2 ( yi y ) 2
i =1 i =1

Softwares estatsticos efetuam o clculo

Fundamentos Quantitativos

Correlao entre Variveis


Coeficiente de Correlao (r)

Correlao Positiva: r > 0


Fundamentos Quantitativos

Correlao entre Variveis


Coeficiente de Correlao (r)

Correlao Negativa: r < 0


Fundamentos Quantitativos

Correlao entre Variveis


Coeficiente de Correlao (r)

Correlao r 0
Fundamentos Quantitativos

Matriz de Correlao
Correlao entre variveis candidatas a explicar Valor de Imveis
CRIM CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTR BL LST

ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTR BL LST

1 -0,20 0,41 -0,06 0,42 -0,22 0,35 -0,38 0,63 0,58 0,29 -0,39 0,46

1 -0,53 -0,04 -0,52 0,31 -0,57 0,66 -0,31 -0,31 -0,39 0,18 -0,41

1 0,06 0,76 -0,39 0,64 -0,71 0,60 0,72 0,38 -0,36 0,60

1 0,09 1 0,09 -0,30 1 0,09 0,73 -0,24 1 -0,10 -0,77 0,21 -0,75 1 -0,01 0,61 -0,21 0,46 -0,49 1 -0,04 0,67 -0,29 0,51 -0,53 0,91 1 -0,12 0,19 -0,36 0,26 -0,23 0,46 0,46 1 0,05 -0,38 0,13 -0,27 0,29 -0,44 -0,44 -0,18 -0,05 0,59 -0,61 0,60 -0,50 0,49 0,54 0,37

1 -0,37

r = 0,91 Variveis RAD e TAX so muito correlacionadas Em princpio, poderamos abandonar uma delas. Porque? r = 0,13 Variveis RM e BL so pouco correlacionadas Matriz de Correlao Apia decises sobre reduo do nmero de variveis em um caso sujeito influncia de muitas variveis Exemplo: Em princpio, a varivel CHAS no deve ser excluda. Porque?
Fundamentos Quantitativos

Determinar a matriz de correlao entre as trs variveis Notar que Vendas a varivel dependente O que podemos falar quanto a correlao entre elas?
Despesas com Propaganda Desconto sobre Preos de Vendas

Matriz de Correlao
Vendas (1000R$) VV 1528,50 1560,00 1419,00 1335,00 1462,50 1281,00 1629,00 1296,00 1440,00 1405,50 1747,50 1375,50 1320,00 1540,00 1712,00 1555,00 1576,00

(1000R$) DP 8,33 83,33 25,00 41,67 16,67 58,33 91,67 50,00 75,00 33,33 100,00 66,67 20,00 55,00 80,00 95,00 35,00

(%) DPV 12,0 5,5 8,0 4,0 9,5 0,5 8,5 1,5 4,5 6,5 10,5 2,0 5,00 9,00 12,00 5,00 11,00

Fundamentos Quantitativos

Matriz de Correlao

Notar que trata-se de um processo de inferncia, sobre as variveis, a partir da amostra selecionada
Fundamentos Quantitativos

Matriz de Correlao
Determinar a matriz de correlao entre as trs variveis Notar que Vendas a varivel dependente O que podemos falar quanto a correlao entre elas?
Coeficientes de Correlao DP DPV DP 1 DPV -0,1198 1 VV 0,5184 0,7791 VV

Em se tratando de uma amostra, podemos confiar plenamente no resultado?

Fundamentos Quantitativos

Parte 2
Tcnicas Multivariadas para Anlise Quantitativa de Mercado

Liderana e Gesto de Equipes

Mdulo 4
Modelos de Previso Regresso Linear

Liderana e Gesto de Equipes

OBJETIVO DO MDULO 4
Apresentar, utilizando planilhas eletrnicas, a regresso linear como uma ferramenta para previso de uma dada varivel, conhecendo-se o comportamento de outra(s).

Liderana e Gesto de Equipes

Modelos de Previso - Regresso Linear Situao


Como estimar o faturamento de um negcio com base em seu investimento em publicidade?

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


Devido aleatoriedades de vrias fontes, podese assumir que o valor da grandeza de interesse ser composta de uma parte determinstica e de um erro. No exemplo do faturamento, teremos: Receita = a x (Investimento) + b + erro

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


30 y

Varivel Procurada (Dependente ) Y

(x3,y3)
20

(x1,y1) Erro 1 Erro 2

Erro 3

Erro 4 (x4,y4)

10

(x2,y2)

Variavel Conhecida (Independente ) X 0 2 4 6 8 10 12 14

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


Modelos Probabilsticos
Forma geral para regresso linear simples Intercepto

Erro

Yi = aX i + b + i
Varivel Dependente (Resposta) Inclinao Varivel Independente (Explicativa)

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


Interpretao de cada parcela Intercepto: valor de y para x=0 Inclinao: acrscimo em y para cada unidade de x Curva ajustada (mnimos quadrados) Validade apenas no range dos dados

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples

Regresso Linear no Excel - Mtodo 1


Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples

R2 explicado adiante

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples

= a*X + b
Vendas = 2,9 * Desconto + 14,6

= Vendas (R$) = Varivel explicada


X b a = Desconto (%) = Varivel explicativa = Parmetro da regresso (constante do modelo) = 14,6 = Parmetro da regresso (constante do modelo) = 2,9 = Variao de vendas para variao de 1% no desconto
Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples

i = A + B*X i
29,1 43,6 72,7 37,8 26,2 32,0 49,4 58,1

ei
-2.1 2.4 0.3 2.2 3.8 -4.0 -3.4 0.9

Soma = 0
Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples Coeficiente de Determinao (R2)
Indica o poder de explicao do modelo em valores percentuais (%). Em outras palavras, o modelo de regresso capturou 100 x (R2) % da variao da varivel de interesse.

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


DESEMPENHO DO MODELO Coeficiente de Determinao : R2 0 R2 1
90 80 70 60 50 40 30 20 10 0 20 40 X 60 80 100 Y
Y 80 70 60 50 40 30

R = 0,89

R = 0,04

20 10 0 20 40 X 60 80 100

80 70 60 50 Y 40 30 20 10 0 20 40 60 80 100 X Fundamentos Quantitativos

100 90 80 70 60 50 40 30 20 10 0 0 20 40 X 60 80 100 Y

R = 0,43

R2 = 1

Modelos de Previso - Regresso Linear Regresso Linear Simples

Regresso Linear no Excel - Mtodo 2


Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,98403 R-Quadrado 0,96832 R-quadrado ajustado 0,96304 Erro padro 3,10833 Observaes 8 ANOVA gl Regresso Resduo Total SQ MQ F F de significao 1 1771,905 1771,905 183,3946 1,00561E-05 6 57,97024 9,661706 7 1829,875 valor-P 0,000925 1,01E-05 95% inferiores 8,6801 2,3799 95% superiores 20,4747 3,4296

Interseo Desconto (%)

Coeficientes Erro padro Stat t 14,5774 2,4101 6,0485 2,9048 0,2145 13,5423

Regresso Linear no Excel - Mtodo 2


Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples Anlise de Validade do Modelo
O modelo linear vale? H chance da inclinao ser zero? Duas formas de se verificar: Valor de t (ou Valor P associado); ou Intervalo de confiana p/ inclinao

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples Hipteses do Modelo


A distribuio do erro possui mdia zero A varincia do erro constante A distribuio do erro normal Os valores do erro so independentes dos y observados

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


Exerccio
Um supermercado, necessitando dimensionar os caixas, entre outros itens precisou caracterizar o perfil de compras de seus clientes, em funo da distncia do domiclio. Entende que este gasto depende da distncia do domiclio ao ponto de venda. Eis o resultado de uma pesquisa:
Distncia do domiclio ao Consumo Ponto de Vendas (km) (R$) 2,3 23,1 3,1 27,5 3,8 26,1 2,1 23,1 3,4 26,2 4,6 31,3 2,8 26,1 2,6 21,9 4,8 36,4 1,8 17,8 4,3 31,3 5,5 36 0,7 14,1 3 22,3 Fundamentos Quantitativos 1,1 17,3

Buscamos saber se existe uma relao

y = ax + b +
onde Y = consumo/visita (R$) (varivel dependente) X= distncia do cliente ao pto de venda (varivel independente)

= Erro aleatrio

Modelos de Previso - Regresso Linear Regresso Linear Simples


RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,9604 R-Quadrado 0,9224 R-quadrado ajustado 0,9164 Erro padro 1,8808 Observaes 15 ANOVA gl Regresso Resduo Total 1 13 14 SQ MQ F F de significao 546,506717 546,5067 154,4925 1,36906E-08 45,9866163 3,537432 592,493333 valor-P 95% inferiores 3,9E-07 8,7871 1,37E-08 3,7636 95% superiores Inferior 95,0% 14,0675 8,7871 5,3471 3,7636

C = 4,56 D + 11,43

Coeficientes Erro padro Stat t Interseo 11,4273 1,2221 9,350474 Distncia do domiclio ao Ponto de Vendas (km) 4,5554 0,3665 12,4295

Exerccio- Resoluo Excel - Resultado


Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


40,0 35,0 30,0 25,0 20,0 15,0 10,0 0,0 1,0 2,0

Distncia do Domiclio ao Ponto de Vendas (KM)

Consumo Mdio Mensal (R$) (R$)

Y = 4,56 X + 11,43

Consumo (R$) Consumo Realmdio mensal (R$) Consumo Previsto (R$) mdio mensal (Previsto) Consumo (R$)
3,0 4,0 5,0 6,0 Distncia do Domiclio ao Ponto de Vendas (KM)

Exerccio - Resoluo Excel - Resultado Grfico


Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Simples


40,0 35,0 Consumo Mdio Mensal (R$) 30,0 25,0 20,0 15,0 10,0 0,0

Pelo D is t nc ia d o Do m ic lio a o Po nto de Ven da s (K M )


Y = 4,56 X + 11,43

C ons um o m dio m ens al (R $) (Previs to) C onsum o m dio m ensal (R $)


1,0 2,0 3,0 4,0 5,0 6,0 Dist n cia d o Do m iclio a o P o nto de V e nd a s (KM )

modelo prev-se que, para cada km adicional de distncia do morador, o consumo semanal aumenta de a = 4,56 R$ Pelo modelo tambm: correto pensar que se x=zero , o consumo previsto de 11,43 R$? Quem mora dentro da loja consome 11,43R$ ? Resposta: No Esta interpretao s vlida no intervalo estudado (ou seja entre 0,7 Km e 5,5 Km). Fora disto no d para aplicar o modelo!

C = 4,56 D + 11,43 Exerccio- Interpretao do Resultado


Fundamentos Quantitativos

Modelos de Previso Regresso Linear Mltipla

Liderana e Gesto de Equipes

Modelos de Previso - Regresso Linear Regresso Linear Mltipla

Situao
Como estimar o faturamento de um negcio com base em seu investimento em publicidade e no preo praticado?

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear


Y

Regresso Linear Mltipla


X2

r = +1

r = -1

X1 X2

X1 Y

r >0

r <0

X1

X1

Coeficientes de Correlao (r) Reviso


Mede o grau de relao linear entre duas variveis quaisquer
Fundamentos Quantitativos

r=0

X1

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


uma extenso de modelos de regresso linear simples, uma vez que utiliza mais de uma varivel explicativa.

Yi = 1X + a 2X i2 + b ... i a ++ e i1
onde: Yi a varivel explicada (Ex: vendas mensais) mensais X1i uma varivel explicativa (Ex: preo) preo X2i outra varivel explicativa (Ex: gastos com propaganda) propaganda a1, a2 e b: constantes do modelo ei : erro
Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


Exemplo
Os dados do laboratrio sobre a influncia da temperatura mdia, ou seja, das estaes do ano, relativo um remdio desenvolvido para apoio no combate gripe.
Vendas Trimestre (10.000 unid) 25 13 8 20 25 12 10 15 18 Despesas Temperatura c/ Propaganda Mdia (R$10.000) 9 5 4 9 12 6 7 6 8 (o C) 13 22 24 18 14 20 22 14 17

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,94378 R-Quadrado 0,89073 R-quadrado ajustado 0,85430 Erro padro 2,36669 Observaes 9 ANOVA Regresso Resduo Total gl 2 6 8 SQ 273,948 33,607 307,556 MQ 136,9741 5,6012 F F de significao 24,4543 0,001305
Correlao (10.000 unid) (R$10.000) (10.000 unid) 1 (R$10.000) 0,883 1 (oC) -0,859 -0,706 (oC)

Interseo (R$10.000) (oC)

Coeficientes Erro padro 19,13701 8,27377 1,39809 0,48228 -0,72260 0,29356

Stat t 2,3130 2,8989 -2,4615

valor-P 0,06002 0,02737 0,04902

95% inferiores 95% superiores -1,10819 39,38220 0,21799 2,57819 -1,44091 -0,00430

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


Armadilha da Regresso Mltipla

Multicolinearidade
Problema que ocorre quando as variveis explicativas no so independentes. Conseqncia da Multicolinearidade: As estimativas dos parmetros perdem a confiabilidade. Indicaes de Multicolinearidade: - Resultados obtidos atentam contra o bom senso - Valor-P maior que 0,10 - Alta correlao entre as variveis do modelo Ao necessria: Eliminar alguma varivel explicativa e efetuar nova regresso linear.
Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


CASO COM MULTICOLINEARIDADE

Vendas = 2.540,42 + 6,8 * Propaganda 48,17 * Desconto


X1 X2 Y Despesas com Desconto sobre Vendas Propaganda Preos de Vendas (1000R$) (%) (1000R$) 16,66 0,5 2.562,00 33,34 1,5 2.592,00 40,00 2,0 2.751,00 50,00 4,0 2.670,00 66,66 4,5 2.880,00 70,00 5,0 2.640,00 83,34 5,0 3.110,00 100,00 5,5 3.120,00 110,00 6,5 2.811,00 116,66 8,0 2.838,00 133,34 8,5 3.258,00 150,00 9,0 3.080,00 160,00 9,5 2.925,00 166,66 10,5 3.495,00 183,34 11,0 3.152,00 190,00 12,0 3.057,00 Fundamentos Quantitativos 200,00 12,0 3.424,00

(Valor-P=0,24)

(Valor-P=0,60) Alto Valor P

Resultado contra o bom senso


(aumento no desconto reduz as vendas)

Motivo: Alta correlao entre X1 e X2


Propaganda Desconto Vendas Propaganda 1 Desconto 0,99 1 Vendas 0,80 0,78 1

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


X1 X2 Correlao X1 1 0,99 X2 1

CASO COM MULTICOLINEARIDADE

RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,80 R-Quadrado 0,65 R-quadrado ajustado 0,59 Erro padro 179,25 Observaes 17 ANOVA gl Regresso Resduo Total SQ MQ 2 817866,12 408933,06 14 449831,76 32130,84 16 1267697,9 Stat t 26,86 1,23 -0,54 F F de significao 12,727 0,0007 Obs: R-Quadrado = 0,65 indicao de pouca aderncia dos dados, sem qualquer relao com a caracterstica apontada de multicolinearidade. A evidncia de multicolinearidade est caracterizada pelo alto valor do Coeficiente de Correlao, pelo coeficiente negativo da varivel X2 que est em desacordo com o bom senso ou com os altos resultados do valor-P.

Interseo Varivel X 1 Varivel X 2

Coeficientes Erro padro 2540,42 94,57 6,80 5,54 -48,17 88,96

valor-P 0,00 0,24 0,60

95% inferiores 95% superiores 2337,60 2743,25 -5,09 18,69 -238,98 142,63

Vendas = 2540,42 + 6,80*Propaganda - 48,17*Desconto

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


CASO COM MULTICOLINEARIDADE Vendas = 2.540,42 + 6,8 * Propaganda 48,17 * Desconto
X1 X2 Y Despesas com Desconto sobre Vendas Propaganda Preos de Vendas (1000R$) (%) (1000R$) 16,66 0,5 2.562,00 33,34 1,5 2.592,00 40,00 2,0 2.751,00 50,00 4,0 2.670,00 66,66 4,5 2.880,00 70,00 5,0 2.640,00 83,34 5,0 3.110,00 100,00 5,5 3.120,00 110,00 6,5 2.811,00 116,66 8,0 2.838,00 133,34 8,5 3.258,00 150,00 9,0 3.080,00 160,00 9,5 2.925,00 166,66 10,5 3.495,00 183,34 11,0 3.152,00 190,00 12,0 3.057,00 200,00 12,0 3.424,00

(Valor-P=0,24)

(Valor-P=0,60)

Existem casos que a correlao um fato ligado populao. Exemplo: Aplicao de propaganda e desconto em produtos sazonais. Neste caso no h maiores preocupaes em eliminar alguma varivel explicativa, pois a correlao uma caracterstica constante na amostragem. Existem casos que a correlao uma circunstncia amostral. Exemplo: Retirada de amostra no momento que uma determinada poltica de desconto + investimento em propaganda est em curso. Neste caso os resultados obtidos s sero representativos para consideraes sobre vendas, enquanto a atual poltica estiver em vigor.

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


CASO COM MULTICOLINEARIDADE
Dada a existncia de multicolinearidade, ocorrida pela aplicao inadequada de poltica de vendas, no haver possibilidades de conhecermos os efeitos de cada varivel na regresso.

Propaganda Desconto Vendas Propaganda 1 Desconto 0,99 1 Vendas 0,80 0,78 1

Vendas = 2.541,52 + 3,83*Propaganda 3,83*


Estas frmula, obtida por regresso linear simples, vale enquanto a poltica de vendas for mantida Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


Exemplo para casa Um Campus Universitrio no interior de So Paulo gera grande movimentao imobiliria para acomodao dos estudantes. A Imobiliria C&I, com 5 imveis de 2 quartos disponveis no momento, realizou uma pesquisa de mercado para definir o valor dos aluguis para imveis de 2 quartos, em funo da distncia do Campus e das caractersticas contemporneas do imvel. Estabelea, a partir de uma regresso linear mltipla, o valor do mercado de aluguis, para os 5 imveis desta imobiliria.
Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Regresso Linear Mltipla


Pesquisa de Mercado
D i st n c i a (k m ) 0,0 3,0 8,0 4,0 0,5 10,0 1,5 6,0 1,0 2,0 9,0 5,0 2,5 8,0 5,5 Id a d e (a n o s ) 1 30 23 5 6 38 35 40 25 15 2 9 7 3 20 A lu g u e l (R $ ) 900 600 400 700 850 300 650 400 700 750 500 600 750 500 550

Exemplo para casa


Imveis Disponveis
D ist n c ia (k m ) 1 ,0 2 ,5 3 ,0 4 ,0 4 ,5 Id a d e (a n o s ) 0 9 5 8 1 A lu g u e l (R $ ) ? ? ? ? ?

Obs. Haver necessidade de extrapolar para definir Aluguel de um dos imveis. Defenda esta extrapolao.

Fundamentos Quantitativos

Mdulo 5
Modelos de Previso Regresso Linear Consideraes Finais

Liderana e Gesto de Equipes

OBJETIVO DO MDULO 5
Verificar quais so os cuidados necessrios para validar uma anlise de regresso e Apresentar como realizar uma previso por meio de regresso linear utilizando-se variveis qualitativas. Trabalhar casos de regresso linear no laboratrio

Liderana e Gesto de Equipes

Modelos de Previso - Regresso Linear


Anlise de Resduos
Resduo a diferena entre os valores reais (da amostra) e os valores estimados pelo modelo. Deve ser feito um grfico do resduo em relao a cada varivel independente para ser analisado. Resultados mais imediatos: Necessidade de termos de ordem superior Varivel significativa no presente Identificao de outliers (acima de 3s)
Fundamentos Quantitativos

Modelos de Previso - Regresso Linear


Anlise de Resduos
40

Exemplo:
X1
Despesas com Propaganda

Erro (1000 R$)

30

X2
Desconto sobre Preos de Vendas

(1000R$) 8,33 83,33 25,00 41,67 16,67 58,33 91,67 50,00 75,00 33,33 100,00 66,67 20,00 55,00 80,00 95,00 35,00

(%) 12,0 5,5 8,0 4,0 9,5 0,5 8,5 1,5 4,5 6,5 10,5 2,0 5,00 9,00 12,00 5,00 11,00

Y Aderncia Vendas Vendas Estimadas (1000R$) (1000R$) 1528,50 1514,39 1560,00 1524,09 1419,00 1432,62 1335,00 1350,86 1462,50 1457,08 1281,00 1285,51 1629,00 1647,41 1296,00 1293,55 1440,00 1466,46 1405,50 1408,16 1747,50 1737,88 1375,50 1359,56 1320,00 1319,23 1540,00 1554,72 1712,00 1727,63 1555,00 1542,39 1576,00 1560,89

Erro (1000R$) 14,11 35,91 -13,62 -15,86 5,42 -4,51 -18,41 2,45 -26,46 -2,66 9,62 15,94 0,77 -14,72 -15,63 12,61 15,11

20 10 0 0 -10 -20 -30 20 40 60 80

Propaganda (1000 R$)


100 120

40 30 20 10

Erro (1000R$)

Desconto (%)

Sem estrutura identificada: OK!!


Fundamentos Quantitativos

0 0 -10 -20 -30 2 4 6 8 10 12 14

Modelos de Previso - Regresso Linear


Procedimentos para validar um modelo de Regresso Linear Mltipla
1 Verificao de Multicolinearidade Indicaes possveis: i. Frmula apresenta sinais que atentam contra o bom senso ii. Valor-P do coeficiente de uma das variveis explicativas > 0,1 iii. Alto Coeficiente de Correlao (r) entre as variveis explicativas (digamos, maior que 0,7 em valor absoluto). Se for constatada multicolinearidade, deve ser efetuar nova regresso com a excluso da varivel explicativa selecionada ( com base na correlao com a varivel explicada). 2 Significncia do coeficiente angular de cada varivel explicativa Intervalo com 95% de confiana dos coeficientes, ou valor P < 0,05 3 Aderncia do Modelo Coeficiente de Determinao R2 4 Anlise de Resduos Objetiva verificar se os erros esto aleatoriamente distribudos,

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear Situao


Como trabalhar com variveis qualitativas numa regresso?

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear


Variveis Qualitativas
Variveis qualitativas no possuem ordem crescente ou decrescente em seus valores, apenas categorias ou nveis.

Exemplos de variveis qualitativas: Sexo (masculino ou feminino) Fabricante (A, B ou C) Grau hierrquico (diretor, gerente, chefe) Modelo (carros utilitrios ou no) Estado civil Estado profissional (empregado ou no) Caracterstica particular do imvel (vista p/ oceano)

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear


Modelos com Varivel Dummy
Varivel qualitativa com 2 nveis (varivel dummy): yes or no on or off male or female, Cdigo 0 or 1 Interceptos so diferentes Assume-se mesma inclinao

Fundamentos Quantitativos

Modelos de Previso - Regresso Linear


Modelos com Varivel Dummy
Dado: Yi = a1 X 1i + a 2 X 2 i + b Y = Valor da casa a ser avaliada X1 = rea til em metragem X2 = Vista para o mar = Vista para o mar (X2 = 1)

0 se inexiste 1 se existe

Yi = a1 X 1i + a 2 (1) + b = a1 X 1i + (a 2 + b)
Ausncia da caracterstica (X2 = 0)
Fundamentos Quantitativos

Yi = a1 X 1i + a 2 (0) + b = a1 X 1i + b

mesma inclinao a1

Modelos de Previso - Regresso Linear


Modelos com Varivel Dummy
Exemplo
Vista para o mar = 1 Ausncia de vista = 0
rea til (m2) 40 41 45 46 49 50 55 55 60 60 65 66 69 70 Vista (V) 0 1 1 0 0 1 1 0 1 0 1 0 0 1 Valor (R$) 30000,00 40000,00 46500,00 35200,00 41000,00 51000,00 60000,00 46000,00 64000,00 52000,00 69500,00 58100,00 62800,00 74200,00
RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,997 R-Quadrado 0,994 R-quadrado ajustado 0,992 Erro padro 1153,923 Observaes 14 ANOVA gl Regresso Resduo Total SQ MQ 2 2244405222,5 1122202611,24 11 14646920,4 1331538,22 13 2259052142,9 Erro padro 1778,53 31,35 616,81 Stat t -9,39 36,63 18,29 F F de significao 842,79 0,00

Interseo (m2) (V)

Coeficientes -16706,8 1148,2 11278,8

valor-P 0,00 0,00 0,00

95% inferiores 95% superiores -20621,33 -12792,30 1079,18 1217,18 9921,23 12636,43

Valor = -16706,80 + 11278,80V + 1148,20M Valor = -16706,80 + 1148,20M sem viso Valor = -5428,00 + 1148,20M com viso

Fundamentos Quantitativos

Mdulo 6
Cluster Analysis

Liderana e Gesto de Equipes

OBJETIVO DO MDULO 6 Apresentar a anlise de conglomerados como uma ferramenta para o agrupamento de indivduos (ex: clientes, fora de vendas), produtos, marcas, canais de distribuio, entre outros, em grupos desconhecidos, com base em atributos caractersticos destes indivduos.

Liderana e Gesto de Equipes

Cluster Analysis
Usos:
- Identificar segmentos similares

Princpio:
DISTNCIA A medida de similaridade
A distncia mais utilizada em anlise de conglomerados a Euclideana.

Fundamentos Quantitativos

Cluster Analysis
DISTNCIA A medida de similaridade
A distncia mais utilizada em anlise de conglomerados a Euclideana.

16 14 Educao (anos) 12 10 8 6 4 2 0 0 2

Renda: R$8.000,00 Educao: 15 anos

A distncia Euclideana:

d ij =

( x ik x jk ) 2
k =1

= (8 3) 2 + (15 6) 2
Renda: R$3.000,00 Educao: 6 anos

= 25 + 81 = 10,296
4 6 8 10 Renda (R$ mil)

Fundamentos Quantitativos

Cluster Analysis
DISTNCIA A distncia Euclideana
IMPORTANTE: Cuidado com a ESCALA E se a escala do atributo Educao fosse em meses?
25 20 Educao (anos) 15 10 5 0 0 10 20 Renda (R$ mil) 30 40

d 2 S 5 S 6 = (30 25) 2 + (19 20) 2 = 25 + 1 = 26


Se a escala do atributo Educao fosse em meses, o efeito do atributo Renda (R$ mil) ficaria aparentemente reduzido. Uma possibilidade para evitar este inconveniente a padronizao dos atributos.

Observ S1 S2 S3 S4 S5 S6

Renda 5 6 15 16 25 30

Educao 5 6 14 15 20 19

25 Outra alternativa seria assumir que a utilizao das


escalas (anos) e (R$ mil) so compatveis, por 20 experincia prtica.

Fundamentos Quantitativos

Cluster Analysis
Situao:
Com o objetivo de criar comunicaes (ofertas de produtos) mais eficientes, um banco decidiu criar agrupamentos de clientes baseando-se em sua renda anual e no grau de escolaridade (total de anos de estudo).

Metodologia
Os agrupamentos so formados por similaridade entre as observaes, sendo a distncia euclideana o mtodo mais utilizado no clculo de similaridade. Matriz de similaridades
Observ S1 S2 S3 S4 S5 S6 Renda 5 6 15 16 25 30 Educao 5 6 14 15 20 19
S1 S2 2 0 145 181 557 745

25 20

S1 S2 S3 S4 S5 S6

0 2 181 221 625 821

S3 181 145 0 2 136 250

S4 221 181 2 0 106 212

S5 625 557 136 106 0 26

S6 821 745 250 212 26 0

Fundamentos Quantitativos

Cluster Analysis
Metodologia
A anlise de conglomerados (cluster analysis) uma tcnica utilizada na combinao de observaes em grupos ou agrupamentos de forma que: Cada grupo ou agrupamento seja homogneo em funo de determinadas caractersticas, ou seja, que as observaes em cada grupo sejam similares. Cada grupo seja diferente dos outros grupos formados em funo das mesmas caractersticas, ou seja, que as observaes em um grupo sejam diferentes das observaes dos outros grupos.

Fundamentos Quantitativos

Cluster Analysis
Metodologia: CLUSTER HIERRQUICO
A partir da matriz de similaridade pode-se realizar diferentes formas de agrupamento em funo de como a distncia entre os agrupamentos for calculada. Os mtodos mais comumente empregados so: Mtodo do centride Mtodo da ligao simples Mtodo da ligao completa Mtodo da ligao mdia Mtodo de Ward

Fundamentos Quantitativos

Cluster Analysis
Metodologia: CLUSTER HIERRQUICO Mtodo da ligao simples: por esse mtodo busca-se as
menores distncias para o clculo da distncia entre agrupamentos.

Mtodo da ligao completa: por esse mtodo busca-se as


maiores distncias para o clculo da distncia entre agrupamentos.

Mtodo da ligao mdia: por esse mtodo busca-se as mdias


das distncias para o clculo da distncia entre agrupamentos.

Fundamentos Quantitativos

Cluster Analysis
Metodologia: CLUSTER HIERRQUICO
Mtodo de Ward: Por esse mtodo de agrupamento de dados, formam-se grupos de maneira a atingir sempre o menor erro interno, medido entre os vetores mdios de cada grupo e o vetor mdio do novo grupo (ponderando pelo nmero de componentes de cada grupo). Assim, os grupos de dados so formados em etapas, buscando-se minimizar a soma dos quadrados mdios das componentes destes vetores. Um exemplo elucidativo:
Educao (anos) 25 20 15 10 5 0 0 10 20 Renda (R$ mil) 30 40

Observ S1 S2 S3 S4 S5 S6

Renda 5 6 15 16 25 30

Educao 5 6 14 15 20 19

Sugere 3 grupos?

25 20 Matriz de similaridades
S6 821 745 250 212 26 0

S1 S1 S2 S3 S4 S5 S6

S2

0 2 2 0 181 145 221 181 625 557 Fundamentos 821 745

S3 S4 S5 181 221 625 145 181 557 0 2 136 2 0 106 136 106 0 Quantitativos 26 250 212

Cluster Analysis
Metodologia: CLUSTER HIERRQUICO
Mtodo de Ward: Um exemplo elucidativo:
S 1 2 0 0 T r e e W D ia g r a m m f o r e t h o d d is t a n c e s 6 C a s e s a r d ` s q u a r e d E u c lid e a n

Linkage Distance

Amalgamation Schedule (DADOS_MULTIVARIADA) Ward`s method Squared Euclidean distances linkage Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. distance 1 2 3 4 5 6 2,0 0 0 0 0 0 S1 S2 2,0 0 0 0 0 0 S3 S4 26,00 0 0 0 S5 S6 338,0 0 0 0 S3 S4 S5 S6 10 35,333 S1 S2 S3 S4 S5 S6

1 0 0 0

8 0 0

6 0 0

Distncia para grupo nico = 1035 Distncia 3 grupos = 26

Sugere 3 grupos?
4 0 0

2 0 0

0 S 6 S 5 S 4 S 3 S 2 S 1

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Metodologia: CLUSTER HIERRQUICO


Mtodo de Ward: Situao: Com o objetivo de criar comunicaes (ofertas de produtos) mais eficientes, um banco decidiu criar agrupamentos de clientes baseando-se em sua renda anual e no grau de escolaridade (total de anos de estudo). Amostra com 100 clientes.

H diversas abordagens para determinar o nmero de clusters. Alternativa: Mtodo de Ward (minimizar a variabilidade do erro).
OBSERV RENDA EDUC
Salve os dados em planilha do software adotado

Clique duas vezes e abra a planilha de dados do Excel

Fundamentos Quantitativos

Cluster Analysis

Metodologia: CLUSTER HIERRQUICO

Sugesto: 3 Clusters?

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Metodologia: CLUSTER HIERRQUICO


VANTAGEM: FACILIDADE NA INTERPRETAO CLUSTER HIERRQUICO DESVANTAGENS: INSTABILIDADE E CONFIABILIDADE

O Cluster Hierrquico orienta o conhecimento relativo ao nmero mais adequado de segmentos que um determinado mercado possui. Porm a metodologia rgida e no momento que um determinado indivduo indicado para um particular grupo, se torna impossvel um remanejamento mais adequado.

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Metodologia: CLUSTER NO HIERRQUICO Mtodo K-mdias:


VANTAGENS: ESTABILIDADE E CLUSTER NO HIERRQUICO CONFIABILIDADE DESVANTAGENS: INTERPRETAO CONHECIMENTO PRVIO

O Cluster No Hierrquico possibilita que um determinado indivduo seja remanejado de um particular grupo para outro que se mostre mais adequado. No entanto exige a informao prvia sobre o nmero de segmentos que constituem o mercado em anlise.

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Metodologia: CLUSTER NO HIERRQUICO Mtodo K-mdias:


Esse um mtodo interativo de formao de clusters. Passos: 1. Especificar o nmero de clusters (k) 2. Atribuir k valores iniciais (sementes) 3. Atribuir as observaes ao cluster mais prximo (distncia euclidiana) 4. Calcular os valores mdios de cada cluster (para todas variveis). O valor mdio ser o valor da semente (passo 2). 5. Refazer a atribuio das observaes. 6. Calcular os valores mdios de cada cluster (para todas variveis). O valor mdio ser o valor da semente (passo 2). Esse processo interativo repetido at que fique estvel (o valor das mdias calculadas no varie).

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Metodologia: CLUSTER NO HIERRQUICO Mtodo K-mdias:


Nmero de Conglomerados H diversas abordagens para determinar o nmero de conglomerados (clusters). Alternativas: 1. Arbitrar o nmero de conglomerados (valor conhecido, razes prticas). 2. Escolher o nmero que resulte nos conglomerados de mais fcil interpretao. 3. Distncia entre os conglomerados. 4. Quantidade de indivduos nos conglomerados. 1. Mtodo de Ward (minimizar a variabilidade do erro).
Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Metodologia: CLUSTER NO HIERRQUICO


Situao: Com o objetivo de criar comunicaes (ofertas de produtos) mais eficientes, um banco decidiu criar agrupamentos de clientes baseando-se em sua renda anual e no grau de escolaridade (total de anos de estudo). Amostra com 100 clientes. Na utilizao do Mtodo de Ward, ficou definida a possibilidade de segmentar os clientes do banco em 3 grupos.

Atravs do mtodo no hierrquico K- Mdia, sero levantadas as caractersticas dos 3 grupos.

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Mtodo K-mdias:

Opes Adotadas

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Mtodo K-mdias:
Uma vez desenvolvidos os conglomerados, a prxima tarefa fazer sua descrio Uma medida freqentemente utilizada o valor mdio das variveis (atributos) para cada um dos conglomerados

Renda Mdia Baixa Educ

Renda Baixa Mdia Educ

Renda Alta Mdia Educ

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Mtodo K-mdias: P
3 5 3 0

lo t

o f

e a n s

f o r

E a c h

lu s t e r

2 5

2 0

1 5

1 0

0 C C C lu s t e r lu s t e r lu s t e r 1 2 3

- 5 R E N D A V E D a r i a b le s U C

Fundamentos Quantitativos

Cluster Analysis

Mtodo K-mdias:

Fundamentos Quantitativos

Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS

Mtodo K-mdias:
Membros de cada cluster

Fundamentos Quantitativos

Dados_Cluster_Slides 1 2 3 4 5 RENDA EDUC CASE_NO CLUSTER DISTANCE S1 14 4 1 1 2,45 S3 19 7 3 1 1,7 8 S8 15 12 8 1 4,18 S17 12 6 17 1 3,24 S19 18 11 19 1 3,47 S20 13 7 20 1 2,58 S21 14 8 21 1 2,18 S22 13 4 22 1 3,0 1 S24 16 5 24 1 1,0 1 S26 12 7 26 1 3,27 S36 16 7 36 1 0 ,64 S40 24 4 40 1 5,50 S46 17 5 46 1 0 ,97 S56 21 3 56 1 3,91 S58 23 3 58 1 5,11 S62 20 6 62 1 2,43 S64 15 12 64 1 4,18 S65 18 4 65 1 1,92 S67 18 3 67 1 2,55 S84 18 12 84 1 4,15 S85 17 4 85 1 1,66 S87 17 9 87 1 1,93 S90 24 4 90 1 5,50 S96 14 4 96 1 2,45 S98 10 4 98 1 4,93 S10 0 13 9 10 0 1 3,17 S2 7 4 2 2 5,7 6 S7 5 3 7 2 6,86 S10 8 5 10 2 4,94 S11 11 14 11 2 2,15 S12 6 18 12 2 4,7 0 S13 5 19 13 2 5,65 S14 9 9 14 2 2,0 9 S15 10 17 15 2 3,68 S16 5 13 16 2 2,7 6 S18 13 14 18 2 3,33 S25 15 17 25 2 5,68 S30 11 9 30 2 2,62 S32 6 6 32 2 4,64 S37 12 10 37 2 2,67 S39 13 19 39 2 5,82 S41 6 7 41 2 4,0 1

Cluster Analysis Resumo


APLICAO: fazer o agrupamento de indivduos / observaes por similaridade. MTODO EMPREGADO: cluster hierrquico e no hierrquico. RESULTADOS: agrupamentos e anlises descritivas dos agrupamentos.
Uma vez desenvolvidos os conglomerados, feita sua descrio e identificado os elementos da amostra que constituem cada grupo, o prximo passo ser desenvolver um modelo que permita ao banco classificar novos clientes em relao a estes grupos, de modo a orientar sua poltica de clientes. Este assunto tratado no MDULO 7. Fundamentos Quantitativos

Mdulo 7
Anlise Discriminante

Liderana e Gesto de Equipes

OBJETIVO DO MDULO 7 Apresentar a anlise discriminante como uma ferramenta utilizada na construo de modelos de classificao de indivduos em um, dois ou mais grupos alternativos (ou populaes), com base nos atributos desses indivduos.

Liderana e Gesto de Equipes

Usos:

Anlise Discriminante

- Desenvolver procedimentos para classificar novos indivduos, cujos atributos so conhecidos - Determinar quais atributos so mais relevantes para a explicao das diferenas intergrupais.

Situao:
Atravs de uma pesquisa com 296 consumidores foi avaliado o posicionamento do pblico com relao a uma determinada campanha, observando-se que 51% corresponderam positivamente, para 18% a reao foi negativa e o restante se mostrou indiferente. Procurou-se ento verificar se seria possvel , atravs de dois atributos, separar estes trs grupos. A idia de, atravs de algum processo de classificao, identificar as caractersticas do pblico de uma outra regio e, se a mesma apresentar uma grande parcela do pblico parecido com aquele que reagiu positivamente campanha, esta poder ser plenamente utilizada na nova regio.

Fundamentos Quantitativos

Anlise Discriminante
Situao:
Atributo 2

Visualizao Como discriminar o trs grupos?

Haver erro de classificao

Atributo 1

Fundamentos Quantitativos

Anlise Discriminante
Princpio:
Particionar o espao de atributos Visualizao As trs retas Populao Vermelha discriminantes

Populao Verde

Trs Populaes Trs funes discriminantes

Populao Preta

Haver erro de classificao


Fundamentos Quantitativos

Anlise Discriminante
Funes discriminante
Funes de separao dos grupos (funes discriminante)

Y1 = a1 + b `11 x Atr1 + b12 x Atr2 Y2 = a 2 + b `21 x Atr1 + b 22 x Atr2 Y3 = a 3 + b `31 x Atr1 + b 32 x Atr2
Deve ser verificado se os coeficientes bs so significativos, ou seja, se as variveis Atributo 1 e Atributo 2 apresentam capacidade de discriminar as trs populaes.
Discriminant Function Analysis Summary (AnliseDiscriminante) No. of vars in model: 2; Grouping: Resposta Campanha (3 grps) Wilks' Lambda: ,17727 approx. F (4,584)=200,77 p<0,0000 Wilks' Partial F-remove p-level Toler. 1-Toler. N=296 Lambda Lambda (2,292) (R-Sqr.) ATRIBUTO_1 0,223950 0,791538 38,4510 0,000000 0,964650 0,035350 ATRIBUTO_2 0,600527 0,295182 Fundamentos Quantitativos 348,6097 0,000000 0,964650 0,035350 Valor

P < 0,05

Anlise Discriminante
Funes de classificao
Funes de classificao de novos indivduos nos trs grupos

Z1 = c1 + d `11 x Atr1 + d12 x Atr2 Z 2 = c2 + d `21 x Atr1 + d 22 x Atr2 Z 3 = c3 + d `31 x Atr1 + d 32 x Atr2
Classification Functions; grouping: Resposta Sim Indiferente No Variable p=,51351 p=,30743 p=,17905 ATRIBUTO_1 0,0047 0,0092 0,0056 ATRIBUTO_2 0,6267 0,8764 1,0902 Constant -23,0102 -47,9668 -66,2170 Campanha (AnliseDiscriminante)

Z1 = -23,01+0,0047Atr1+0,627Atr2 Z2 = -47,97+0,0092Atr1+0,876Atr2 Z3 = -66,22+0,0056Atr1+1,090Atr2

Devem ser utilizadas aps confirmao de que o modelo consegue classificar adequadamente, ou seja, dentro de uma proposta pr determinada. Fundamentos Quantitativos

Anlise Discriminante
Avaliao da classificao
MATRIZ de CLASSIFICAO
Classification Matrix (AnliseDiscriminante) Rows: Observed classifications Columns: Predicted classifications Percent Sim Indiferente No Correct p=,51351 p=,30743 p=,17905 94,07895 143 9 0 87,91209 8 80 3 88,67924 0 6 47 91,21622 151 95 50

Group Sim Indiferente No Total

Total Real 152 91 53 296

Comparar a porcentagem de acertos com a proposta pr determinada.

Fundamentos Quantitativos

Anlise Discriminante

Avaliao da classificao

Identificao dos erros de classificao

erro

Fundamentos Quantitativos

Utilizao
ID 1 2 3 4 5 23 24 8 9 10 11 12 13 14 15 16 17 18 19 20 1400 994 965 972 892 1349 1497 434 612 317 972 979 514 898 1025 1211 692 1550 862 853

Anlise Discriminante
Classificao com base no maior valor
ATRIBUTO_2 93 71 70 70 90 111 111 86 86 85 83 82 81 81 80 80 80 80 80 80 FunoDisc. FunoDisc. FunoDisc. Classificao Sim 42 26 25 25 38 53 54 33 34 32 33 33 30 32 32 32 30 34 31 31 Indiferente 46 23 22 22 39 61,7 63,1 31 33 29 34 32 28 31 31 33 29 36 30 30 No 43 17 16 16 37 62,3 63,2 30 31 28 30 29 25 27 27 28 25 30 26 26 Indiferente Sim Sim Sim Indiferente No No Sim Sim Sim Indiferente Sim No Sim Sim Indiferente Sim Indiferente Sim Sim

ATRIBUTO_1

Utilizao do modelo (atravs das funes de classificao) para classificar classificao novos elementos Fundamentos Quantitativos

Anlise Discriminante
Utilizao
Utilizao do modelo, atravs das funes de classificao, para: classificao Classificar novos elementos Normalmente o processo de validao do modelo passa por duas etapas: 1. Utilizao das funes de classificao dentro da prpria amostra, denominada amostra de calibrao (isto foi apresentado, atravs da matriz de classificao) classificao 2. Utilizao das funes de classificao em outra amostra, denominada amostra de validao (no foi apresentada a matriz de classificao para esta amostra).

assim verificado se as funes de classificao obtidas com a amostra de calibrao apresentam resultados similares quando utilizadas em outro ambiente. Aps este momento, o modelo fica validado para uso prtico. ambiente Fundamentos Quantitativos

Mdulo 8
ANLISE DE VARINCIA MULTIVARIADA ( (MANOVA

Liderana e Gesto de Equipes

OBJETIVO Apresentar a anlise de varincia mltipla como uma ferramenta utilizada para testar a diferena multivariada entre populaes, determinando como variveis categricas independentes afetam outras variveis dependentes, contnuas.

Liderana e Gesto de Equipes

MANOVA
OBJETIVO Apresentar a anlise de varincia mltipla como uma ferramenta utilizada para testar a diferena multivariada entre populaes, determinando como variveis categricas independentes afetam outras variveis dependentes, contnuas.
Usos: - Estudar o efeito do sexo e do estado civil dos clientes, no seu consumo mensal de roupas e de alimentao.

Fundamentos Quantitativos

MANOVA
CASO: Estudar o efeito do sexo e do estado civil dos clientes, no seu consumo mensal de roupas e de alimentao. SITUAO Uma empresa de publicidade preparou trs campanhas para o lanamento de um novo produto. A primeira campanha tem um apelo humorstico, a segunda tem um apelo emocional e a terceira utiliza uma abordagem comparativa. Acredita-se tambm que o sexo afeta a preferncia pelo tipo de campanha. Objetivo: Selecionar a campanha a ser utilizada.
Fundamentos Quantitativos

MANOVA
PRINCPIO
Quando h 1 varivel dependente e 1 varivel independente:
(gasto com roupas) (sexo)

GH HOMENS

GM MULHERES
GASTO MENSAL COM ROUPAS

Teste: O gasto mdio dos dois grupos diferente de forma significativa?

Teste de diferena entre mdias:


GH GM
GASTO MENSAL COM ROUPAS

Ho: GH = GM Ha: GH GM

Fundamentos Quantitativos

PRINCPIO
GASTO MENSAL COM ALIMENTAO

MANOVA
(sexo)

Quando h 2 variveis dependentes e 1 varivel independente:


(G.Roupas e G.Aliment.)
GASTO MENSAL COM ALIMENTAO

GH HOMENS

GH GM MULHERES

MD
GM

GASTO MENSAL COM ROUPAS

GASTO MENSAL COM ROUPAS

Teste: A distncia MD significativa? Equivale a:

G G AM H0: AH =

G RH G RH

RM

G G AM Ha: AH
G RM

Fundamentos Quantitativos

PRINCPIO

MANOVA

2 variveis dependentes e 2 variveis independentes:


(sexo e estado civil)
GASTO MENSAL COM ALIMENTAO

GHS HOMENS SOLTEIROS

HOMENS CASADOS GHC GMC MULHERES CASADAS GMS MULHERES SOLTEIRAS

GENERALIZAO Y1+Y2++YM = X1+X2++XN


VARIVEIS DEPENDENTES (CONTNUAS) VARIVEIS INDEPENDENTES (DISCRETAS)

GASTO MENSAL COM ROUPAS

Fundamentos Quantitativos

METODOLOGIA
1 varivel dependente
(gasto com roupa)

MANOVA
1 varivel dependente
(gasto com roupa)

1 varivel independente
(sexo, definindo 2 grupos)

n variveis independentes
(sexo, estado civil,, formando k grupos)

Teste t (Student):
Ho: A = B (homens e mulheres apresentam o mesmo nvel de gastos) Ha: A

Anlise de Varincias (ANOVA)


Ho:

A = B = C .... = K
(todos os grupos apresentam o mesmo nvel de gastos com roupa)

A B Estatstica t = SE A B

Ha: (pelo menos um grupo apresenta diferente nvel de gasto com roupa )

Estatstica F

Fundamentos Quantitativos

MANOVA
METODOLOGIA
1 varivel dependente
(gasto com roupa)

m variveis dependentes
(gasto com roupa, alimentao, educao,)

1 varivel independente
(sexo)

1 varivel independente
(sexo)

MANOVA - 2 grupos

Teste t:
Ho: A = B
(homens e mulheres apresentam o mesmo nvel de gastos)

Teste F:
Ho:

1B 1 A 2 B 2 A = MB MA

(homens e mulheres apresentam os mesmos hbitos de gastos)

Ha: A

Ha:

1B (homens e 1 A mulheres diferem 2 B 2 A em pelo menos um tipo de gasto) (ou, a diferena MB ocorre no todo MA Vide slide 166)

Fundamentos Quantitativos

METODOLOGIA
1 varivel dependente
(gasto com roupa)

MANOVA

m variveis dependentes

(gasto com roupa, alimentao, educao,)

n variveis independentes
(sexo, estado civil,) k grupos

n variveis independentes
(sexo, estado civil,) k grupos

ANOVA:
Ho: A = B = C .... = K

MANOVA - k grupos:
1A 1B 2A 2B Ho: . = . = .... . . MA MB

1K 2K . . MK

Fundamentos Quantitativos

Consideraes sobre as variveis independentes MANOVA


Exemplo: Duas variveis independentes procurando incrementar vendas (nica varivel dependente) de um determinado produto (Modelo ANOVA) Primeira varivel independente constituda Variveis Independentes Grupos Ao L Ao E por 3 possveis aes promocionais L1 E1 L1E1 L1 E2 L1E2 Segunda varivel independente constituda L2 E1 L2E1 por 2 possveis aes financeiras L2 E2 L2E2 L3 E1 L3E1 Possibilidades: L3 E2 L3E2 a) Testar se no h diferenas significativas em vendas, entre os grupos H0: L1E1 = L1E2 = L2E1 = L2E2 = L3E1 = L3E2 b) Testar se no h variaes de vendas entre as aes promocionais Li H0: L1 = L2 = L3 c) Testar se no h variaes de vendas entre as aes financeiras Ej H0: E1 = E2 d) Testar se no h interao entre as variveis A interao pode potencializar (ou inibir) o efeito de cada ao sobre as vendas H0: efeito de Quantitativos Fundamentosinterao = 0

MANOVA Consideraes sobre as variveis independentes


1. Testar interao entre as variveis independentes (item d do slide anterior). Se rejeitar a hiptese nula, ento h interao e deve ser identificado pelo teste t em quais grupos a interao mais acentuada. Se no rejeitar a hiptese nula, passar ao item 2. 2. Testar diferenas significativas entre os grupos (item a do slide anterior). Pode ocorrer que o efeito cumulativo de variveis independentes (sem interao) seja suficiente para evidenciar diferenas entre grupos. Se no rejeitar a hiptese nula, ento assumido que as variveis independentes, quando atuando individualmente ou mesmo em conjunto, no mostram efeitos significativos sobre a(s) varivel(s) dependente(s). Se no rejeitar a hiptese nula, passar ao item 3. 3. Testar variaes na(s) varivel(s) dependente(s) devido a mudana em cada particular varivel independente (itens b ou c do slide anterior).
Fundamentos Quantitativos

PROCEDIMENTO GERAL

Procedimento de Teste
1. 2. 3.

MANOVA

Calcular o valor resultante para o teste especfico, em funo dos dados da amostra Comparar com o valor tabelado da distribuio adotada, em funo do nvel de confiana desejado Rejeitar a hiptese Ho se valor calculado > valor tabelado

Exemplos: Teste t bicaudal Calcular o valor para a estatstica

t=

XAXB SE X A X B

Comparar com o valor tabelado da distribuio t para o nvel de confiana adotado Teste F monocaudal Calcular o valor para a estatstica F (utilize a funo adequada no computador) Comparar com o valor tabelado da distribuio F para o nvel de confiana adotado Estas informaes so fornecidas pelo software atravs do valor P
Fundamentos Quantitativos

MANOVA
SITUAO
Uma empresa de publicidade preparou trs campanhas para o lanamento de um novo produto. A primeira campanha tem um apelo humorstico, a segunda tem um apelo emocional e a terceira utiliza uma abordagem comparativa. Acredita-se tambm que o sexo afeta a preferncia pelo tipo de campanha. Objetivo: Selecionar a campanha a ser utilizada, com base nos resultados da simulao apresentada no prximo slide.

Fundamentos Quantitativos

Avaliar os dados , para as 3 variveis dependentes e 1 varivel independente (sexo, formando 2 grupos): RESULTADOS: estatstica F
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 SEXO MASC MASC MASC MASC MASC MASC MASC MASC FEM FEM FEM FEM FEM FEM FEM FEM

MANOVA
HUMOR EMOC COMPAR 8 5 2 10 5 4 6 3 1 9 6 3 8 5 2 7 4 2 10 5 4 10 7 2 2 4 10 4 2 8 1 2 10 2 6 9 4 2 8 3 1 7 2 4 10 2 3 6

Rejeitada hiptese de igualdade entre os dois grupos, ou seja, homens e mulheres reagem diferentemente (Valor P < 0,05) Necessrio partir para anlise caso a caso Identificado diferenas individuais (valores P individuais)

SEXO; LS Means (DA DOS_MULTIV ARIADA ) Wilks lambda=.05715, F(3, 12)=65.991, p=.00000 Ef f ective hy pothesis decompos ition SEXO HUMOR HUMOR HUMOR HUMOR EMOC EMOC EMOC EMOC COMPA R Cell No. Mean Std.Err. -95.00% +95.00% Mean Std.Err. -95.00% +95.00% Mean 1 MA SC 8.500000 0.462910 7.507157 9.492843 5.000000 0.500000 3.927607 6.072393 2.500000 2 FEM 2.500000 0.462910 1.507157 3.492843 3.000000 0.500000 1.927607 4.072393 8.500000

COMPA R Std.Err. 0.462910 0.462910

COMPA R -95.00% 1.507157 7.507157

COMPA R N +95.00% 3.492843 8 9.492843 8

Fundamentos Quantitativos

Avaliar os dados , para as 3 variveis dependentes e 1 varivel independente (sexo, formando 2 grupos): RESULTADOS: estatsticas univariadas (t de student)
Teste de diferena de mdias:
Com 95% de certeza, homens reagem melhor a campanhas com apelo humorstico Com 95% de certeza, no podemos afirmar que homens reagem melhor a campanhas com apelo emocional Com 95% de certeza, mulheres reagem melhor a campanhas com abordagem comparativa
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 SEXO MASC MASC MASC MASC MASC MASC MASC MASC FEM FEM FEM FEM FEM FEM FEM FEM

MANOVA

Podemos comparar (avaliao horizontal sobre notas):


Qual o melhor retorno, com 95% de certeza, entre as campanhas para homens, envolvendo humor e emoo, ou seja, se a diferena 8,5 5,0 significativa ( significativa, faam a prova) Assim, o melhor retorno, com 95% de certeza, ser: Ou a campanha para homens envolvendo humor ou a campanha para mulheres com abordagem comparativa, pois no h como rejeitar a hiptese de que a diferena 8,5 8,5 deve ser aceita como = 0

HUMOR EMOC COMPAR 8 5 2 10 5 4 6 3 1 9 6 3 8 5 2 7 4 2 10 5 4 10 7 2 2 4 10 4 2 8 1 2 10 2 6 9 4 2 8 3 1 7 2 4 10 2 3 6

SEXO; LS Means (DA DOS_MULTIV ARIADA ) Wilks lambda=.05715, F(3, 12)=65.991, p=.00000 Ef f ective hy pothesis decompos ition SEXO HUMOR HUMOR HUMOR HUMOR EMOC EMOC EMOC EMOC COMPA R Cell No. Mean Std.Err. -95.00% +95.00% Mean Std.Err. -95.00% +95.00% Mean 1 MA SC 8.500000 0.462910 7.507157 9.492843 5.000000 0.500000 3.927607 6.072393 2.500000 2 FEM 2.500000 0.462910 1.507157 3.492843 3.000000 0.500000 1.927607 4.072393 8.500000

COMPA R Std.Err. 0.462910 0.462910

COMPA R -95.00% 1.507157 7.507157

COMPA R N +95.00% 3.492843 8 9.492843 8

Fundamentos Quantitativos

SITUAO

MANOVA

Face aos resultados obtidos, a empresa de publicidade considerou a possibilidade de as campanhas serem bem seletivas e que talvez fosse possvel identificar influncias no somente do sexo. Solicitou assim que se inclusse os dados originalmente levantados de estado civil. Objetivo: Identificar outras influncias sobre os resultados das campanhas
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 SEXO MASC MASC MASC MASC MASC MASC MASC MASC FEM FEM FEM FEM FEM FEM FEM FEM EST.CIVIL CASADO SOLTEIRO CASADO SOLTEIRO CASADO CASADO SOLTEIRO SOLTEIRO CASADO SOLTEIRO CASADO CASADO SOLTEIRO SOLTEIRO CASADO SOLTEIRO HUMOR 8 10 6 9 8 7 10 10 2 4 1 2 4 3 2 2 EMOC 5 5 3 6 5 4 5 7 4 2 2 6 2 1 4 3 COMPAR 2 4 1 3 2 2 4 2 10 8 10 9 8 7 10 6

2 variveis independentes 3 variveis dependentes

Fundamentos Quantitativos

> Ftabela (ou p<0,05) rejeita Ho (existe interao sexo x est. civil)

Teste F sobre a hiptese Ho de os 4 grupos reagirem igualmente a cada campanha :

MANOVA

Identificao das Interaes


12 HUM OR
7 6 5 E M O O
12

COM P A R .

10

MASC

M A SC

10

FE M

8 MASC 6

4 3

M A SC FEM
6

FE M

4 FE M 2 FE M
2 1 0 FE M

MASC
2

MASC

0 CA S A DO S OLTE IRO

CA SA DO

SOLTEIRO

CA S A DO

S OLTE IRO

Interao desprezvel

Aparente Interao forte

Aparente Interao forte

Fundamentos Quantitativos

MANOVA
Identificao das diferenas significativas entre grupos

Significativo. Sem interao

Significativo Forte Interao

Significativo. Forte Interao

Estatsticas univariadas: Teste t atravs dos intervalos de confiana


Campanhas bastante seletivas: Campanha com apelo humorstico atinge prioritariamente o grupo masculino solteiro e, posteriormente, o grupo masculino casado, com 95% de confiana. Campanha com apelo emocional atinge prioritariamente o grupo masculino solteiro e, pelo efeito interao, no h distino significativa entre os casados. Campanha com abordagem comparativa atinge prioritariamente o grupo feminino casado (e, posteriormente, o grupo feminino solteiro). Pela interao sexo*estado civil, o grupo masculino casado, em oposio, reduziu a avaliao desta campanha. Fundamentos Quantitativos

Para resolver:
Estatstica F:
Com 95% de confiana, rejeita a hiptese de igualdade entre os grupos
ID 1 2 3 4 5 6 7 8 9 10

MANOVA
GRUPO GRUPO 1 GRUPO 1 GRUPO 1 GRUPO 1 GRUPO 1 GRUPO 2 GRUPO 2 GRUPO 2 GRUPO 2 GRUPO 2 X1 1 2 4 6 6 4 5 5 8 8 X2 3 5 7 11 12 5 5 6 7 9

Verifique e explique Estatsticas univariadas (teste t para diferena de mdias):


Com 95% de confiana, mdia de X1 ou de X2 no so significativas, ao tentarmos identificar individualmente a diferena entre os dois grupos.

Verifique e explique
GRUPO; LS Means (DADOS_MULTIVARIADA) Wilks lam bda=.19007, F(2, 7)=14.914, p=.00299 Effective hypothesis decom position GRUPO X1 X1 X1 X1 X2 X2 X2 X2 N Mean Std.Err. -95.00% +95.00% Mean Std.Err. -95.00% +95.00% GRUPO 1 3.800000 0.932738 1.649103 5.950897 7.600000 1.326650 4.540740 10.65926 5 GRUPO 2 6.000000 0.932738 3.849103 8.150897 6.400000 1.326650 3.340740 9.45926 5

Cell No. 1 2

Fundamentos Quantitativos

MANOVA
RESUMO
APLICAO: determinar se dois ou mais grupos so diferentes de forma multivariada (considerando simultneamente muitas variveis). RESULTADOS: estatstica F, MANOVA para mais de 2 ou mais grupos e outras estatsticas univariadas (t de student).

Fundamentos Quantitativos

You might also like