Professional Documents
Culture Documents
OBJETIVO DA PARTE 1
Fornecer uma base conceitual para acompanhamento dos mdulos que apresentam as tcnicas multivariadas Inclui os mdulos 1, 2 e 3
Modelamento Matemtico
Implementar Aes
Modelamento Matemtico
Representam a realidade (se exatos); Ajudam decisores a formular problemas; Previso de conseqncias; Podem economizar dinheiro e tempo nas decises; Etc.
Fundamentos Quantitativos
VANTAGE NS
Modelamento Matemtico
realidade, limitaes); Dificuldade de obteno de dados; Desconsidera aspectos qualitativos, percepes; Rejeio de quem no entende ou se sente ameaado; e
Fundamentos Quantitativos
Contedo
Unidades, medidas e os nmeros Interpretao de tabelas Construo e interpretao de grficos
Fundamentos Quantitativos
Fundamentos Quantitativos
Fundamentos Quantitativos
Fundamentos Quantitativos
Representao Grfica
Grficos normalmente trazem a informao de forma visual e prontamente interpretvel. Exemplos de grficos a serem trabalhados nesta disciplina: Grfico de Disperso (Scatter Plot) Histograma
Fundamentos Quantitativos
Grficos
Normas para a construo de grficos
Todo grfico deve ter Ttulo e Escala. A escala deve ser adequada ao objeto de estudo. O ttulo deve ser acima do grfico. Eixo Horizontal = Abscissa (x). Eixo Vertical = Ordenada (y). Em cada eixo identificar a varivel representada. No eixo horizontal (x) apresentamos a varivel independente ou varivel explicativa
Fundamentos Quantitativos
Grficos
Ordenada (y)
Abscissa (x)
Fundamentos Quantitativos
Grficos
Leitura de Grficos
35000
Vendas R$1000
400000
30000
390000
25000
380000
340000
5000
330000
Ano
0 1996 1998 2000 2002 2004 2006 2008 320000 1000 1100 1200 1300 1400 1500
Preo (R$)
1600 1700
Fundamentos Quantitativos
Grfico de disperso
Evoluo de Vendas
R$ milhes R$ milhares
Histograma
Mostra dados de distribuio de Freqncia ou Freqncia Relativa Freqncia: grfico de barras. Freqncia relativa: grfico de barras (totalizando 100%). mais til. ideal para dados Quantitativos em Classes.
Fundamentos Quantitativos
Histograma - Exemplo
25 Freqncia (%)
20
15
10
. . .
0 151 155 159 163 167 171 175 179 183 Altura (cm)
Abscissa: ESCALA ORDINAL - indicando direo (ex: classes de altura) Ordenada: ESCALA MTRICA Explicitando a freqncia absoluta ou relativa (%).
Fundamentos Quantitativos
Histograma - Exemplo
25 Freqncia (%)
20
15
10
0 151 155 159 163 167 171 175 179 183 Altura (cm)
O Histograma procura apresentar atravs de classes, o comportamento aproximado de uma varivel aleatria contnua (no caso, a altura).
Fundamentos Quantitativos
Mdulo 2
FUNES MATEMTICAS
Funes Matemticas
OBJETIVOS DO MDULO
Apresentar as funes lineares como elementos fundamentais no modelamento de situaes tpicas de negcios.
1 2 3 4
6 8 10 12
Fundamentos Quantitativos
371 390 330 421 351 311 319 407 398 342 363 383
371.641,00 381.759,00 348.280,00 392.891,00 356.412,00 330.545,00 330.652,00 395.274,00 382.775,00 358.363,00 369.913,00 371.972,00
Funes Matemticas
y = f(x) CT = f(Q)
Custo Total: Varivel dependente ou explicada Volume: Varivel independente ou explicativa
420.000,00 Custo Total (R$)
O custo total de produo funo crescente do volume produzido, ou seja, quanto maior a produo, maiores so os gastos em material, mo de obra, etc. Como expressar esta funo?
Fundamentos Quantitativos
Custo x Quantidade
400.000,00
380.000,00
360.000,00
CT = 148833 + 593,82xQ
340.000,00
300.000,00 290
x
Fundamentos Quantitativos
x
Fundamentos Quantitativos
y = a x +
b
Fundamentos Quantitativos
a tangente do angulo da reta Quanto maior a mais inclinada a reta Se a positivo ---> reta crescente Se a negativo --> reta decrescente Se a zero.........Y no depende de X --> reta paralela ao eixo X ... na altura do valor b !!
SOLUO
Fundamentos Quantitativos
1000 -200
Fundamentos Quantitativos
SOLUO
Fundamentos Quantitativos
Mdulo 3
ESTATSTICA DESCRITIVA Introduo a Inferncia Correlao
OBJETIVOS DO MDULO
Apresentar o ferramental bsico para anlise de dados em que se apia os modelos de inferncia estatstica. Apresentar os conceitos introdutrios relativos inferncia estatstica.
Estatstica Descritiva
Contedo
Terminologia Bsica Medidas de Tendncia Central Medidas de Disperso Conceitos de Inferncia Correlao
Fundamentos Quantitativos
Terminologia Bsica
Tendncia Central de um conjunto de dados a tendncia das medidas destes dados em se acumular em torno de certos valores numricos. Disperso uma medida de espalhamento dos dados
Fundamentos Quantitativos
Fundamentos Quantitativos
Mdia Aritmtica
a soma das medidas dividida pelo nmero de elementos do conjunto de dados.
x=
Fundamentos Quantitativos
x
i =1
Exemplo
Calcule a mdia dos seguintes grupos de dados: 1, 2, 3, 4, 5 e 2, 3, 3, 3, 4
Fundamentos Quantitativos
Amostra x Populao
x
Fundamentos Quantitativos
Moda
a medida que ocorre com maior freqncia no conjunto de dados. Exemplo: notas de degustadores de vinho: 8, 7, 9, 6, 8, 10, 9, 9, 5, 7. Moda: 9
Fundamentos Quantitativos
Moda
Indica onde os dados tendem a se concentrar. til para dados qualitativos (Ex. notas de jurados). Pode haver mais de uma ou no ter sentido (Ex. pesquisa de lazer).
Fundamentos Quantitativos
Exemplo
Preferncia do produto A (em %) colhida em diversas regies do Brasil por meio de uma pesquisa de mercado. 56, 63, 64, 65, 66, 69, 71, 57, 64, 66, 64, 65, 66, 66, 68 e 72.
N = 16 x = 1042 Mdia = 65,125 Moda =66
Fundamentos Quantitativos
Medidas de Disperso
Medida de Disperso para utilizao neste curso:
Fundamentos Quantitativos
Varincia
Volta ao exemplo anterior Dados: 1, 2, 3, 4, 5 e 2, 3, 3, 3, 4
x=3
-2, -1, 0, 1, 2
( xi x) =
-1, 0, 0, 0, 1
Varincia
s =
2
(x i x)
i =1
n 1
Fundamentos Quantitativos
Desvio Padro
s= s
Fundamentos Quantitativos
Amostra x Populao
s s
Fundamentos Quantitativos
Outliers
Medida incorreta; Outra populao; ou Peculiaridades (exame cuidadoso).
Observao: O critrio para a definio de outliers varia muito conforme os autores. De maneira geral, considera-se como um Outlier, uma medida acima de 3 desvios-padro da mdia.
Fundamentos Quantitativos
Exerccio
Suponha que um certo programa de TV tenha um ndice de audincia mdio de 10,2 pontos, com desvio-padro de 0,9 pontos, numa distribuio normal (Gauss). Um determinado Instituto de Pesquisa afirma ter medido 15,1 pontos num teste. Comente este resultado luz da interpretao do desvio padro e de outliers. Quais os limites mximos esperados?
Fundamentos Quantitativos
Desvio-padro: interpretao
Distribuio Normal Aproximadamente 68% das medidas caem dentro de mdia 1 s. Aproximadamente 95% das medidas caem dentro de mdia 2 s. Aproximadamente 99,7% das medidas caem dentro de mdia 3 s.
Fundamentos Quantitativos
Desvio-padro: interpretao
Distribuio Normal
34% 34%
x 3s
z = -3
x 2s z = -2
x s
z = -1
x
z=0
x +s z=1
x + 2s z=2
x + 3s z=3
Fundamentos Quantitativos
( x x) z= s
Distncia em desvios-padro da mdia
Transforma qualquer distribuio normal em uma distribuio normal padronizada: = 0 e = 1 N(0,1)
Fundamentos Quantitativos
Fundamentos Quantitativos
: mdia : desvio-padro
Fundamentos Quantitativos
xB
x+B
INTERVALO DE CONFIANA
Fundamentos Quantitativos
pB
p+B
Vendas (um)
Visto tratar-se de uma amostra, ser necessrio inferir se o coeficiente angular positivo. Haver uma margem de erro. E se o resultado obtido for: a = 4,5 5,1 com 95% de confiana?
25 20 15 10 5 0 0 1 2 3 4
Desconto (%)
5 6
Neste caso no poderamos afirmar com 95% de confiana que o preo influi nas vendas deste produto. E se fosse: a = 4,5 0,8 ? Fundamentos Quantitativos
r=
(x
i =1
x )( yi y )
n
( xi x ) 2 ( yi y ) 2
i =1 i =1
Fundamentos Quantitativos
Correlao r 0
Fundamentos Quantitativos
Matriz de Correlao
Correlao entre variveis candidatas a explicar Valor de Imveis
CRIM CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTR BL LST
1 -0,20 0,41 -0,06 0,42 -0,22 0,35 -0,38 0,63 0,58 0,29 -0,39 0,46
1 -0,53 -0,04 -0,52 0,31 -0,57 0,66 -0,31 -0,31 -0,39 0,18 -0,41
1 0,06 0,76 -0,39 0,64 -0,71 0,60 0,72 0,38 -0,36 0,60
1 0,09 1 0,09 -0,30 1 0,09 0,73 -0,24 1 -0,10 -0,77 0,21 -0,75 1 -0,01 0,61 -0,21 0,46 -0,49 1 -0,04 0,67 -0,29 0,51 -0,53 0,91 1 -0,12 0,19 -0,36 0,26 -0,23 0,46 0,46 1 0,05 -0,38 0,13 -0,27 0,29 -0,44 -0,44 -0,18 -0,05 0,59 -0,61 0,60 -0,50 0,49 0,54 0,37
1 -0,37
r = 0,91 Variveis RAD e TAX so muito correlacionadas Em princpio, poderamos abandonar uma delas. Porque? r = 0,13 Variveis RM e BL so pouco correlacionadas Matriz de Correlao Apia decises sobre reduo do nmero de variveis em um caso sujeito influncia de muitas variveis Exemplo: Em princpio, a varivel CHAS no deve ser excluda. Porque?
Fundamentos Quantitativos
Determinar a matriz de correlao entre as trs variveis Notar que Vendas a varivel dependente O que podemos falar quanto a correlao entre elas?
Despesas com Propaganda Desconto sobre Preos de Vendas
Matriz de Correlao
Vendas (1000R$) VV 1528,50 1560,00 1419,00 1335,00 1462,50 1281,00 1629,00 1296,00 1440,00 1405,50 1747,50 1375,50 1320,00 1540,00 1712,00 1555,00 1576,00
(1000R$) DP 8,33 83,33 25,00 41,67 16,67 58,33 91,67 50,00 75,00 33,33 100,00 66,67 20,00 55,00 80,00 95,00 35,00
(%) DPV 12,0 5,5 8,0 4,0 9,5 0,5 8,5 1,5 4,5 6,5 10,5 2,0 5,00 9,00 12,00 5,00 11,00
Fundamentos Quantitativos
Matriz de Correlao
Notar que trata-se de um processo de inferncia, sobre as variveis, a partir da amostra selecionada
Fundamentos Quantitativos
Matriz de Correlao
Determinar a matriz de correlao entre as trs variveis Notar que Vendas a varivel dependente O que podemos falar quanto a correlao entre elas?
Coeficientes de Correlao DP DPV DP 1 DPV -0,1198 1 VV 0,5184 0,7791 VV
Fundamentos Quantitativos
Parte 2
Tcnicas Multivariadas para Anlise Quantitativa de Mercado
Mdulo 4
Modelos de Previso Regresso Linear
OBJETIVO DO MDULO 4
Apresentar, utilizando planilhas eletrnicas, a regresso linear como uma ferramenta para previso de uma dada varivel, conhecendo-se o comportamento de outra(s).
Fundamentos Quantitativos
Fundamentos Quantitativos
(x3,y3)
20
Erro 3
Erro 4 (x4,y4)
10
(x2,y2)
Fundamentos Quantitativos
Erro
Yi = aX i + b + i
Varivel Dependente (Resposta) Inclinao Varivel Independente (Explicativa)
Fundamentos Quantitativos
Fundamentos Quantitativos
R2 explicado adiante
Fundamentos Quantitativos
= a*X + b
Vendas = 2,9 * Desconto + 14,6
i = A + B*X i
29,1 43,6 72,7 37,8 26,2 32,0 49,4 58,1
ei
-2.1 2.4 0.3 2.2 3.8 -4.0 -3.4 0.9
Soma = 0
Fundamentos Quantitativos
Modelos de Previso - Regresso Linear Regresso Linear Simples Coeficiente de Determinao (R2)
Indica o poder de explicao do modelo em valores percentuais (%). Em outras palavras, o modelo de regresso capturou 100 x (R2) % da variao da varivel de interesse.
Fundamentos Quantitativos
R = 0,89
R = 0,04
20 10 0 20 40 X 60 80 100
100 90 80 70 60 50 40 30 20 10 0 0 20 40 X 60 80 100 Y
R = 0,43
R2 = 1
Coeficientes Erro padro Stat t 14,5774 2,4101 6,0485 2,9048 0,2145 13,5423
Modelos de Previso - Regresso Linear Regresso Linear Simples Anlise de Validade do Modelo
O modelo linear vale? H chance da inclinao ser zero? Duas formas de se verificar: Valor de t (ou Valor P associado); ou Intervalo de confiana p/ inclinao
Fundamentos Quantitativos
Fundamentos Quantitativos
y = ax + b +
onde Y = consumo/visita (R$) (varivel dependente) X= distncia do cliente ao pto de venda (varivel independente)
= Erro aleatrio
C = 4,56 D + 11,43
Coeficientes Erro padro Stat t Interseo 11,4273 1,2221 9,350474 Distncia do domiclio ao Ponto de Vendas (km) 4,5554 0,3665 12,4295
Y = 4,56 X + 11,43
Consumo (R$) Consumo Realmdio mensal (R$) Consumo Previsto (R$) mdio mensal (Previsto) Consumo (R$)
3,0 4,0 5,0 6,0 Distncia do Domiclio ao Ponto de Vendas (KM)
modelo prev-se que, para cada km adicional de distncia do morador, o consumo semanal aumenta de a = 4,56 R$ Pelo modelo tambm: correto pensar que se x=zero , o consumo previsto de 11,43 R$? Quem mora dentro da loja consome 11,43R$ ? Resposta: No Esta interpretao s vlida no intervalo estudado (ou seja entre 0,7 Km e 5,5 Km). Fora disto no d para aplicar o modelo!
Situao
Como estimar o faturamento de um negcio com base em seu investimento em publicidade e no preo praticado?
Fundamentos Quantitativos
r = +1
r = -1
X1 X2
X1 Y
r >0
r <0
X1
X1
r=0
X1
Yi = 1X + a 2X i2 + b ... i a ++ e i1
onde: Yi a varivel explicada (Ex: vendas mensais) mensais X1i uma varivel explicativa (Ex: preo) preo X2i outra varivel explicativa (Ex: gastos com propaganda) propaganda a1, a2 e b: constantes do modelo ei : erro
Fundamentos Quantitativos
Fundamentos Quantitativos
95% inferiores 95% superiores -1,10819 39,38220 0,21799 2,57819 -1,44091 -0,00430
Fundamentos Quantitativos
Multicolinearidade
Problema que ocorre quando as variveis explicativas no so independentes. Conseqncia da Multicolinearidade: As estimativas dos parmetros perdem a confiabilidade. Indicaes de Multicolinearidade: - Resultados obtidos atentam contra o bom senso - Valor-P maior que 0,10 - Alta correlao entre as variveis do modelo Ao necessria: Eliminar alguma varivel explicativa e efetuar nova regresso linear.
Fundamentos Quantitativos
(Valor-P=0,24)
RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,80 R-Quadrado 0,65 R-quadrado ajustado 0,59 Erro padro 179,25 Observaes 17 ANOVA gl Regresso Resduo Total SQ MQ 2 817866,12 408933,06 14 449831,76 32130,84 16 1267697,9 Stat t 26,86 1,23 -0,54 F F de significao 12,727 0,0007 Obs: R-Quadrado = 0,65 indicao de pouca aderncia dos dados, sem qualquer relao com a caracterstica apontada de multicolinearidade. A evidncia de multicolinearidade est caracterizada pelo alto valor do Coeficiente de Correlao, pelo coeficiente negativo da varivel X2 que est em desacordo com o bom senso ou com os altos resultados do valor-P.
95% inferiores 95% superiores 2337,60 2743,25 -5,09 18,69 -238,98 142,63
Fundamentos Quantitativos
(Valor-P=0,24)
(Valor-P=0,60)
Existem casos que a correlao um fato ligado populao. Exemplo: Aplicao de propaganda e desconto em produtos sazonais. Neste caso no h maiores preocupaes em eliminar alguma varivel explicativa, pois a correlao uma caracterstica constante na amostragem. Existem casos que a correlao uma circunstncia amostral. Exemplo: Retirada de amostra no momento que uma determinada poltica de desconto + investimento em propaganda est em curso. Neste caso os resultados obtidos s sero representativos para consideraes sobre vendas, enquanto a atual poltica estiver em vigor.
Fundamentos Quantitativos
Obs. Haver necessidade de extrapolar para definir Aluguel de um dos imveis. Defenda esta extrapolao.
Fundamentos Quantitativos
Mdulo 5
Modelos de Previso Regresso Linear Consideraes Finais
OBJETIVO DO MDULO 5
Verificar quais so os cuidados necessrios para validar uma anlise de regresso e Apresentar como realizar uma previso por meio de regresso linear utilizando-se variveis qualitativas. Trabalhar casos de regresso linear no laboratrio
Exemplo:
X1
Despesas com Propaganda
30
X2
Desconto sobre Preos de Vendas
(1000R$) 8,33 83,33 25,00 41,67 16,67 58,33 91,67 50,00 75,00 33,33 100,00 66,67 20,00 55,00 80,00 95,00 35,00
(%) 12,0 5,5 8,0 4,0 9,5 0,5 8,5 1,5 4,5 6,5 10,5 2,0 5,00 9,00 12,00 5,00 11,00
Y Aderncia Vendas Vendas Estimadas (1000R$) (1000R$) 1528,50 1514,39 1560,00 1524,09 1419,00 1432,62 1335,00 1350,86 1462,50 1457,08 1281,00 1285,51 1629,00 1647,41 1296,00 1293,55 1440,00 1466,46 1405,50 1408,16 1747,50 1737,88 1375,50 1359,56 1320,00 1319,23 1540,00 1554,72 1712,00 1727,63 1555,00 1542,39 1576,00 1560,89
Erro (1000R$) 14,11 35,91 -13,62 -15,86 5,42 -4,51 -18,41 2,45 -26,46 -2,66 9,62 15,94 0,77 -14,72 -15,63 12,61 15,11
40 30 20 10
Erro (1000R$)
Desconto (%)
Fundamentos Quantitativos
Fundamentos Quantitativos
Exemplos de variveis qualitativas: Sexo (masculino ou feminino) Fabricante (A, B ou C) Grau hierrquico (diretor, gerente, chefe) Modelo (carros utilitrios ou no) Estado civil Estado profissional (empregado ou no) Caracterstica particular do imvel (vista p/ oceano)
Fundamentos Quantitativos
Fundamentos Quantitativos
0 se inexiste 1 se existe
Yi = a1 X 1i + a 2 (1) + b = a1 X 1i + (a 2 + b)
Ausncia da caracterstica (X2 = 0)
Fundamentos Quantitativos
Yi = a1 X 1i + a 2 (0) + b = a1 X 1i + b
mesma inclinao a1
95% inferiores 95% superiores -20621,33 -12792,30 1079,18 1217,18 9921,23 12636,43
Valor = -16706,80 + 11278,80V + 1148,20M Valor = -16706,80 + 1148,20M sem viso Valor = -5428,00 + 1148,20M com viso
Fundamentos Quantitativos
Mdulo 6
Cluster Analysis
OBJETIVO DO MDULO 6 Apresentar a anlise de conglomerados como uma ferramenta para o agrupamento de indivduos (ex: clientes, fora de vendas), produtos, marcas, canais de distribuio, entre outros, em grupos desconhecidos, com base em atributos caractersticos destes indivduos.
Cluster Analysis
Usos:
- Identificar segmentos similares
Princpio:
DISTNCIA A medida de similaridade
A distncia mais utilizada em anlise de conglomerados a Euclideana.
Fundamentos Quantitativos
Cluster Analysis
DISTNCIA A medida de similaridade
A distncia mais utilizada em anlise de conglomerados a Euclideana.
16 14 Educao (anos) 12 10 8 6 4 2 0 0 2
A distncia Euclideana:
d ij =
( x ik x jk ) 2
k =1
= (8 3) 2 + (15 6) 2
Renda: R$3.000,00 Educao: 6 anos
= 25 + 81 = 10,296
4 6 8 10 Renda (R$ mil)
Fundamentos Quantitativos
Cluster Analysis
DISTNCIA A distncia Euclideana
IMPORTANTE: Cuidado com a ESCALA E se a escala do atributo Educao fosse em meses?
25 20 Educao (anos) 15 10 5 0 0 10 20 Renda (R$ mil) 30 40
Observ S1 S2 S3 S4 S5 S6
Renda 5 6 15 16 25 30
Educao 5 6 14 15 20 19
Fundamentos Quantitativos
Cluster Analysis
Situao:
Com o objetivo de criar comunicaes (ofertas de produtos) mais eficientes, um banco decidiu criar agrupamentos de clientes baseando-se em sua renda anual e no grau de escolaridade (total de anos de estudo).
Metodologia
Os agrupamentos so formados por similaridade entre as observaes, sendo a distncia euclideana o mtodo mais utilizado no clculo de similaridade. Matriz de similaridades
Observ S1 S2 S3 S4 S5 S6 Renda 5 6 15 16 25 30 Educao 5 6 14 15 20 19
S1 S2 2 0 145 181 557 745
25 20
S1 S2 S3 S4 S5 S6
Fundamentos Quantitativos
Cluster Analysis
Metodologia
A anlise de conglomerados (cluster analysis) uma tcnica utilizada na combinao de observaes em grupos ou agrupamentos de forma que: Cada grupo ou agrupamento seja homogneo em funo de determinadas caractersticas, ou seja, que as observaes em cada grupo sejam similares. Cada grupo seja diferente dos outros grupos formados em funo das mesmas caractersticas, ou seja, que as observaes em um grupo sejam diferentes das observaes dos outros grupos.
Fundamentos Quantitativos
Cluster Analysis
Metodologia: CLUSTER HIERRQUICO
A partir da matriz de similaridade pode-se realizar diferentes formas de agrupamento em funo de como a distncia entre os agrupamentos for calculada. Os mtodos mais comumente empregados so: Mtodo do centride Mtodo da ligao simples Mtodo da ligao completa Mtodo da ligao mdia Mtodo de Ward
Fundamentos Quantitativos
Cluster Analysis
Metodologia: CLUSTER HIERRQUICO Mtodo da ligao simples: por esse mtodo busca-se as
menores distncias para o clculo da distncia entre agrupamentos.
Fundamentos Quantitativos
Cluster Analysis
Metodologia: CLUSTER HIERRQUICO
Mtodo de Ward: Por esse mtodo de agrupamento de dados, formam-se grupos de maneira a atingir sempre o menor erro interno, medido entre os vetores mdios de cada grupo e o vetor mdio do novo grupo (ponderando pelo nmero de componentes de cada grupo). Assim, os grupos de dados so formados em etapas, buscando-se minimizar a soma dos quadrados mdios das componentes destes vetores. Um exemplo elucidativo:
Educao (anos) 25 20 15 10 5 0 0 10 20 Renda (R$ mil) 30 40
Observ S1 S2 S3 S4 S5 S6
Renda 5 6 15 16 25 30
Educao 5 6 14 15 20 19
Sugere 3 grupos?
25 20 Matriz de similaridades
S6 821 745 250 212 26 0
S1 S1 S2 S3 S4 S5 S6
S2
S3 S4 S5 181 221 625 145 181 557 0 2 136 2 0 106 136 106 0 Quantitativos 26 250 212
Cluster Analysis
Metodologia: CLUSTER HIERRQUICO
Mtodo de Ward: Um exemplo elucidativo:
S 1 2 0 0 T r e e W D ia g r a m m f o r e t h o d d is t a n c e s 6 C a s e s a r d ` s q u a r e d E u c lid e a n
Linkage Distance
Amalgamation Schedule (DADOS_MULTIVARIADA) Ward`s method Squared Euclidean distances linkage Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. distance 1 2 3 4 5 6 2,0 0 0 0 0 0 S1 S2 2,0 0 0 0 0 0 S3 S4 26,00 0 0 0 S5 S6 338,0 0 0 0 S3 S4 S5 S6 10 35,333 S1 S2 S3 S4 S5 S6
1 0 0 0
8 0 0
6 0 0
Sugere 3 grupos?
4 0 0
2 0 0
0 S 6 S 5 S 4 S 3 S 2 S 1
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
H diversas abordagens para determinar o nmero de clusters. Alternativa: Mtodo de Ward (minimizar a variabilidade do erro).
OBSERV RENDA EDUC
Salve os dados em planilha do software adotado
Fundamentos Quantitativos
Cluster Analysis
Sugesto: 3 Clusters?
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
O Cluster Hierrquico orienta o conhecimento relativo ao nmero mais adequado de segmentos que um determinado mercado possui. Porm a metodologia rgida e no momento que um determinado indivduo indicado para um particular grupo, se torna impossvel um remanejamento mais adequado.
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
O Cluster No Hierrquico possibilita que um determinado indivduo seja remanejado de um particular grupo para outro que se mostre mais adequado. No entanto exige a informao prvia sobre o nmero de segmentos que constituem o mercado em anlise.
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Mtodo K-mdias:
Opes Adotadas
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Mtodo K-mdias:
Uma vez desenvolvidos os conglomerados, a prxima tarefa fazer sua descrio Uma medida freqentemente utilizada o valor mdio das variveis (atributos) para cada um dos conglomerados
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Mtodo K-mdias: P
3 5 3 0
lo t
o f
e a n s
f o r
E a c h
lu s t e r
2 5
2 0
1 5
1 0
0 C C C lu s t e r lu s t e r lu s t e r 1 2 3
- 5 R E N D A V E D a r i a b le s U C
Fundamentos Quantitativos
Cluster Analysis
Mtodo K-mdias:
Fundamentos Quantitativos
Cluster Analysis
AVALIAO E DESCRIO DOS CONGLOMERADOS
Mtodo K-mdias:
Membros de cada cluster
Fundamentos Quantitativos
Dados_Cluster_Slides 1 2 3 4 5 RENDA EDUC CASE_NO CLUSTER DISTANCE S1 14 4 1 1 2,45 S3 19 7 3 1 1,7 8 S8 15 12 8 1 4,18 S17 12 6 17 1 3,24 S19 18 11 19 1 3,47 S20 13 7 20 1 2,58 S21 14 8 21 1 2,18 S22 13 4 22 1 3,0 1 S24 16 5 24 1 1,0 1 S26 12 7 26 1 3,27 S36 16 7 36 1 0 ,64 S40 24 4 40 1 5,50 S46 17 5 46 1 0 ,97 S56 21 3 56 1 3,91 S58 23 3 58 1 5,11 S62 20 6 62 1 2,43 S64 15 12 64 1 4,18 S65 18 4 65 1 1,92 S67 18 3 67 1 2,55 S84 18 12 84 1 4,15 S85 17 4 85 1 1,66 S87 17 9 87 1 1,93 S90 24 4 90 1 5,50 S96 14 4 96 1 2,45 S98 10 4 98 1 4,93 S10 0 13 9 10 0 1 3,17 S2 7 4 2 2 5,7 6 S7 5 3 7 2 6,86 S10 8 5 10 2 4,94 S11 11 14 11 2 2,15 S12 6 18 12 2 4,7 0 S13 5 19 13 2 5,65 S14 9 9 14 2 2,0 9 S15 10 17 15 2 3,68 S16 5 13 16 2 2,7 6 S18 13 14 18 2 3,33 S25 15 17 25 2 5,68 S30 11 9 30 2 2,62 S32 6 6 32 2 4,64 S37 12 10 37 2 2,67 S39 13 19 39 2 5,82 S41 6 7 41 2 4,0 1
Mdulo 7
Anlise Discriminante
OBJETIVO DO MDULO 7 Apresentar a anlise discriminante como uma ferramenta utilizada na construo de modelos de classificao de indivduos em um, dois ou mais grupos alternativos (ou populaes), com base nos atributos desses indivduos.
Usos:
Anlise Discriminante
- Desenvolver procedimentos para classificar novos indivduos, cujos atributos so conhecidos - Determinar quais atributos so mais relevantes para a explicao das diferenas intergrupais.
Situao:
Atravs de uma pesquisa com 296 consumidores foi avaliado o posicionamento do pblico com relao a uma determinada campanha, observando-se que 51% corresponderam positivamente, para 18% a reao foi negativa e o restante se mostrou indiferente. Procurou-se ento verificar se seria possvel , atravs de dois atributos, separar estes trs grupos. A idia de, atravs de algum processo de classificao, identificar as caractersticas do pblico de uma outra regio e, se a mesma apresentar uma grande parcela do pblico parecido com aquele que reagiu positivamente campanha, esta poder ser plenamente utilizada na nova regio.
Fundamentos Quantitativos
Anlise Discriminante
Situao:
Atributo 2
Atributo 1
Fundamentos Quantitativos
Anlise Discriminante
Princpio:
Particionar o espao de atributos Visualizao As trs retas Populao Vermelha discriminantes
Populao Verde
Populao Preta
Anlise Discriminante
Funes discriminante
Funes de separao dos grupos (funes discriminante)
Y1 = a1 + b `11 x Atr1 + b12 x Atr2 Y2 = a 2 + b `21 x Atr1 + b 22 x Atr2 Y3 = a 3 + b `31 x Atr1 + b 32 x Atr2
Deve ser verificado se os coeficientes bs so significativos, ou seja, se as variveis Atributo 1 e Atributo 2 apresentam capacidade de discriminar as trs populaes.
Discriminant Function Analysis Summary (AnliseDiscriminante) No. of vars in model: 2; Grouping: Resposta Campanha (3 grps) Wilks' Lambda: ,17727 approx. F (4,584)=200,77 p<0,0000 Wilks' Partial F-remove p-level Toler. 1-Toler. N=296 Lambda Lambda (2,292) (R-Sqr.) ATRIBUTO_1 0,223950 0,791538 38,4510 0,000000 0,964650 0,035350 ATRIBUTO_2 0,600527 0,295182 Fundamentos Quantitativos 348,6097 0,000000 0,964650 0,035350 Valor
P < 0,05
Anlise Discriminante
Funes de classificao
Funes de classificao de novos indivduos nos trs grupos
Z1 = c1 + d `11 x Atr1 + d12 x Atr2 Z 2 = c2 + d `21 x Atr1 + d 22 x Atr2 Z 3 = c3 + d `31 x Atr1 + d 32 x Atr2
Classification Functions; grouping: Resposta Sim Indiferente No Variable p=,51351 p=,30743 p=,17905 ATRIBUTO_1 0,0047 0,0092 0,0056 ATRIBUTO_2 0,6267 0,8764 1,0902 Constant -23,0102 -47,9668 -66,2170 Campanha (AnliseDiscriminante)
Devem ser utilizadas aps confirmao de que o modelo consegue classificar adequadamente, ou seja, dentro de uma proposta pr determinada. Fundamentos Quantitativos
Anlise Discriminante
Avaliao da classificao
MATRIZ de CLASSIFICAO
Classification Matrix (AnliseDiscriminante) Rows: Observed classifications Columns: Predicted classifications Percent Sim Indiferente No Correct p=,51351 p=,30743 p=,17905 94,07895 143 9 0 87,91209 8 80 3 88,67924 0 6 47 91,21622 151 95 50
Fundamentos Quantitativos
Anlise Discriminante
Avaliao da classificao
erro
Fundamentos Quantitativos
Utilizao
ID 1 2 3 4 5 23 24 8 9 10 11 12 13 14 15 16 17 18 19 20 1400 994 965 972 892 1349 1497 434 612 317 972 979 514 898 1025 1211 692 1550 862 853
Anlise Discriminante
Classificao com base no maior valor
ATRIBUTO_2 93 71 70 70 90 111 111 86 86 85 83 82 81 81 80 80 80 80 80 80 FunoDisc. FunoDisc. FunoDisc. Classificao Sim 42 26 25 25 38 53 54 33 34 32 33 33 30 32 32 32 30 34 31 31 Indiferente 46 23 22 22 39 61,7 63,1 31 33 29 34 32 28 31 31 33 29 36 30 30 No 43 17 16 16 37 62,3 63,2 30 31 28 30 29 25 27 27 28 25 30 26 26 Indiferente Sim Sim Sim Indiferente No No Sim Sim Sim Indiferente Sim No Sim Sim Indiferente Sim Indiferente Sim Sim
ATRIBUTO_1
Utilizao do modelo (atravs das funes de classificao) para classificar classificao novos elementos Fundamentos Quantitativos
Anlise Discriminante
Utilizao
Utilizao do modelo, atravs das funes de classificao, para: classificao Classificar novos elementos Normalmente o processo de validao do modelo passa por duas etapas: 1. Utilizao das funes de classificao dentro da prpria amostra, denominada amostra de calibrao (isto foi apresentado, atravs da matriz de classificao) classificao 2. Utilizao das funes de classificao em outra amostra, denominada amostra de validao (no foi apresentada a matriz de classificao para esta amostra).
assim verificado se as funes de classificao obtidas com a amostra de calibrao apresentam resultados similares quando utilizadas em outro ambiente. Aps este momento, o modelo fica validado para uso prtico. ambiente Fundamentos Quantitativos
Mdulo 8
ANLISE DE VARINCIA MULTIVARIADA ( (MANOVA
OBJETIVO Apresentar a anlise de varincia mltipla como uma ferramenta utilizada para testar a diferena multivariada entre populaes, determinando como variveis categricas independentes afetam outras variveis dependentes, contnuas.
MANOVA
OBJETIVO Apresentar a anlise de varincia mltipla como uma ferramenta utilizada para testar a diferena multivariada entre populaes, determinando como variveis categricas independentes afetam outras variveis dependentes, contnuas.
Usos: - Estudar o efeito do sexo e do estado civil dos clientes, no seu consumo mensal de roupas e de alimentao.
Fundamentos Quantitativos
MANOVA
CASO: Estudar o efeito do sexo e do estado civil dos clientes, no seu consumo mensal de roupas e de alimentao. SITUAO Uma empresa de publicidade preparou trs campanhas para o lanamento de um novo produto. A primeira campanha tem um apelo humorstico, a segunda tem um apelo emocional e a terceira utiliza uma abordagem comparativa. Acredita-se tambm que o sexo afeta a preferncia pelo tipo de campanha. Objetivo: Selecionar a campanha a ser utilizada.
Fundamentos Quantitativos
MANOVA
PRINCPIO
Quando h 1 varivel dependente e 1 varivel independente:
(gasto com roupas) (sexo)
GH HOMENS
GM MULHERES
GASTO MENSAL COM ROUPAS
Ho: GH = GM Ha: GH GM
Fundamentos Quantitativos
PRINCPIO
GASTO MENSAL COM ALIMENTAO
MANOVA
(sexo)
GH HOMENS
GH GM MULHERES
MD
GM
G G AM H0: AH =
G RH G RH
RM
G G AM Ha: AH
G RM
Fundamentos Quantitativos
PRINCPIO
MANOVA
Fundamentos Quantitativos
METODOLOGIA
1 varivel dependente
(gasto com roupa)
MANOVA
1 varivel dependente
(gasto com roupa)
1 varivel independente
(sexo, definindo 2 grupos)
n variveis independentes
(sexo, estado civil,, formando k grupos)
Teste t (Student):
Ho: A = B (homens e mulheres apresentam o mesmo nvel de gastos) Ha: A
A = B = C .... = K
(todos os grupos apresentam o mesmo nvel de gastos com roupa)
A B Estatstica t = SE A B
Ha: (pelo menos um grupo apresenta diferente nvel de gasto com roupa )
Estatstica F
Fundamentos Quantitativos
MANOVA
METODOLOGIA
1 varivel dependente
(gasto com roupa)
m variveis dependentes
(gasto com roupa, alimentao, educao,)
1 varivel independente
(sexo)
1 varivel independente
(sexo)
MANOVA - 2 grupos
Teste t:
Ho: A = B
(homens e mulheres apresentam o mesmo nvel de gastos)
Teste F:
Ho:
1B 1 A 2 B 2 A = MB MA
Ha: A
Ha:
1B (homens e 1 A mulheres diferem 2 B 2 A em pelo menos um tipo de gasto) (ou, a diferena MB ocorre no todo MA Vide slide 166)
Fundamentos Quantitativos
METODOLOGIA
1 varivel dependente
(gasto com roupa)
MANOVA
m variveis dependentes
n variveis independentes
(sexo, estado civil,) k grupos
n variveis independentes
(sexo, estado civil,) k grupos
ANOVA:
Ho: A = B = C .... = K
MANOVA - k grupos:
1A 1B 2A 2B Ho: . = . = .... . . MA MB
1K 2K . . MK
Fundamentos Quantitativos
PROCEDIMENTO GERAL
Procedimento de Teste
1. 2. 3.
MANOVA
Calcular o valor resultante para o teste especfico, em funo dos dados da amostra Comparar com o valor tabelado da distribuio adotada, em funo do nvel de confiana desejado Rejeitar a hiptese Ho se valor calculado > valor tabelado
t=
XAXB SE X A X B
Comparar com o valor tabelado da distribuio t para o nvel de confiana adotado Teste F monocaudal Calcular o valor para a estatstica F (utilize a funo adequada no computador) Comparar com o valor tabelado da distribuio F para o nvel de confiana adotado Estas informaes so fornecidas pelo software atravs do valor P
Fundamentos Quantitativos
MANOVA
SITUAO
Uma empresa de publicidade preparou trs campanhas para o lanamento de um novo produto. A primeira campanha tem um apelo humorstico, a segunda tem um apelo emocional e a terceira utiliza uma abordagem comparativa. Acredita-se tambm que o sexo afeta a preferncia pelo tipo de campanha. Objetivo: Selecionar a campanha a ser utilizada, com base nos resultados da simulao apresentada no prximo slide.
Fundamentos Quantitativos
Avaliar os dados , para as 3 variveis dependentes e 1 varivel independente (sexo, formando 2 grupos): RESULTADOS: estatstica F
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 SEXO MASC MASC MASC MASC MASC MASC MASC MASC FEM FEM FEM FEM FEM FEM FEM FEM
MANOVA
HUMOR EMOC COMPAR 8 5 2 10 5 4 6 3 1 9 6 3 8 5 2 7 4 2 10 5 4 10 7 2 2 4 10 4 2 8 1 2 10 2 6 9 4 2 8 3 1 7 2 4 10 2 3 6
Rejeitada hiptese de igualdade entre os dois grupos, ou seja, homens e mulheres reagem diferentemente (Valor P < 0,05) Necessrio partir para anlise caso a caso Identificado diferenas individuais (valores P individuais)
SEXO; LS Means (DA DOS_MULTIV ARIADA ) Wilks lambda=.05715, F(3, 12)=65.991, p=.00000 Ef f ective hy pothesis decompos ition SEXO HUMOR HUMOR HUMOR HUMOR EMOC EMOC EMOC EMOC COMPA R Cell No. Mean Std.Err. -95.00% +95.00% Mean Std.Err. -95.00% +95.00% Mean 1 MA SC 8.500000 0.462910 7.507157 9.492843 5.000000 0.500000 3.927607 6.072393 2.500000 2 FEM 2.500000 0.462910 1.507157 3.492843 3.000000 0.500000 1.927607 4.072393 8.500000
Fundamentos Quantitativos
Avaliar os dados , para as 3 variveis dependentes e 1 varivel independente (sexo, formando 2 grupos): RESULTADOS: estatsticas univariadas (t de student)
Teste de diferena de mdias:
Com 95% de certeza, homens reagem melhor a campanhas com apelo humorstico Com 95% de certeza, no podemos afirmar que homens reagem melhor a campanhas com apelo emocional Com 95% de certeza, mulheres reagem melhor a campanhas com abordagem comparativa
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 SEXO MASC MASC MASC MASC MASC MASC MASC MASC FEM FEM FEM FEM FEM FEM FEM FEM
MANOVA
SEXO; LS Means (DA DOS_MULTIV ARIADA ) Wilks lambda=.05715, F(3, 12)=65.991, p=.00000 Ef f ective hy pothesis decompos ition SEXO HUMOR HUMOR HUMOR HUMOR EMOC EMOC EMOC EMOC COMPA R Cell No. Mean Std.Err. -95.00% +95.00% Mean Std.Err. -95.00% +95.00% Mean 1 MA SC 8.500000 0.462910 7.507157 9.492843 5.000000 0.500000 3.927607 6.072393 2.500000 2 FEM 2.500000 0.462910 1.507157 3.492843 3.000000 0.500000 1.927607 4.072393 8.500000
Fundamentos Quantitativos
SITUAO
MANOVA
Face aos resultados obtidos, a empresa de publicidade considerou a possibilidade de as campanhas serem bem seletivas e que talvez fosse possvel identificar influncias no somente do sexo. Solicitou assim que se inclusse os dados originalmente levantados de estado civil. Objetivo: Identificar outras influncias sobre os resultados das campanhas
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 SEXO MASC MASC MASC MASC MASC MASC MASC MASC FEM FEM FEM FEM FEM FEM FEM FEM EST.CIVIL CASADO SOLTEIRO CASADO SOLTEIRO CASADO CASADO SOLTEIRO SOLTEIRO CASADO SOLTEIRO CASADO CASADO SOLTEIRO SOLTEIRO CASADO SOLTEIRO HUMOR 8 10 6 9 8 7 10 10 2 4 1 2 4 3 2 2 EMOC 5 5 3 6 5 4 5 7 4 2 2 6 2 1 4 3 COMPAR 2 4 1 3 2 2 4 2 10 8 10 9 8 7 10 6
Fundamentos Quantitativos
> Ftabela (ou p<0,05) rejeita Ho (existe interao sexo x est. civil)
MANOVA
COM P A R .
10
MASC
M A SC
10
FE M
8 MASC 6
4 3
M A SC FEM
6
FE M
4 FE M 2 FE M
2 1 0 FE M
MASC
2
MASC
0 CA S A DO S OLTE IRO
CA SA DO
SOLTEIRO
CA S A DO
S OLTE IRO
Interao desprezvel
Fundamentos Quantitativos
MANOVA
Identificao das diferenas significativas entre grupos
Para resolver:
Estatstica F:
Com 95% de confiana, rejeita a hiptese de igualdade entre os grupos
ID 1 2 3 4 5 6 7 8 9 10
MANOVA
GRUPO GRUPO 1 GRUPO 1 GRUPO 1 GRUPO 1 GRUPO 1 GRUPO 2 GRUPO 2 GRUPO 2 GRUPO 2 GRUPO 2 X1 1 2 4 6 6 4 5 5 8 8 X2 3 5 7 11 12 5 5 6 7 9
Verifique e explique
GRUPO; LS Means (DADOS_MULTIVARIADA) Wilks lam bda=.19007, F(2, 7)=14.914, p=.00299 Effective hypothesis decom position GRUPO X1 X1 X1 X1 X2 X2 X2 X2 N Mean Std.Err. -95.00% +95.00% Mean Std.Err. -95.00% +95.00% GRUPO 1 3.800000 0.932738 1.649103 5.950897 7.600000 1.326650 4.540740 10.65926 5 GRUPO 2 6.000000 0.932738 3.849103 8.150897 6.400000 1.326650 3.340740 9.45926 5
Cell No. 1 2
Fundamentos Quantitativos
MANOVA
RESUMO
APLICAO: determinar se dois ou mais grupos so diferentes de forma multivariada (considerando simultneamente muitas variveis). RESULTADOS: estatstica F, MANOVA para mais de 2 ou mais grupos e outras estatsticas univariadas (t de student).
Fundamentos Quantitativos