3.1 O PROBLEMA DA REPRESENTAÇÃO DE MUITAS VARIÁVEIS EM DUAS
DIMENSÕES
Gráficos precisam ser apresentados em duas dimensões ou sobre papel ou na tela de um
computador. Eixos horizontais e verticais representam variáveis Ex.: ?????? Figura 3.1 Extensão alar representada contra o comprimento total para as 49 pardocas - Permite mostrar uma ou mais características dos objetos como sobreviventes e não- sobreviventes - Gráficos tridimensionais permitem mostrar três variáveis Ex.: ???????? Figura 3.2 O comprimento do bico e da cabeça representados contra o comprimento total e a extensão alar (todos em mm) para as 49 pardocas medidos por Hermon Bumpus (● = sobreviventes, ○ não-sobreviventes) - Representação para mais de três variáveis são discutidos a seguir.
3.2 REPRESENTANDO VARIÁVEIS ÍNDICES
- Variáveis índices são variáveis não observadas obtidas por combinação linear das variáveis originais. - O principal objetivo de muitos métodos multivariados é a geração de variáveis índices - Com os valores dos CP1, CP2, CP3 pode-se representar graficamente as relações entre objetos. Obs.: A desvantagem de representar muitas variáveis para duas ou três dimensões é que alguma diferença-chave entre os objetos possa ser perdida na redução
3.3 A REPRESENTAÇÃO DE DRAFTSMAN (MATRIZ DE DISPERSÃO)
CONSISTE: na representação simultânea de todos os pares de variáveis VANTAGEM: são necessárias apenas representações bidimensionais DESVANTAGEM: não mostram aspectos dos dados que somente seriam aparentes quando três ou mais variáveis são consideradas em conjunto e os objetos não são facilmente identificados, dificultando assim a identificação de quais são similares e quais são diferentes. Ex.: ??????? Figura 3.3 Representação de draftsman do número de pássaros e cinco variáveis medidas (mm) em 49 pardocas. As variáveis são: Comprimento total, extensão alar, comprimento do bico e cabeça, comprimento do úmero e da quilha do esterno, com uma variável adicional sendo o número de pardais (sobreviventes 1 a 21 e não-sobreviventes 22 a 49). - Retas de regressão são incluídas nesses gráficos algumas vezes. - Servem para mostrar relação também entre variáveis - Servem para mostrar existência entre quaisquer objetos com valores estranhos (DADOS DISCREPANTES)
Carlos Tadeu dos Santos Dias
REPRESENTAÇÃO DE DADOS MULTIVARIADOS 2
3.4 A REPRESENTAÇÃO DE PONTOS DE DADOS INDIVIDUAIS
CONSISTE na representação de cada um dos objetos para os quais as variáveis são medidas por um símbolo, com características diferentes desse símbolo variando de acordo com as diferentes variáveis. Ex.: ??????? Figura 3.4 Representação gráfica de medidas da mandíbula em diferentes grupos caninos usando (a) faces de Cernoff e (b) estrelas CONEXÃO VARIÁVEIS → CARACTERÍSTICAS: X1: Largura da mandíbula → tamanho do olho X2: Altura da mandíbula → tamanho do nariz X3: Comprimento do primeiro molar → tamanho da testa X4: Largura do primeiro molar → tamanho da orelha X5:Comprimento do primeiro ao terceiro molar → tamanho da boca X6:Comprimento do primeiro ao quarto pré-molar → tamanho do sorriso A variações nas diferentes características da face e estrelas pode ter diferentes impactos. Recomenda-se fazer diferentes atribuições alternativas de variáveis às características DESVANTAGEM: - a natureza subjetiva desse tipo de processo é claramente insatisfatória - dificilmente são encontradas em pacotes estatísticos.
3.5 PERFIS DE VARIÁVEIS
É outra forma de representar objetos agora por linhas que mostram o perfil dos valores das variáveis Ex.: ?????? Figura 3.5 Perfis de variáveis em ordem crescente de valores médios para as medidas da mandíbula para sete grupos caninos X1: Largura da mandíbula X2: Altura da mandíbula acima do primeiro molar X3: Comprimento do primeiro molar X4: Largura do primeiro molar X5:Comprimento do primeiro ao terceiro molar inclusive X6:Comprimento do primeiro ao quarto pré-molar inclusive
Representação alternativa: ??????? Figura 3.6 Uma maneira alternativa de mostrar perfis das variáveis usando colunas ao invés das linhas usadas na Figura 3.5