You are on page 1of 78

FitopacShell 1.6.

4
Manual

Verso Preliminar
G.J.Shepherd (2006)

Pr rs eli o m in ar

Ve

Table of Contents
Introduo .................................................................................................. 5
FitopacShell - Introduo Instalao Configurao Consideraes gerais Os tipos de dados usados por Fitopac A Tela Principal o menu principal Os botes de funes 5 7 7 8 8 9 10 10

Instalando e Configurando Fitopac ........................................................... 7

Utilizando Fitopac ....................................................................................... 8

comando arquivos .................................................................................... 12 Preparando e lendo dados ....................................................................... 14


Preparando dados Lendo e convertendo dados num arquivo FPD Examinando, editando e imprimindo dados Formatos de Arquivo Excel Lotus 123 PC-Ord ASCII/ASCII delimitado SYSTAT NT-SYS Cornell MVSP Convertendo dados crus em matriz Tipos de dados em matrizes Variveis mascaradas e Marcadores Importando e exportando matrizes Usando a planilha matriz arquivos matriz cabealho eliminando linhas ou colunas matriz transformar matriz juntar matriz espcies raras Nomes suspeitos Tela "Nomes suspeitos" Tela "Nomes duplicados" O formulrio de resultados Criando Grficos Criando grficos diretamente Diagramas de disperso Modificando as escalas A Tela de Opes em Diagramas de Disperso 14 14 15 16 16 16 16 17 17 17 17 17 18 19 20 21 22 26 27 28 28 29 32 33 34 35 37 39 39 41 43 43

Trabalhando com matrizes....................................................................... 18

Visualizando resultados de anlises....................................................... 37 Grficos em Fitopac ................................................................................. 39

Pr rs eli o m in ar

Ve

Diagramas de vetores Grficos de linha Dendrogramas Grficos de Barra Grficos de caixa Grficos 3D Calculando Parmetros Fitossociolgicos Coeficientes de semelhana e distncias em Fitopac A tela Coefs Modificando e manipulando arquivos de coeficients Coeficientes e distncias usados em Fitopac Introduo a anlise de Agrupamentos Tela de Anlise de Agrupamentos A Tela do Dendrograma Analisando grupos em dendrogramas Colorindo matizes Opes para dendrogramas

45 45 45 45 46 46 47 48 48 49 49 54 54 56 58 60 62 64 65 65 67 68

Parmetors fitossociolgicos ("PARAMS")............................................ 47 Calculando Distncias e Coeficientes de Semelhana.......................... 48

Anlise de Agrupamentos (Cluster Analysis) ........................................ 54

Ordenao 64

Dados faltando em anlises multivariadas............................................. 69


janela decorana janela twinspan

Ve

Chamando outros programas.................................................................. 70


70 71 75

Bibliografia ................................................................................................ 75
referncias bibliogrficas

Pr rs eli o m in ar

Ordenao - Introduo Biplot de Gabriel A Tela de Ordenao As Opes Visualizando e interpretando resultados de uma ordenao

Introduo
FitopacShell - Introduo

FitopacShell um programa para Windows que "traduz" parte do pacote FITOPAC para o ambiente Windows e que "embrulha" o resto dos programas originais do FITOPAC, permitindo utilizar todos os recursos de Windows para manipular arquivos, pastas, etc., sem a necessidade de entrar no DOS, facilitando o uso do pacote em Windows. Os programas individuais do pacote original (Prepare, Caderno e Params) continuam os mesmos - ainda so programas DOS mas foram recompilados para permitir o uso de mais memria, acomodando matrizes maiores (at 1000 x 1000 na atual verso). Adicionalmente, FitopacShell pode chamar os programas "DECORANA" e "TWINSPAN" do pacote Cornell para fazer anlises que no esto disponveis dentro do prprio FITOPAC. Os programas "DECORANA" e "TWINSPAN" so da autoria do Dr. M.O. Hill e NO so parte do FITOPAC. Se quiser us-los, precisa obter e instalar cpias (s copiar) dentro da pasta com os arquivos de FITOPAC, junto com os programas do prprio FITOPAC. Recomenda-se o uso da verso de Oksanen & Minchin (1997), que tem diversas correes e modificaes que tornam os programas mais confiveis.

Os programas que compem o pacote FITOPAC so descritos no Manual de Usurio distribudo em formato "Adobe Acrobat" [pdf] junto com este pacote. O atual arquivo de ajuda descreve somente o FitopacShell. Esta verso do FITOPAC, junto com o FitopacShell, esto sendo liberadas para uso geral, sem restries. Embora foi testado com diversos conjuntos de dados, este pacote deve ser tratado como preliminar, pois ainda apresenta diversas falhas e "bugs", especialmente nas verses "Windows", que devem ser utilizados com um certo grau de cautela. O programa considerado

Pr rs eli o m in ar

Ve

"Freeware" - isto , pode ser distribudo livremente, sem custo, mas no pode ser vendido ou modificado sem autorizao expressa do autor. Todos os direitos autorais so reservados pelo autor. Esta verso de FITOPAC deve ser chamada FITOPAC 1.6 em referncias bibliogrficas, e a data de publicao 30/11/2006.

George J. Shepherd Depto. de Botnica IB da UNICAMP CxP 6109 Campinas 13.083-970 SP, Brasil.

Embora no prometo que vou poder resolver individualmente todos os problemas que surgem no uso do FitopacShell e FITOPAC, importante que os usurios me avisam de "bugs" e dificuldades encontrados, especialmente se estes causam erros mais srios de clculo ou inutilizam parte dos recursos dos programas. Se possvel, encaminhe uma descrio do erro encontrado, junto com uma cpia do conjunto de dados sendo utilizados e uma descrio de que estava sendo feito quando ocorreu o erro para:george@unicamp.br.

Para notcias e discusso do Fitopac, consulte o forum fitopac no site: "http://taxondata.org/forum/index.php?board=12.0" Agradecimentos a Eduardo Dalcin!

Pr rs eli o m in ar

Ve

Instalando e Configurando Fitopac


Instalao
Ainda no est pronto Sorry !

Configurao
Ainda no est pronto Sorry !

Pr rs eli o m in ar
7

Ve

Utilizando Fitopac
Consideraes gerais
Em geral, quando se executa anlises em Fitopac, estas exigem, de entrada, algum arquivo de dados no formato apropriado, e produziro resultados na forma de texto e grficos, alm de outros arquivos que podem ser utilizados em outras anlises. importante lembrar que os resultados de uma anlise NO so gravados automaticamente na maioria dos casos o usurio deve solicitar explicitamente a gravao do arquivo de resultados, se deseja manter um registro da anlise que foi realizada. A sada em forma de texto pode ser visualizada usando um boto marcado "visualizar resultados", e cumulativa, armazenando os resultados de todas as anlises feitas desde o incio at desligar o programa, podendo ser gravada em forma de arquivo "rtf" ou "txt". Grficos so gravados individualmente, ou podem ser copiados para a rea de transferncia ("clipboard") e colados em documentos.

Formulrio de resultados texto

dados

arquivo Fitopac

arquivos texto Fitopac

Os tipos de dados e os arquivos usados esto descritos na seo "Os tipos de dados usados por Fitopac " e o uso da sada texto na seo "Visualizando resultados de anlises ".

Os tipos de dados usados por Fitopac


Fitopac utiliza trs tipos de conjuntos de dados:

1.

"dados crus" so os dados resultantes de levantamentos fitossociolgicos, que contem as medidas de indivduos que foram includos no levantamento [levantamentos por parcelas ou por quadrantes ou variantes destes mtodos] ou de contatos individuais [levantamentos que utilizam o "mtodo de agulhas"]. Tipicamente, para cada indivduo, tem medidas de dimetro, altura e um cdigo de espcie e so agrupados por parcela ou por ponto de amostragem [mtodo de quadrantes]. Estes dados so armazenados em arquivos "FPD" {FitoPac-Dados} e so o ponto de partida para todas as anlises em Fitopac. Nesta verso, a entrada destes dados e via arquivos "ASCII" que podem ser criados com um editor de texto (por ex. o "notepad" que vem junto com todas as verses de Windows) ou usando um processador de texto mais sofisticado como "Microsoft Word" ou "Open Office Writer" e gravando como "somente texto". Planilhas como "Excel" podem ser usadas, mas necessrio tomar muito cuidado com o arranjo de dados em colunas, e gravar a verso final como texto para utilizar esta opo com sucesso. Detalhes do formato de arquivo esto no manual da verso 1.0 do Fitopac, distribudo junto com a atual verso.

Pr rs eli o m in ar
grficos

Ve

arquivos de dados

2.

"matrizes amostra x espcie" contem dados representando a quantidade de cada espcie presente em cada uma das amostras, na forma de uma matriz com uma linha para cada amostra e uma coluna para cada espcie. Estes dados so armazenados em arquivos "FPM" {FitoPac-Matriz}, e geralmente so gerados a partir de arquivos FPD, utilizando o comando/boto "Criamat". Estas matrizes tambm so o formato natural para dados ambientais, onde foram medidas algumas caractersticas do ambiente para cada uma das amostras de um levantamento, ou para dados morfolgicos, qumicos, etc. quando se deseja utilizar o programa para anlises fenticas (taxonomia numrica). Assim, embora Fitopac foi concebido principalmente para anlise de dados fitossociolgicos, na prtica pode ser utilizado para qualquer situao onde anlise multivariada ou taxonomia numrica apropriado. Matrizes deste tipo podem ser importadas/exportadas para diversos formatos, incluindo Excel, "SYSTAT", "PC-Ord" e "NTSYSpc", permitindo que Fitopac seja utilizado junto com outros programas de anlise estatstica ou multivariada. "matrizes de distncias ou coeficientes de semelhana" estes matrizes contm dados que representam distncias ou grau de semelhana entre amostras/objetos e so essenciais para o uso de anlise de agrupamento o para algumas formas de ordenao, como PCO. So armazenadas em arquivos "FPC" {FitoPac-Coeficientes}. Estas matrizes geralmente so geradas a partir de uma matriz FPM, utilizando o comando "Coef", ou importadas/exportadas em alguns formatos (NTSYSpc, SYSTAT).

3.

As interligaes entre os tipos de dados/arquivos so resumidas neste grfico:

A Tela Principal
A tela principal que abra quando o programa acionado permite escolher arquivos e o tipo de anlise que quer fazer. Estas funes podem ser usadas via o menu principal ou utilizando os botes de funo.

Pr rs eli o m in ar

Ve

o menu principal
O menu principal fornece diversas opes de anlise ou manipulao de dados. Note que a maioria dos itens disponveis no menu principal estaro disponveis somente quando um arquivo de dados for selecionado, e podem variar, de acordo com o tipo de arquivo selecionado. Se no tiver um arquivo selecionado, esto disponveis somente as opes de configurao do FITOPAC. Os comandos do menu tambm podem ser acionados via os botes de funo. Os principais comandos so :-

Arquivos - permite selecionar um ou mais arquivos de dados para anlise ou processamento, alm de
permitir abrir arquivos de resultados de anlises j concludas.

coNfigurar - permite modificar a configurao do pacote FITOPAC. Dados - este comando usado para ter aceso aos programas de manipulao de dados - CADERNO e
CRIAMAT para arquivos FPD; MATRIZ para os arquivos FPM, e PREPARE para converso de dados crus (DAD e NMS).

paRametros - chama o programa "PARAMS" para calcular parmetros fitossociolgicos para dados
de indivduos de um levantamento. Este comando est disponvel somente com arquivos FPD.

Multivar - chama os programas de anlise multivariada "COEF" (clculo de coeficientes de

Cornell - chama os programas "DECORANA" e "TWINSPAN" do pacote de programas da


universidade de Cornell. Estes programas no fazem parte do FITOPAC e voc deve obter cpias (disponveis grtis na Internet) e copi-los na mesma pasta onde est instalado o prprio FITOPAC, antes de tentar usar este comando.

Os botes de funes
Muitas das tarefas comuns podem ser acionados diretamente pelo uso dos botes de funes, sem a necessidade de passar por todos os passos do menu principal. Estes botes esto agrupados de acordo com o tipo de funo que executam, e sua disponibilidade depende do tipo de arquivo selecionado, ou se um arquivo foi selecionado em primeiro lugar. Arquivos funes de abrir, ler, exportar, importar arquivos de diversos tipos.

10

Ve

similaridade e distncias), "CLUSTER" (anlise de agrupamentos) e "ORD" (ordenao). Disponvel somente para arquivos FPM e FPC.

Pr rs eli o m in ar

Modificar dados modificar matrizes de dados ou de coeficientes de semelhana ou distncia.

Anlise multivariada (opes disponveis com arquivos que contm matrizes de dados ou coeficientes de semelhana/distncia) calcular coeficientes de semelhana/distncia com programa "COEF", fazer anlise de agrupamento com programa "CLUSTER" (somente arquivos FPC), fazer ordenao com programa "ORD" (arquivos FPM PCA, CA; arquivos FPC PCO) ou utilizar os programas "DECORANA" e "TWINSPAN" do pacote Cornell [estes programas no so parte do FITOPAC !]

Ve

Fitossociologia (opes disponveis com arquivos de dados do tipo "FPD") fazer anlises fitossociolgicas (calcular parmetros, etc.) e visualizar dados ou gerar matrizes a partir dos dados.

Pr rs eli o m in ar

11

comando arquivos
O comando Arquivos abre diversos subcomandos que permitem manipular arquivos

Abrir abre um arquivo de dados FITOPAC. Para a maioria de anlises, estes arquivos sero dos tipos:
FITOPAC - dados (*.FPD), que contem dados de indivduos de um levantamento fitossociolgico FITOPAC - matriz (*.FPM), que contem uma matriz de dados para anlise multivariada, etc. FITOPAC - coeficientes (*.FPC), que contem coeficientes de semelhana ou distncias entre objetos para anlise de agrupamento ou ordenao. Dados crus so os arquivos de nomes e dados numricos usados para gerar um arquivo FPD. Tem as extenses "NMS" e "DAD", respetivamente. Veja "Preparando Dados " para mais informaes. . Excel Lotus123 PC-Ord Cornell ASCII NTSYS Outros formatos tambm podem ser lidos, e incluem:

SYSTAT

ASCII delimitado (ou "CSV") MVSP

Dados p/ PREPARE- No caso de dados de indivduos que ainda no foram convertidos para o formato FPD (dados crus), onde se pretende usar o programa "PREPARE" para fazer esta converso, necessrio especificar um arquivo de dados numricos (geralmente com a extenso ".DAD") no subcomando "Dados" e um arquivo de nomes (de famlias e espcies - geralmente com a extenso ".NMS") no subcomando "Nomes". Os detalhes do formato e preparao deste arquivos so descritos no "Manual de Usurio" em formato "Adobe Acrobat" (.PDF) distribudo dentro deste pacote.

dados).

12

Pr rs eli o m in ar
Novo - Gerar uma nova matriz de dados em branco (para entrada de

Ve

Exportar Matriz - exportar uma matriz FITOPAC para outro


formato (PC-Ord, etc.)

Visualizar resultados abre o arquivo de resultados acumulados durante a atual sesso. Este arquivo de listagem contm todos os resultados das anlises que mandou imprimir durante a atual sesso de uso de Fitopac. Pode imprimir ou gravar os resultados como texto ou como um arquivo "Rich Text Format - rtf" que pode ser lido e importado diretamente por programas como "Word".

eXaminar arquivo- abre uma tela mostrando o contedo de um arquivo de texto e permite fazer editorao deste texto, alem de grav-lo em formato "Rich Text Format - rtf" que pode ser lido e importado diretamente por programas como "Word".

examinar Grfico- de modo semelhante, abre uma tela que permite examinar arquivos contendo grficos produzidos pelos programas do pacote FITOPAC Saida - Voc pode modificar o nome do arquivo de sada, gerado automaticamente
pelo FITOPAC. Geralmente este ter o formato "XXX.LST", onde XXX o nome do arquivo original de dados e a extenso LST indica uma listagem, e indicado no terceiro painel da tela principal. Se quiser, pode modificar este nome, escolhendo ou criando um novo nome utilizando este comando. Note que os programas do FITOPAC geralmente vo anexar os resultados produzidos e no vo sobrescrever os resultados obtidos anteriormente a partir de uma outra anlise do mesmo arquivo.

Pr rs eli o m in ar
Sair sair do programa

Ve

13

Preparando e lendo dados


Preparando dados
A relao entre os principais tipos de dados em Fitopac pode ser vista na seo tipos de dados usados por Fitopac. A preparao inicial dos "Dados Crs", ie. os dados de medidas de plantas individuais geralmente usados para anlises fitossociolgicas, est descrita no manual do Fitopac v. 1 que distribudo junto com Fitopac 1.6 como arquivo PDF. Em sntese, necessrio preparar arquivos contendo os nomes das espcies encontradas (num formato especfico) e, num segundo arquivo, os dados numricos descrevendo os indivduos. Estes so arquivos "ASCII" e podem ser produzidos usando qualquer editor ou programa capaz de gravar dados neste formato, como "notepad" do Windows, Microsoft Word (gravar como "somente texto") ou at planilhas com "Excel" (mais difcil pois a sada pode ser difcil de controlar). Estes arquivos depois so convertidos num arquivo FPD pelo programa PREPARE. este arquivo FPD que utilizado pelos outros programas do pacote. Dados em forma de matrizes podem ser entrados diretamente, utilizando a planilha de dados do Fitopac.

Lendo e convertendo dados num arquivo FPD


Para produzir um arquivo "FPD", so necessrios dois arquivos de entrada: um contendo os nomes dos txons no levantamento (com extenso "NMS"),e outro contendo os dados numricos (com extenso "DAD"). As extenses no so obrigatrios, mas tornam ao uso do programa mais fcil pois o Fitopac sabe quais arquivos procurar e gera todos os outros nomes automaticamente, quando se usa a extenso padro para os arquivos de entrada.

Para iniciar o processo, pode usar o boto "Dados para Prepare" ou "Arquivos/Dados p/ Prepare" no menu principal. O programa abre uma pequena janela , onde pode escolher os arquivos de entrada.

Aps de escolher os arquivos e usar o boto "ok", esta tela fecha e o prximo passo de "clicar" no boto "Prepare" ou em "Dados/Preparar" no menu principal. O programa principal ento chama o programa DOS "Prepare" para completar o processo de converso dos dados. Detalhes do programa Prepare esto descritas no manual da verso 1.

14

Ve

Os detalhes da preparao destes arquivos esto descritos no manual da verso 1 do Fitopac que acompanha a atual verso na forma de um arquivo "PDF" (manual PDF).

Pr rs eli o m in ar

A atual verso do Fitopac gera diversos nomes de arquivos, alguns estranhos como "ZZZZFPD.tmp". Sugiro no modificar estes nomes, pois o FitopacShell configurado para utiliz-las automaticamente e vai gerar nomes mais apropriados como parte do processamento ps-Prepare, apagando ou modificando os nomes que aparecem na janela principal do programa Prepare.

Examinando, editando e imprimindo dados


Para examinar, listar, ordenar e exportar dados de levantamentos, Fitopac utiliza o programa DOS "Caderno", que pode ser acionado atravs do boto Caderno ou menu "Dados/Caderno". Alm das listagens dos dados, Caderno pode produzir uma Curva de Coletor, bastante usada para determinar se a amostragem de uma rea est razoavelmente completa ou no. Este programa abre numa janela DOS, e seu uso parecido com os outros programas mencionados no manual v1, embora no esteja formalmente descrito naquele manual.

O programa Caderno, infelizmente, ainda est incompleta e s permite usar algumas opes do menu principal: Filtro especifica um filtro para limitar os dados que so lidos por ex. excluir indivduos com DAP < 10cm e altura < 5 m e incluindo somente parcelas 10-20. Ler ler os dados

Editar Editar os dados no momento, isso pode ser feito principalmente com os dados numricos e permite somente certas opes Curva calcula e mostra uma Curva de Coletor.

Editando os dados.

dentro desta opo, as seguintes operaes so implementadas Famlias editar nomes

Espcies editar nomes, ordenar (por famlia e depois espcie ou diretamente por espcie) e gravar os nomes num arquivo de texto Amostras editar nomes Dados (numricos) ordenar (por diversos critrios como altura, dimetro, nmero de indivduo, etc), Imprimir (para um arquivo) e exportar (para um arquivo ASCII). Esta ltima opo bastante til se quiser analisar os dados com outros programas como "SYSTAT" que podem ler o arquivo ASCII resultante.

Curvas de Coletor O programa tem opes para produzir diversos tipos de curva que incluem: "normal" a curva construda a partir dos dados na sua ordem original de entrada no arquivo de dados Inversa a curva construda a partir dos dados em ordem inversa i.e. do final do arquivo at o incio

Pr rs eli o m in ar

Ve

15

randmica produzir uma curva onde a ordem de entrada das amostras aleatria randmica n repete a curva randmica "n" vezes, onde o "n" determinado pelo usurio. as outras opes so diferentes combinaes destas curvas bsicas. A combinao randmica-n + normal + inversa particularmente interessante pois ajuda a detectar gradientes de riqueza ou descontinuidades num gradiente, se as amostras foram entradas em seqncia, seguindo o gradiente.

Formatos de Arquivo
Embora tem seus prprios formatos de arquivo que maximizam as informaes armazenadas e facilitam o uso do pacote, Fitopac pode importar e exportar diversos formatos de arquivo para permitir intercmbio de dados com outros programas que tem facilidades que o Fitopac no possui. Em todos os casos, a importao/exportao limitada a casos de matrizes de estrutura simples, e no possvel trabalhar com estruturas de dados muito complexas.

Excel
Arquivos que usam o formato da planilha do Microsoft Office, Excel. Capaz de ler somente planilhas simples, com os nomes das variveis (descitores) na primeira linha e os nomes dos objetos (amostras ou UTOs) na primeira coluna, e o resto da planilha contendo dados numricos ou variveis texto. Note que o programa no capaz de interpretar corretamente planilhas que tem mais que uma linha de cabealho, clulas fundidas ou formatao mais sofisticada. O padro usado pelo programa Microsoft Excel. Amplamente usado por outros programas estatsticos. {Novidade da verso 1.6} (*.XLS) (*.SYS, *.SYD)

Lotus 123

Este formato foi usado pelo (ento) popular programa de planilha, Lotus 123. Chega perto a ser um formato universal para pacotes estatsticos, pois quase todos so capazes de ler estes arquivos e alguns programas (como PC-Ord) ainda usam este formato como padra. Fitopac capaz de intrpretar somente planilhas simples, com os nomes das variveis (descritores) na primeira linha, os nomes dos objetos (amostras, UTOs) na primeira coluna e o resto dados numricos ou de texto. Note que o programa no capaz de interpretar corretamente planilhas que tem mais que uma linha de cabealho, clulas fundidas ou formatao mais sofisticada. (*.WK1)

PC-Ord
So arquivos usados pelo programa PC-Ord. Na verdade so arquivos Lotus 123 com dados sobre o nmero de colunas e linhas em clulas especficas, alm de algumas outras restries. O programa tenta determinar se o arquivo tem o formato correto, e se no tiver, permite tentar abrir o arquivo como uma planilha Lotus 123 simples. (Ambos usam a mesma extenso "wk1") (*.WK1)

16

Pr rs eli o m in ar

Ve

ASCII/ASCII delimitado
Arquivos ASCII contem somente caracteres, espaos e quebra de linha, sem cdigos de controle, formatao, etc. ( equivalente opo "somente texto (*.txt)" em MS-Word). Na forma delimitado, cada nmero separado por um caractere (tab, vrgula, etc.), que pode ser especificado, e texto colocado entre aspas ("texto"). equivalente ao formato CSV usado por Excel e diversos outros programas. (arquivos *.TXT; *.CSV)

SYSTAT
O formato usado pelo pacote estatstico "SYSTAT" (*.SYD; *.SYS)

NT-SYS
O formato usado pelo programa de taxonomia numrica "NT-SYS" (*.NTS)

Cornell

MVSP

O formato usado pelo programa MVSP (*.MVS).

Pr rs eli o m in ar

O formato "Cornell" (*.DTA), utilizado pelos programas do pacote Cornell como TWINSPAN e DECORANA.

Ve

17

Trabalhando com matrizes


Convertendo dados crus em matriz
Embora o ponto de partido para anlises fitossociolgicos normalmente seja o arquivo de dados crus (arquivo "FPD"), para realizar anlises mutivariadas ou diversas outras tipos de estudo, necessrio converter os dados para o formato de uma matriz "amostras x espcies". Esta matriz tem as amostras (por ex., parcelas) como linhas e as espcies como colunas, e normalmente registra o nmero de indivduos de cada espcie presentes em cada amostra. Em termos mais gerais, esta matriz tem objetos (Amostras, UTOs, indivduos, etc.) nas linhas e descritores (caracteres, variveis) nas colunas, sendo utilizado em praticamente todas as situaes onde se deseja usar anlise multivariada ou taxonomia numrica. Esta operao est disponvel somente para arquivos com dados de levantamentos com parcelas ou de "agulhas". No caso de levantamentos usando quadrantes, embora seria possvel tratar os pontos de amostragem como amostras, no se recomenda este procedimento pois cada ponto tem um numero baixo e fixo de indivduos, e no pode ser considerado como uma amostra representativa da comunidade Para converter dados crus de um arquivo FPD em matriz, carregue primeiro o arquivo FPD que deseja converter e use o boto "Criamat" ou item "Dados/Criar Matriz" do menu para abrir a tela de criao de matrizes

As principais opes disponveis so:

Quero eliminar espcies raras permite retirar espcies raras enquanto a matriz preparada. prtica comum retirar as espcies raras quando se utiliza anlises multivariadas, pois normalmente contribuem poucas informaes teis e tendem a dificultar a realizao e interpretao da anlise, sendo muito numerosas, especialmente em comunidades com grande diversidade. Ao optar para remoo das espcies raras, o programa abre uma tela que oferece algumas opes de critrios para escolher as espcies que sero descartadas. A eliminao de espcies raras deve ser feito com muito cautela no existem critrios objetivos para decidir o nvel de corte usado, e em casos onde muitas espcies raras ocorrem um uma ou poucas amostras, podem indicar uma mudana em condies ambientais que poderia passar despercebida se todas estas espcies fossem eliminadas. Recomenda-se, portanto, bastante cautela na remoo de espcies raras em muitos casos melhor gerar uma matriz completa e depois testar o efeito de remoo de espcies usando o comando "outros/remover espcies raras" na planilha, em vez de eliminar estas espcies imediatamente. Boto "Filtro" permite estabelecer um filtro de dados antes de gerar a matriz. Com um filtro, possvel gerar matrizes com caractersticas especficas por exemplo eliminando indivduos com dimetros e/ou alturas abaixo ou acima de limites especificados no filtro. Este recurso particularmente til quando se deseja limitar a anlise a um subconjunto dos dados por exemplo, para comparar um levantamento com parcelas onde o limite de incluso de indivduos foi de trs cm de dimetro com outro que utilizou 10 cm, basta retirar todos os indivduos com dimetros abaixo de 10 cm quando se gera a matriz (note que isso no funcionaria com um levantamento do tipo "quadrantes"!).

18

Pr rs eli o m in ar

Ve

tipo de matriz permite escolher entre matrizes de nmero de indivduos, rea basal, volume ou presena/ausncia. Embora nmero de indivduos seja comumente empregado, este parmetro pode dar uma importncia exagerada para espcies que so numerosas mas ocorrem somente como indivduos de pequena porte. Nestas circunstncias, rea basal ou, mais ainda, volume talvez dariam uma aproximao melhor verdadeira importncia das espcies, pelo menos em termos de biomassa. Volume calculado como a soma dos volumes dos indivduos, tratando cada um como um cilindro de dimetro constante. No caso de uma matriz tipo presena/ausncia, o programa coloca o valor "1" em qualquer clula da matriz onde uma espcie ocorre e "0" em clulas onde no ocorre.

Tipos de dados em matrizes


Fitopac distingue entre 4 tipos de variveis: 1) Binrias 0 ou 1 ( ou sim/no; presente/ausente; etc.) Registram somente presena/ausncia e "dado faltando" 2) Multiestado Variveis que contm valores discretos, geralmente representando um nmero limitado de classes, e que so tratados no Fitopac como no-ordenados. Isto , no existe uma ordem evidente para os diferentes estados um exemplo seria cor de flor. 3) Quantitativas (contnuas) contm medidas continuas como comprimento, peso, temperatura, volume, etc. Dados multiestado ordenados devem ser designados como quantitativas, embora freqentemente no apresentam escalas uniformes. 4) Texto Variveis contendo texto no podem ser usadas para anlises numricas, mas em muitos casos so teis como "etiquetas" suplementares, alm dos nomes dos objetos. Podem armazenar valores como nomes de famlia em arquivos com espcies como objetos, nomes de localidades em matrizes de levantamentos, etc.
Os diferentes tipos de varivel podem ser misturados na mesma matriz e sero tratadas em diferentes maneiras, dependendo da anlise sendo feita. Na maioria das anlises numricas, variveis texto so descartadas, mas podem ser usadas para "etiquetar" pontos em grficos e outras funes onde importante identificar observaes individuais (neste caso, interessante designar estas variveis como "marcadores" - veja "Variveis mascaradas e Marcadores"). Embora variveis texto podem ser misturadas com variveis numricas, note que esta mistura impe algumas restries na matriz, a principal sendo que no possvel transpor matrizes com variveis texto. Fitopac trata uma matriz como tendo as variveis ou descritores nas colunas da matriz. As vezes, pode ser interessante transpor a matriz, tratando o que eram os objetos nas linhas como descritores, nas colunas (por exemplo, para fazer anlise de agrupamento das variveis). Isso s permitido se a matriz for inteiramente numrica. Quando variveis texto esto presentes, as colunas resultantes seriam heterogneas, contendo nmeros em algumas linhas e texto em outras. No possvel tratar uma coluna deste tipo como uma varivel e, portanto, no permitido transpor matrizes mistas. Se essencial transpor uma matriz para realizar algum tipo de anlise, necessrio excluir as variveis texto primeiro, usando o boto direito para selecionar variveis individuais na planilha ou o boto "excluir" na tela de edio dos dados do cabealho da matriz (veja "matriz cabealho "), mais conveniente para nmeros maiores de variveis Os diferentes tipos de variveis podem ser convertidos de um para outro, usando a planilha (boto direito ou menu "transformar "), mas este processo tambm tem limitaes. Mais especificamente, informaes so perdidas quando se converte no sentido "quantitativo > multiestado > binrio" e no podem ser recuperadas. De maneira semelhante, variveis binrias podem ser convertidas em variveis quantitativas, mas contero somente dois valores : 0,0 e 1,0.

Os diferentes tipos de varivel so destacadas na planilha pela cor do texto, sendo que variveis quantitativas tem o texto em preto e os outros tipos em outras cores.

Pr rs eli o m in ar
(verde)

Ve

19

Variveis mascaradas e Marcadores


Em muitos casos, uma matriz pode conter variveis que so cdigos que definem o tipo de objeto em cada linha, ou alguma varivel que no queremos por outros motivos incluir dentro de uma dada anlise. Estas variveis podem ser mascaradas indicando para o programa que estas variveis no devem ser usadas, transformadas, etc., sem exclu-las da matriz. Este recurso particularmente til quando se deseja analisar um subconjunto das variveis de uma matriz, sem a necessidade de gerar uma outra cpia da matriz contendo somente as variveis selecionadas. Variveis podem ser mascaradas utilizando o boto direito na planilha ou o boto "mascarar" na tela de "cabealho da matriz" (mais conveniente quando se deseja mascarar um nmero maior de variveis).

Mudana importante na verso 1.6 ! Usurios de verses anteriores de Fitopac devem notar que a atual verso trata variveis mascaradas diferentemente quando a matriz gravada. Na atual verso, variveis mascaradas so mantidas dentro da matriz e marcados como mascaradas no arquivo, permanecendo presentes e mascaradas na prxima leitura do arquivo. Nas verses anteriores, estas variveis foram descartadas quando a matriz foi gravada. Variveis marcadores tem uma funo semelhante, mas recebem um tratamento diferenciado. So variveis usadas para marcar objetos na matriz, e que so tratadas como sendo permanentemente ligadas com estes objetos, sendo copiadas para matrizes de resultados tambm. Este comportamento muito til em casos onde tem vaiveis auxiliares que se quer projetar sobre os resultados de ordenaes e outras anlises se so designadas variveis marcadores, sero transportadas para as matrizes de resultados e podem ser utilizados para colorir grficos ou separar diferentes classes de objeto. Um exemplo seria uma varivel indicando sexo numa matriz de medidas morfolgicas, onde se quer fazer uma anlise de Componentes Principais somente com os dados quantitativos mas quer depois "marcar" os indivduos como masculina ou feminina na anlise dos resultados. Neste caso, a varivel binrio mascarada e designada uma varivel marcadora - assim no ser includa na anlise mas estar disponvel nas tabelas de resultados para permitir levar a anlise em diante. Note que as propriedades "mascarada" e "marcadora" so independentes, e podem ser aplicadas em qualquer combinao, mas a situao mais comum seria aquela onde a varivel marcadora e mascarada. O comportamento das variveis resumido na seguinte tabela:

mascarada no

no

sim

no

no sim

sim sim

20

Pr rs eli o m in ar
MARCADORA ANLISE (EX. PCA)
includa na anlise no includa na anlise includa na anlise no includa na anlise

Ve

tabelas de resultados no ser transportada para as matrizes de resultados no ser transportada para as matrizes de resultados ser transportada para matrizes de resultados ser transportada para matrizes de resultados

Importando e exportando matrizes


Fitopac pode importar e exportar matrizes em diversos formatos e pode ser usado para "traduzir" os arquivos de um pacote para outro. importante notar, porm, que existem severas limitaes no tipo e formatao de matriz que pode ser importado - em geral, Fitopac s consegue ler/gravar matrizes simples onde a primeira linha contem os nomes das variveis (colunas) e a primeira coluna contm identificadores dos objetos (amostras, UTOs) e o resto da matriz contm somente dados. Matrizes com formatao mais elaborada, com diversas linhas de cabealho ou com subtabelas, grficos, etc. no sero interpretadas corretamente e devem ser simplificadas antes de tentar import-las. De qualquer modo, recomenda-se que a matriz importada seja inspecionada com muito cuidado para verificar se no ocorreu algum tipo de erro durante a "traduo". Embora o programa tenta detectar diversos tipos de erro (por exemplo, nomes duplicados), praticamente impossvel prever todas as possveis combinaes de dados e formataes que podem ser empregadas e que podem gerar problemas na importao. Os principais tipos de arquivo que podem ser lidos ou convertidos em matrizes Fitopac so :

FPM - Fitopac Matriz - arquivo padro FPM do Fitopac, o formato preferido para todas as operaes com matrizes. FPC - Fitopac Coefs - Arquivos FPC contm coeficientes de semelhana ou distncias, armazenando somente uma metade de uma matriz quadrada e simtrica. A planilha Fitopac pode ser usado quando se quer entrar com uma matriz de coeficientes de similaridade ou distncia que no foram calculados pelos programas de Fitopac (por exemplo, tirados de um livro ou publicao). necessrio entrar somente a metade da matriz ( esquerda, em baixo do diagonal), e ser exportada em formato correto para uso com CLUSTER e ORD no Fitopac (*.FPC). Quando se quer transformar uma matriz de coeficientes numa matriz quadrada, simtrica, use a opo "Exportar" da tela de modificao de matrizes de coeficients (veja "Modificando e manipulando arquivos de coeficientes " para mais detalhes). ASCII e ASCII - delimitado Excel Lotus 123 SYSTAT NT-SYS

PC-Ord Cornell MVSP

Pr rs eli o m in ar
21

Ve

Usando a planilha
A planilha permite examinar os dados, modificar os valores, transformar os dados e diversas outras operaes que podem ser teis para manipular matrizes. A planilha de FitopacShell simples, mas permite uma srie de modificaes teis, incluindo modificaes dos dados, transformar ou eliminar ou mascarar linhas ou colunas individuais, ordenar as linhas e colunas, entre outras. Para ver as funes dos diferentes botes, clique na parte correspondente da figura:

Gravar grava a matriz atual, com diversas opes de formato indicadas no menu "pop-up" que aparece Visualizar- imprime a matriz no arquivo de resultados e abre uma tela mostrando os resultados.... Transpor usado para transpor as linhas e colunas da matriz. Esta opo est disponvel somente para matrizes inteiramente numricas (i.e. no podem ter variveis tipo "texto") Transformar permite transformar a matriz inteira ou somente variveis selecionadas. Abre uma janela de Opes de Transformao. Se quiser transformar somente uma ou duas variveis, pode ser vantajosa utilizar a opo de "transformar" no menu "pop-up" obtido quando se clica no boto direito com o mouse. Cabealho- permite alterar os dados de cabealho da matriz (ttulo, responsvel, etc.) e permite editar os nomes das colunas e linhas da matriz. Abre a janela Modificar Cabealho Juntar - permite combinar dados de duas matrizes em diferentes maneiras. Abre a janela de fuso de matrizes Outros fornece uma srie de outras funes para manipular dados e matrizes , disponveis a partir de um menu "pop-up" Sair volta ao programa principal. Note que eventuais mudanas feitas na matriz NO SO GRAVADOS automaticamente se quiser manter as mudanas permanentemente, necessrio gravar a nova verso da matriz - ou com o mesmo nome (vai sobrescrever a matriz original), ou com outro nome, caso queira preservar a verso original. Em casos onde quer manter as modificaes somente para uso imediato em alguma anlise, no necessrio gravar, mas a prxima vez que a matriz carregada, vai voltar ao seu estado original. Quando o programa detecta alguma mudana na matriz, o boto de gravao fica destacado e ao sair da planilha sem gravar, perguntar se voc no quer gravar a matriz modificada.

22

Pr rs eli o m in ar

Ve

Destacando variveis e valores- a planilha mostra os variveis mascaradas ou designadas como "marcadores" com uma cor de fundo diferente do resto da planilha. Variveis (colunas) ou objetos (linhas) mascaradas ficam com fundo "ciano", variveis marcadores, mas no mascaradas em verde, e variveis marcadores e mascaradas em azul plido. Opcionalmente, pode destacar clulas com valores negativos, com valores iguais a zero e com dados faltando, clicando na caixinha apropriada no painel "destacar". Esta opo til para localizar valores inesperados em matrizes grandes que poderiam causar problemas com transformaes, mas normalmente deve ser desligada para no deixar a planilha visualmente confusa e "poluda" . As cores usadas so mostradas abaixo:

Editando nomes- normalmente a planilha mantm os nomes das colunas e linhas separadas e estes no podem ser modificados. Em casos onde se quer modificar algum nome, esta opo desliga a proteo dos nomes e religa quando clica de novo. Espelhar - Esta opo fornecida para casos onde se quer criar uma matriz quadrada e simtrica depois de importar um arquivo de coeficientes de similaridade ou distncia. Este normalmente importado como uma matriz triangular, com somente a parte inferior preenchida. Para completar o tringulo superior da matriz, use esta opo. Se voc utiliza esta opo com uma matriz retangular, no simtrica, a parte da matriz acima do diagonal ser destruda e substituda pela parte abaixo do diagonal. Menu "pop-up"- ao clicar o boto direito do mouse, aparece um menu do tipo "pop-up" que traz uma serie de opes relacionados com a coluna ou linha ativa (onde est a clula ativa, com texto marcado com outra cor). Este recurso permite fazer diversas modificaes rapidamente quando envolvem somente uma coluna ou linha da matriz. Este menu est dividido numa seo "colunas" e outra de "linhas", mas ambas tem exatamente as mesmas funes, que so:

Pr rs eli o m in ar

Ve

23

Mascarar - mascarar a linha atual da matriz. Neste caso, a linha mascarada, mas no eliminada da matriz. Pode ser desmascarada mais tarde. Linhas mascaradas tem um fundo de outra cor e no podem ser modificadas.

Desmascarar vai desmascarar todas as colunas atualmente mascaradas.

Transformar - transformar a linha atual, utilizando diversos tipos de transformao. Acrescentar - acrescentar uma nova linha no final da matriz Transformar - aplicar uma transformao coluna/linha

Inserir - insere uma coluna/linha antes da coluna/linha atual

Acrescentar acrescenta uma nova linha/coluna no final da matriz Ordenar - ordenar as linhas da matriz pela coluna atual ou ordenar as colunas da matriz pela linha atual. O programa pede uma chave secundria que usada para ordenar quando os valores da chave primria (atual coluna ou linha) so iguais. Copiar copia uma linha coluna para outra. Permutar permuta os valores dentro da prpria varivel. til em diversos testes estatsticos. Substituir substitui um valor por outro, escolhido. Casos especiais so a substituio de valores faltando pela mdia da varivel ou por zero.

24

Ve

Eliminar - Elimina uma ou mais linhas da matriz

Pr rs eli o m in ar

Var.(ivel) Marcador designa uma varivel como varivel marcador que ser mantida junto com os dados originais em analises multivariadas, etc. para servir de marcador ou "etiqueta" em grficos, tabelas, etc.(veja "variveis mascaradas e marcadores" para maiores explicaes)

Formato de coluna ajustar detalhes da formatao da coluna (largura, etc.) Converter converte uma varivel (coluna) de um tipo para outro. Note que algumas converses no so possveis texto em quantitativa, etc., Usar para nome de linha transfere a coluna para a lista de nomes dos objetos (linhas). til quando se importa um arquivo com nomes numricos, onde Fitopac geralmente vai interpretar os nomes como dados. Verificar se h nomes de coluna/linha duplicados- percorre os nomes das variveis ou objetos, procurando nomes que esto duplicados. Embora Fitopac no probe nomes assim, na prtica a duplicao de nomes leva a dificuldades na identificao de objetos nas tabelas e pode causar problemas srios na fuso de matrizes. Abre uma tela de correo de nomes se encontra alguma duplicao. Preencher - permite preencher uma coluna com diversos tipos de valores. til quando se precisa acrescentar uma coluna ou linha que contem uma seqncia de nmeros que pode ser usada para identificar a seqncia original das amostras quando se produz grficos ou para reordenar a matriz ou para limpar uma coluna/linha inteira, antes de entrar com novos valores. O preenchimento feito a partir da posio do cursor isto , desde a clula escolhida at o final da coluna, permitindo preencher somente uma parte ou de diferentes partes de uma coluna em diferentes maneiras. As oito subopes so:

Dado Faltando - simplesmente preenche a coluna/linha com o valor "dado faltando". til quando precisa entrar dados muito incompletos, sem ter que digitar "dado faltando" para todas as clulas que no tem dados. Constante preenche a coluna/linha com um valor constante escolhido. 1 preenche com valores de "1" (um) 0 com valores = 0 (zero) Seqncia simples - preenche a coluna/linha com uma seqncia de nmeros de 1 a "n". Outra Seqncia - preenche a coluna/linha com uma seqncia de nmeros onde o valor inicial e o tamanho de incremento pode ser alterados. O valor preestabelecido 1 para ambos, dando uma seqncia de 1,2,3,4,5,....., mas se escolher outros valores, pode produzir outras seqncias - por ex. inicial = 0 e incremento = 5 d a seqncia 0,5,10,15,.....

Pr rs eli o m in ar

Ve

Aleatrio - preenche a coluna/linha com nmeros aleatrios. til quando se quer randomizar a ordem das linhas/colunas da matriz (acrescenta uma coluna/linha, preenche com nmeros aleatrios e ordena por aquela coluna/linha) ou simplesmente quando precisa de uma varivel ou linha com nmeros aleatrios para testes estatsticos. Em variveis quantitativas pode optar por nmeros aleatrios gaussianos (distribuio normal, com mdia de desvio padro a escolher) ou uniformes, onde a probabilidade de obter qualquer nmero entre 0 e 1,0 igual para todos. No caso de variveis binrios, a proporo de 1:0 pode ser escolhida para dar variveis com caractersticas diferenciadas, mas no h diferena entre gaussiano e uniforme.

25

matriz arquivos
Matriz - Arquivos O item "Arquivos" no menu principal da janela Matriz oferece diversas alternativas :Salvar - grava a matriz atual como um arquivo padro do Fitopac (*.FPM). Mantm o mesmo nome de arquivo (se o original foi um arquivo FPM) e voc pode escolher se vai sobrescrever o arquivo original ou utilizar um outro nome para criar um arquivo novo. salvar Como - permite exportar a matriz para outros formatos, usados por outros programas como NTSYS, SYSTAT, etc. Ao escolher este comando, abre-se uma pequena janela que permite escolher o formato de arquivo que deseja gravar :

Fitopac - Matriz (*.FPM) Fitopac - Coefs (*.FPC).

ASCII e ASCII delimitado (*.TXT, *.CSV) Excel (*.XLS)

Lotus 123 (*.WK1) SYSTAT (*.SYD; *.SYS) NT-SYS (*.NTS) PC-Ord (*.WK1) Cornell (*.DTA) MVSP (*.MVS).

26

Pr rs eli o m in ar

Ve

Imprimir - imprime a matriz diretamente na impressora. Visualizar impresso - abre uma janela que permite visualizar e, se quiser, imprimir o contedo de um arquivo de resultados. Tambm permite gravar este arquivo em formato "rtf" que pode ser lido diretamente por MS-Word e outros processadores de texto.

matriz cabealho
Esta opo permite alterar os dados de cabealho de arquivos Fitopac (*.FPM). Estes incluem o ttulo, pessoa responsvel e os nomes usados para descrever as linhas e colunas da matriz - por exemplo "parcelas" e "espcies". Note que estes mudanas valem somente para arquivos Fitopac, embora alguns outros formatos tem pelo menos um ttulo (SYSTAT, NT-SYS). Embora estas informaes no sejam essenciais, so includas na sada impressa e ajudam a lembrar o que cada matriz representa, especialmente em casos onde tem muitas matrizes representando diferentes levantamentos ou conjuntos de dados.

Note que os nmeros de colunas ou linhas no podem ser alterados nesta opo.

Pr rs eli o m in ar
27

Ve

eliminando linhas ou colunas


Para escolher linhas ou colunas de uma matriz que sero eliminadas ou mascaradas, utiliza-se uma tela com duas listas, a da esquerda contendo os itens no eliminadas/mascaradas, e a do direito contendo os itens eliminados/mascarados.

Quando a lista de itens a serem eliminados/mascarados est completa, o boto "OK" deve ser usado para continuar.

matriz transformar
A opo "Transformar" na janela Matriz aplica uma transformao a qualquer conjunto de colunas ou linhas da matriz. Diversas transformaes esto disponveis e so as mesmas descritas no "Manual de Usurio" do Fitopac, no programa MATRIZ. Ao selecionar este comando, abre-se uma janela, que permite escolher se a transformao ser aplicada por linha ou por coluna da matriz. Para algumas transformaes (por ex. Logaritmo, Raiz Quadrado, etc.), no importa se aplicada por linha ou coluna, mas para outras (por exemplo estandardizao, "ranging", centragem), faz uma grande diferena. Os nomes das colunas ou linhas no aparecem at voc escolher qual dos dois conjuntos voc quer transformar.

28

Ve

Os botes marcados ">" ou "<" transferem itens selecionados (clicando individualmente ou usando "shift"-Clique ou Ctrl-Clique para escolher diversos itens) de uma lista para a outra. Os botes marcados ">>" ou "<<" transferem todos os itens de uma vez.

Pr rs eli o m in ar

Em seguida, pode escolher o tipo de transformao desejada e quais variveis sero transformadas. Note que variveis mascaradas no sero transformadas.

matriz juntar

A opo "Juntar" tem a funo de fundir matrizes de dados quando se quer analisar dois ou mais conjuntos de caractersticas numa nica matriz. Tipicamente, pode ser necessrio, por exemplo, juntar matrizes de dados vegetativas e reprodutivas que foram medidos nos mesmos indivduos ou acrescentar uma varivel representando a qual grupo de uma anlise de agrupamento uma dada amostra pertence quando se prepara figuras representando uma ordenao. Quando se escolha este comando, o programa abre uma janela que permite escolher o arquivo que ser fundido com a matriz j na memria e o mtodo usado para juntar as duas matrizes.

Ve

Ao apertar o boto de "OK", as transformaes sero feitas. Recomenda-se o uso da visualizao da matriz na planilha para verificar que a transformao foi aplicada corretamente. possvel aplicar uma seqncia de diferentes transformaes mesma matriz. Note, tambm, que certas transformaes no podem ser aplicadas a matrizes que contem valores negativos ou zeros (logartmo, raiz quadrada, etc.).

Pr rs eli o m in ar

29

Ao clicar no boto "Escolher Segundo Arquivo", o programa permite escolher o arquivo que contem a segunda matriz que ser combinada com a matriz atualmente na memria. Em seguida, necessrio escolher o tipo de fuso entre matrizes desejada. As opes so :"Lado ao Lado" - usado quando as amostras/objetos (as linhas da matriz) so iguais e as duas matrizes representam diferentes conjuntos de variveis medidas nos mesmos amostras/objetos. Como exemplo, poderamos ter duas matrizes representando plantas herbceas e lenhosas respetivamente para um nico conjunto de parcelas, e neste caso as linhas das duas matrizes representam os mesmos objetos, as parcelas (note, porm, que os objetos tambm precisam ter os mesmos nomes* nas duas matrizes). Para juntar as matrizes, o programa procura linhas que tem exatamente o mesmo nome, e forma uma nova linha contendo os dados combinados das duas matrizes. Caso ocorram nomes no idnticos, sero tratados como novas linhas, com as colunas da primeira matriz preenchidos com "dados faltando". Se precisa juntar linhas de matrizes com nomes diferentes, use a opo "juntar lado ao lado forado" (abaixo). O resultado pode ser representado por matriz 1 1111 1111

"Lado ao Lado forado" usado em situaes onde se quer juntar matrizes "lado ao lado", mas os nomes das linhas so diferentes ou podem ser duplicados. Nesta opo, as linhas so juntadas seguindo a ordem que tem dentro da matriz e sem qualquer tentativa de "reconhecer" quais linhas tem o mesmo nome. Em casos onde o nmero de linhas diferente nas duas matrizes, o programa cria uma matriz com o nmero mximo de linhas e preenche as clulas vazias com "dado faltando". "Empilhar" - usado em casos onde as colunas das matrizes so idnticas e as linhas representam dois conjuntos de amostras/objetos. Um exemplo seria o caso onde temos dois conjuntos de parcelas contendo o mesmo conjunto de espcies ou dois conjuntos de exsicatas onde foram medidas exatamente os mesmos caracteres. Mais uma vez, os nomes devem ser idnticas* nas duas matrizes. Caso ocorram nomes no idnticos, sero tratados como novas colunas, com as linhas da primeira matriz preenchidos com "dados faltando".

30

Pr rs eli o m in ar
matriz 2 2222 2222

Ve

matriz final 11112222 11112222

O resultado pode ser representado assim :matriz 1 1111 1111 matriz 2 2222 2222 matriz final 1111 1111 2222 2222

"Empilhar Forado"- usado em situaes onde necessrio juntar colunas de duas matrizes que tem colunas com nomes diferentes, e no se pretende juntar colunas que tem nomes idnticos. Isso quer dizer que o programa juntar coluna 1 da segunda matriz com coluna 1 da primeira, coluna 2 com coluna 2, e assim por diante. Quando se utilize esta opo, o programa tenta juntar as colunas sem verificao de nomes. Se uma matriz tem maior nmero de colunas que a outra, as colunas que no tiver equivalentes sero preenchidos com "dado faltando". "Mesclar" - esta opo fornecida para casos (raros ?) onde se deseja unir conjuntos de dados onde algumas espcies/caracteres e/ou amostras/objetos so iguais entre as duas matrizes e outros so diferentes. Como exemplo, temos o caso onde levantamentos de dois conjuntos de parcelas foram feitos em reas prximas, tendo muitas espcies em comum, mas no todas. Se deseja unir estas matrizes para criar uma matriz que inclua todas as amostras numa nica matriz. Neste caso, a opo "Empilhar" no funcionaria porque nem todas as espcies so idnticas entre as reas e necessrio manter estas espcies separadas enquanto combina os dados para espcies idnticas dentro de uma mesma coluna da matriz. Esta opo tenta resolver este caso, e o caso anlogo onde pode ter algumas linhas em comum entre matrizes e outras no. O resultado pode ser representado por :-

P1 1

P2 1 P3 1 P4 1 matrizes 1 e 2

1 1 1

depois de "mesclar" A P1 P2 P3 P4 P5 1 1 3 1 2 2 2 B C 1 1 1 1 D 1 1 3 1 2 2 2 E F 1 1 1 1

Pr rs eli o m in ar
D F A B D E 1 1 P3 2 2 2 2 1 1

Ve

P5 P6 P7

2 2 2

2 2 2

2 2 2

2 2 2

1 1

1 1

31

P6 P7

2 2

2 2

2 2

2 2

essencial, nesta opo, que as colunas ou linhas que devem ser tratadas como sendo idnticas entre as duas matrizes realmente tenham nomes que sejam idnticas mesmo. Qualquer diferena em nomes, mesmo que seja presena/ausncia de uma vrgula ou ponto, vai resultar nestas colunas/linhas sendo tratadas como sendo distintas. O programa tenta detectar nomes aparentemente parecidos (veja "Nomes suspeitos "), mas este processo tem grandes limitaes e nem sempre capaz de detectar erros deste tipo. Recomenda-se fortemente que aps uma operao deste tipo, a matriz resultante deva ser inspecionada (na planilha) com muito cuidado para verificar que a mesclagem realmente produziu os resultados esperados.

*Mudana importante na verso 1.6 !! Foi introduzida uma mudana importante no processo de juntar matrizes. O programa agora detecta e rene as linhas ou colunas com o mesmo nome. isso quer dizer que no mais necessrio ter as linhas/colunas rigidamente na mesma ordem como em verses anteriores, pois mesmo estando em ordens distintas nas duas matrizes, as linhas/colunas correspondentes so identificadas. Note, porem, que qualquer diferena entre os nomes das duas matrizes ser tratado como indicando linhas/colunas distintas. Convm, portanto, verificar a ortografia dos nomes da duas matrizes com muito cuidado, para evitar "surpresas" durante o processo de junt-las. De qualquer modo, recomendo examinar, com muito cuidado, os resultados de qualquer operao de juno/fuso de matrizes pois as vezes, os resultados podem ser surpreendentes e no produzem a matriz esperada.

matriz espcies raras

O comando "Espcies Raras" utilizado em anlises de levantamentos ecolgicos onde freqente que se deseja remover as espcies raras antes de fazer, por exemplo, uma ordenao. Ao escolher este comando, o programa abre uma janela que permite definir o que se considera uma espcie rara.

32

Pr rs eli o m in ar

Ve

As espcies podem ser consideradas raras por diversos critrios :

Valor Absoluto - remove espcies cuja soma de valores menor que o valor indicado como o mnimo aceitvel. O Valor mnimo aceitvel representa o nvel de corte, sendo que qualquer espcie com menos que este nvel ser removida.

Nomes suspeitos
Antes de fundir matrizes, o programa tenta detectar "nomes suspeitos" que so casos onde os nomes tem pronncias muito parecidas mas ortografias diferentes por exemplo "Cinnamomum" e "Cinammomum". Em muitos casos, estes nomes devem ser idnticos e a diferena se deve a um erro de digitao. particularmente importante detectar este tipo de erro quando se pretende "mesclar" as matrizes pois o programa reconhece quais linhas/colunas devem ser mescladas ou mantidas somente pelos nomes usados. Quando o programa detecta situaes deste tipo abre uma tela (tela "Nomes suspeitos"), mostrando os pares de nomes considerados "suspeitos", e permite escolher entre as verses, clicando na verso desejada. O nome escolhido fica com um fundo vermelho, e ser usado em vez do nome que no foi clicado. Se no clicar em um dos pares de nomes, nenhuma correo feito e os dois nomes aparecero na matriz final. O mesmo acontece quando se clica em ambos

Ve

Porcentagem do total - remove espcies cuja soma de valores representa uma porcentagem do total de valores na matriz menor que o valor indicado como sendo o mnimo aceitvel.

Pr rs eli o m in ar

Nmero de amostras - talvez o critrio mais comum, remove espcies que ocorrem em menos que um nmero escolhido de amostras, sem considerar a quantidade da espcie que ocorre em cada amostra. comum, por exemplo, remover espcies que ocorrem numa nica amostra (valor mnimo aceitvel = 2), ou, em levantamentos maiores, espcies que estejam presentes em menos que cinco amostras (valor mnimo aceitvel = 5).

33

os nomes (voc pode mudar de idia clicando novamente num nome). Finalmente, quando est satisfeito com as substituies que sero feitos, clique no boto "ok" para efetuar as mudanas ou em "cancelar" par deixar todos os nomes como esto. O algoritmo usado para detectar semelhana entre nomes ("Soundex") no muito "inteligente", e freqentemente vai detectar nomes "suspeitos", mesmo que sejam perfeitamente legtimos por ex. "lancifolia" e "longifolia". Nestes casos, nenhuma correo deve ser feito, e os dois nomes sero mantidos. Este problema muito comum onde cdigos ou nomes muito curtos foram usados e especialmente onde parte do nome numrica, pois o Soundex no inclui a parte numrica quando detecta as semelhanas por ex., SJC1 e SJC2 sero tratados como idnticos.

Tela "Nomes suspeitos"

A tela "Nomes suspeitos" aparece quando

34

Pr rs eli o m in ar

Ve

1. 2. 3.

o programa detecta nomes de variveis diferentes quando duas matrizes esto sendo "empilhadas" . Neste caso, esperado que os nomes das variveis (colunas) sejam iguais. o programa detecta nomes de objetos (linhas) diferentes quando duas matrizes esto sendo juntadas "lado ao lado". Neste caso, esperado que os nomes dos objetos (linhas) sejam iguais. quando o programa est realizando uma fuso de matrizes e detecta nomes aparentemente parecidos, que talvez devem ser tratados como idnticos.

Esta tela mostra duas listas de nomes lado ao lado. Se uma das formas de um nome est correta, clique na verso correta (a cor do fundo deve mudar) e esta verso ser usada na matriz final. Em caso 3, acima, se voc no indica uma verso preferida, os dois nomes sero tratados como distintos e acrescentados como duas linhas ou colunas diferentes. Em casos 1 e 2, se no indicar uma forma preferida, a forma na coluna esquerda ("matriz 1") ser adotada.

Tela "Nomes duplicados"


A tela "nomes duplicados" aparece durante a importao de arquivos ou na fuso de matrizes quando existem nomes iguais em duas ou mais linhas (ou colunas) da matriz. Embora no seja proibido pelo Fitopac, a presena de nomes duplicados , no mnimo, inconveniente pois as listagens produzidas pelas anlises vo conter dois itens com o mesmo nome sem meios de determinar qual qual. Em operaes de fuso de matrizes, a presena de linhas com o mesmo nome cria uma situao ambgua, onde o programa no pode determinar quais linhas das duas matrizes devem ser unidas. Como, internamente, Fitopac detecta somente a primeira ocorrncia de um nome, praticamente uma certeza que a matriz resultante ter erros e vai ligar duas ou mais vezes a mesma linha da segunda matriz com mais que uma linha da primeira. Portanto, quando Fitopac detecta esta situao na importao ou fuso de matrizes, abre uma tela solicitando instrues sobre como proceder. [se realmente precisa ter nomes duplicados por algum motivo e quer juntar matrizes, utilize as opes "lado ao lado forada " ou "empilhar forado "]

Pr rs eli o m in ar

Ve

35

As opes so: Deixar como est continuar sem modificao. Em operaes de fuso de matrizes, est opo NO recomendada porque pode levar a erros na fuso, e gerar resultados inesperadas. Em geral, recomenda-se no deixar nomes duplicados em matrizes. Diferenciar os nomes automaticamente gera novos nomes, acrescentando um sufixo numerado s instncias duplicadas isto , todas as ocorrncias do nomes aps a primeira. Este sufixo tem o formato "_x", onde "x" = 1, 2, 3, etc. Modificar diretamente, um a um abre a tela de modificao do cabealho da matriz, permitindo acesso aos comandos de editorao dos nomes onde pode procurar e modificar os nomes individualmente. Eliminar as cpias simplesmente elimina (permanentemente) as linhas com nomes duplicados. Use com cuidado no tem "desfazer"! Mascarar as cpias deixa as linhas com cpias dos nomes mascaradas mais seguro que "eliminar" no remove as linhas, mas em certas operaes as linhas mascaradas podem atrapalhar, especialmente em fuses de matrizes. "Somar" as linhas/colunas com os mesmos nomes neste casos, os valores nas linhas/colunas com nomes duplicados so somados na linha/coluna com a primeira ocorrncia do nome e as outras eliminadas. Pode ser til onde se descobre que os nomes em duas colunas representam sinnimos e faz sentido unir as ocorrncias de ambas. Para dados quantitativos, os valores so somados e em variveis multiestado, o valor mximo usado, enquanto em variveis binrios, o equivalente de uma operao "OR" utilizado isto , uma presena em qualquer uma das linhas/colunas duplicados resulta em presena e o resultado ser uma ausncia somente em casos onde todos os valores so 0 (ausncia). No caso de colunas, podem ocorrer problemas em matrizes com dados mistos, pois no possvel somar uma varivel quantitativa com uma varivel texto, por exemplo. Nestes casos, o programa avisa que no possvel completar a ao e cabe ao usurio resolver a situao. Onde ocorre uma varivel quantitativa com nome duplicado em variveis binrios ou multiestado, os contedos das variveis sero somados, mas somente se a primeira varivel for quantitativa, embora seja altamente questionvel se este procedimento correto. Recomenda-se que esta opo seja usada com muito cautela em matrizes heterogneas, com diferentes tipos de varivel. Parar esta anlise abandona a anlise sendo executada.

36

Pr rs eli o m in ar

Ve

Visualizando resultados de anlises


O formulrio de resultados
"Bug" ocorrem algumas diferenas entre a formatao vista inicialmente e a formatao final, impressa. Estes problemas so, em parte, conseqncia de incompatibilidades com o componente "rich text edit" do Windows. Se o formato exato da sda for importante, recomendo copiar tudo para a rea de transferncia ou gravar como rtf e utilizar o "Word" ou outro processador de texto para preparar o texto final. A maioria das anlises no Fitopac produz algum tipo de sada na forma de texto (geralmente tabelas, etc). Este texto colocado dentro de um formulrio especial que normalmente pode ser examinado usando um boto marcado "Vis. resultados" ou simplesmente "Resultados". Todos os resultados da sesso que foi iniciada quando o usurio mandou executar o Fitopac so armazenados neste formulrio isto , os resultados so acumulados e a sada de uma anlise no apaga o anterior. Deve-se notar, porm, que o contedo deste formulrio NO gravado automaticamente (para evitar o acmulo de grandes quantidades de sada indesejvel), e que voc precisa mandar gravar e/ou imprimir os resultados se quiser preserv-los. O contedo pode ser gravado como um arquivo de texto simples (*.txt) ou como arquivo "rich text format" (*.rtf), que permite uma formatao limitada (fonte, negrito, itlico, etc.) e que pode ser lido por programas como "Microsoft Word". O texto tambm pode ser editado, por exemplo, apagando partes desnecessrias, antes de gravar ou imprimir. O texto aparece dentro de uma janela com algumas opes para formatao, gravao, etc.

As principais opes so : Grav(ar) txt grava o contedo como arquivo de texto simples (txt) Grav(ar) rtf - grava o contedo como arquivo "rich text format" (rtf) que preserva a formatao e compatvel com "Word", etc. Imprim(ir) imprime diretamente na impressora Config(urar) pg(ina) configurao da pgina e outras caractersticas da impressora Vis(ualisar) impres(so) visualizar a impresso antes de imprimir Fonte mudar a fonte do texto selecionado Centrar centrar o pargrafo selecionado

Pr rs eli o m in ar
37

Ve

Selec(ionar) tudo seleciona o texto inteiro (para mudar fonte, etc.) Copiar copia o texto selecionado para a rea de transferncia Cortar cortar o texto selecionado e colocar na rea de transferncia Colar colar texto que est na rea de transferncia

38

Pr rs eli o m in ar

Ve

Grficos em Fitopac
Criando Grficos
A maioria das anlises feitas no Fitopac podem gerar um ou mais grficos. Fitopac tambm pode ser utilizado para produzir grficos a partir de arquivos de dados j gravados via o boto "grficos" da tela principal (veja: Criando grficos diretamente). Os principais tipos produzidos so: Diagrama de Disperso ("scatter plot") Diagrama de vetores Dendrogramas Grficos de Barra/Histogramas Grficos de "caixa" ("Box and Whiskers plot") Grficos compostos grficos como "biplots" e "triplots" que so compostos de componentes distintos como um grfico de disperso junto com um diagrama de vetores, no caso de um "biplot" de PCA.

Alm dos grficos em duas dimenses, Fitopac tambm tem recursos para fazer alguns tipos de grfico em 3 dimenses. Estes utilizam a linguajem VRML ("Virtual Reality Markup Language"), e requerem um "browser" (Internet Explorer, Firefox, Opera, etc.) equipado para visualizar arquivos escritos usando VRML. Estes grficos so particularmente teis para visualizao dos resultados de ordenaes, onde a possibilidade de representar trs eixos simultaneamente pode ser importante. veja: Grficos 3D

Criando grficos diretamente

Ao apertar o boto "grficos 2D" da tela principal, abre-se uma janela de grficos:-

Pr rs eli o m in ar

Ve

39

boto Mostrar Grfico: mostra o grfico que foi especificado de acordo com as opes escolhidas. boto Sair: volta ao programa principal.

Tipo de grfico escolhe o tipo de grfico que deseja, entre 1. 2. 3.

Grfico de linha onde os dados so representados como uma linha contnua

Grfico de Barras onde os dados so representados como barras individuais Diagrama de disperso, mostrando os dados como pontos Matrizes: a tela mostra 3 fichas chamadas Matriz principal, Matriz secundria e Matriz terciria. A maioria dos grficos simples utilizam somente a matriz principal, mas alguns requerem mais que uma matriz, mas especificamente no caso dos "biplots" e "triplots" usados para analisar ordenaes. Cada "ficha" permite escolher ou trocar a matriz (boto abrir), gravar uma matriz que foi modificada (boto gravar) e abrir a matriz na planilha para modificar os dados (editar valores, transformar, etc.). Eixo X escolhe qual varivel (coluna) ser usado como eixo horizontal do grfico. Eixo Y escolhe qual varivel (coluna) ser usado como eixo vertical do grfico. Mostrar como vetores em vez de representar os dados como pontos em diagramas de disperso, podem ser mostrados como vetores partindo da origem. Esta forma til para "biplots" e "triplots", especialmente nas anlises PCA e RDA.

40

Pr rs eli o m in ar

Ve

Ajustar a escala em muitos casos, as escalas dos dados na matriz secundria ou terciria pode ser incompatvel com a escala da matriz principal (comum em "biplots" de PCA). Se usar esta opo, a escala da matriz escolhida ser ajustada para ficar semelhante escala das variveis escolhidas da matriz principal. Neste caso, a escala dos eixos do grfico da matriz principal e no da matriz secundrio ou tercirio. Visvel - determina se os dados da matriz esto visveis ou no no grfico. til quando se quer comparar os grficos produzidos com e sem as diferentes matrizes.

Diagramas de disperso
Os grficos de disperso tem uma srie de opes que permitem alterar a aparncia do grfico e salvar ou imprimir os resultados. Os controles esto localizados na barra de comandos na margem superior da tela e podem ser divididos em trs blocos principais : 1. os botes de funo

As vezes, mudanas de posio de etiquetas e algumas outras modificaes do grfico no so gravados corretamente, principalmente em "Windows 98", devido a um problema no pacote usado para produo dos grficos. Neste caso, use os comandos de "copiar e colar" para transferir o grfico corretamente. Copiar copia o grfico para a rea de transferncia de Windows. Pode ento ser "colado" em outros programas como "Word" ou "PhotoShop". Imprimir imprime o grfico diretamente na impressora

As vezes, mudanas de posio de etiquetas e algumas outras modificaes do grfico no so impressos corretamente, devido a um problema no pacote usado para produo dos grficos. Neste caso, use os comandos de "copiar e colar" ou grava como arquivo "emf" para transferir o grfico corretamente para "Word" ou "PowerPoint". Config abre a tela de configurao de grfico do pacote "TeeChart" usado par criar os grficos em Fitopac. Esta tela permite alterar um grande nmero de caractersticas dos grficos, mas relativamente complexo, e deve ser usada com um certo grau de cautela. Infelizmente, este comando no tem opo de "desfazer". Eixos permite escolher se os eixos esto centrados ou no e o texto (ttulo) associado com cada eixo.

Pr rs eli o m in ar

Salvar - grava o grfico no formato emf (Enhanced Windows Metafile), um formato que pode ser importado facilmente por programas Windows como MS Office, etc.

Ve

41

eixos centrados

eixos no centrados Opes abre uma tela de opes que permite modificar o grfico, por ex. mudando o tipo, a cor, e tamanho de smbolos, entre outras possibilidades. Veja "A Tela de Opes de Diagramas de Disperso " para mais detalhes. Note que, no caso de grficos compostos como "biplots", ao clicar neste boto, precisa optar entre os diferentes componentes do grfico os escores dos objetos ou os vetores representando as variveis originais no caso de uma anlise PCA e que as opes selecionadas tero efeito somente no conjunto escolhido. Este arranjo permite mais flexibilidade, pois cada componente pode ser configurado independentemente. Etiquetas este boto liga ou desliga as "etiquetas" dos pontos no diagrama de disperso. Em grficos mais complexos com "biplots", pode ter mais que um conjunto de etiquetas que so controlados individualmente.

42

Pr rs eli o m in ar

Ve

Modificando as escalas
As escalas verticais e horizontais podem ser modificadas usando os controles de escala:

A tela de opes para diagramas de disperso relativamente complexa porque permite um grande nmero de escolhas sobre a aparncia do grfico e a maneira em que o conjunto de dados representado. Grficos deste tipo em Fitopac podem utilizar duas matrizes de dados para determinar como ser a aparncia final do grfico a matriz primria contm os dados que indicam a posio dos pontos ao longo dos eixos, e a matriz secundria usada para "pintar" os smbolos individuais com cores, formatos e tamanhos diferentes. A matriz secundria pode ser idntica matriz primria ou pode ser completamente diferente. importante notar aqui que as opes disponveis podem ser ligeiramente diferentes, dependendo da origem do grfico dentro do Fitopac. Por exemplo, grficos de disperso produzidos por ordenaes normalmente usam um conjunto de escores como a matriz primria e a matriz de dados originais que geraram a anlise como matriz secundria para colorir os smbolos ou determinar o seu formato ou tamanho. Grficos que foram gerados diretamente de um arquivo contendo os escores tero somente a matriz primria, pelo menos inicialmente. As principais comandos e opes so:

Ve

A Tela de Opes em Diagramas de Disperso

Pr rs eli o m in ar

Basicamente, a largura e altura do grfico so controladas pelos controles deslizantes. O boto "eixos iguais" ajusta as escalas nos dois eixos para ficarem iguais isto , um unidade na escala horizontal fica igual em tamanho a uma unidade na escala vertical na tela. Este ajuste muito til quando se deseja grficos onde as distncias vistas na tela so proporcionais s distncias nas unidades originais por exemplo grficos de ordenaes. O ajuste das escalas pode ser conferido utilizando os crculos de calibrao. Quando esta opo est ligado, aparecem na tela um conjunto de elipses e outro de crculos, em cores diferentes. As escalas dos eixos esto iguais quando os elipses adquirem formato circular e coincidem com os crculos. Os crculos de calibrao podem ser usados junto com os controles deslizantes para ajustar as escalas manualmente, ou para verificar e eventualmente ajustar as escalas aps o ajuste automtico. O boto de "restaurar as escalas originais" retorna s escalas originalmente calculadas pelo programa para ocupar o mximo da tela. Note que o ajuste automtico no estar disponvel se as escalas forem muito diferentes (uma mais de 40 vezes a outra). A caixa "ajuste fino" pode ser ligada ou desligada para modificar a sensibilidade dos controles deslizantes.

43

Botes:

Importar - importa uma nova matriz secundria para determinar a aparncia dos smbolos.

Eixos trs botes permitem a seleo rpida das combinaes dos eixos 1x2, 1x3 e 2x3, sendo que 1 a primeira varivel, 2 a segunda e 3 a terceira na matriz primria. Para muitas anlises, estes so os eixos mais importantes. Os eixos tambm podem ser escolhidos utilizando as caixas de opo "X" e "Y" que permitem escolher qualquer varivel da matriz primria como eixo e no confina a escolha s primeiras trs variveis. importante notar, tambm, que no caso de grficos compostos como "biplots", a mudana de eixos afeta somente o conjunto selecionado (por exemplo os pontos representando os escores) e no os outros componentes (como vetores representando variveis originais) que precisam ser modificados individualmente. As caixas de listagem X e Y permitem selecionar quais variveis da matriz primria so usadas como eixos X e Y do grfico. Estes comandos permitem escolher qualquer par de variveis na matriz primria como eixos e no limitam a escolha s primeiras trs variveis como os botes de seleo rpida. Esta opo importante quando se pretende, por exemplo, examinar o quarto componente em diante numa PCA. A caixa "matriz de variveis para pintar" com trs botes de opo controla quais conjuntos de variveis esto disponveis para "pintar" os smbolos com diferentes cores formas e tamanhos. As opes so: "Dados originais" disponibiliza as variveis da matriz secundria; "escores" as da matriz primria e "Ambos" combina os dois conjuntos. Estas opes esto disponveis somente quando a matriz primria e a matriz secundria esto presentes. As caixas de opo "Tamanho", "Cores" e "Smbolos" controlam como os smbolos representando os dados sero desenhados, e esto associadas com outras caixas de texto ou caixas de listagem que permitem escolher variveis ou valores de acordo com a opo selecionada na caixa de opo. As opes disponveis so:

44

Ve

Examinar inspecionar ou editar a matriz secundria usada para determinar a aparncia dos smbolos.

Pr rs eli o m in ar

Tamanho Uniforme todos os smbolos so desenhados em tamanho uniforme que pode ser selecionado na caixa de texto logo abaixo Varivel os smbolos so desenhados em tamanhos diferentes, proporcionais aos valores na varivel selecionada na caixa de listagem que abre ao escolher esta opo. Cores Uniforme todos os smbolos so desenhados utilizando a cor selecionada acionando o boto "Cor fixa" logo abaixo Varivel as cores so alocadas de acordo com os valores de uma varivel selecionada na caixa de listagem que aparece logo abaixo. Nesta opo, as cores so contnuas e variam de azul, representando o valor mnimo da varivel, at vermelho, representando o valor mximo. Por grupo semelhante, mas neste caso as cores (e os valores na varivel) so descontinuas e geralmente representam grupos ou valores multiestado, no ordenados, onde no apropriado usar uma escala contnua. Esta opo particularmente til quando se deseja sobrepor alguma classificao em grupos (por exemplo, obtidos numa anlise de agrupamento) num grfico de ordenao. Smbolos Uniforme os smbolos usados para representar os dados so todos iguais. O smbolo usado pode ser escolhido na caixa de listagem que aparece em baixo. Por Grupo os smbolos variam de acordo com os valores numa varivel escolhida na caixa de listagem que aparece logo abaixo. Normalmente, esta varivel multiestado e no deve ser contnua. Esta opo particularmente til quando se deseja sobrepor alguma classificao em grupos (por exemplo, obtidos numa anlise de agrupamento) num grfico de ordenao.

Diagramas de vetores

Sinto muito ainda no est pronto !

Grficos de linha

Dendrogramas

Os dendrogramas produzidos em Fitopac permitem um nmero substancial de opes e acima de tudo, oferecem alguns recursos para anlise dos resultados que so incomuns em outros programas de anlise de agrupamentos.

Grficos de Barra
Sinto muito ainda no est pronto !

Pr rs eli o m in ar
45

Ve

Grficos de caixa
Sinto muito ainda no est pronto !

Grficos 3D
Fitopac pode produzir grficos 3D simples no formato VRML(Virtual Reality Modeling Language), uma linguagem utilizada para descrever cenas em trs dimenses, amplamente usada em sites na Web. Tem a vantagem de ser relativamente simples, e os arquivos so de texto puro e podem ser modificados manualmente, com um pouco de conhecimento de VRML (veja "http://web3d.vapourtech.com/tutorials/vrml97/ ou http://tecfa.unige.ch/guides/vrml/vrmlman/ " para introdues simplificadas). Para visualizar os grficos, necessrio ter um programa de visualizao de VRML ou (mais prtico), um "plug-in" do browser que permite visualizar os arquivos. O plug-in "Cortona" da companhia "parallel Graphics" (http://www.parallelgraphics.com/cortona) tem se mostrado bastante satisfatrio, e pode ser instalado em "Internet Explorer" ou "Firefox", alm de outros browsers. Se no tiver um browser com um visualizador de VRML, o programa no mostra o grfico, mas ainda assim, grava o arquivo VRML (que tem a extenso "wrl").

46

Pr rs eli o m in ar

Ve

Parmetors fitossociolgicos ("PARAMS")


Calculando Parmetros Fitossociolgicos
Esta verso ainda utiliza um programa DOS ("PARAMS.EXE") para calcular os parmetros fitossociolgicos para um conjunto de dados de um levantamento contidos num arquivo FPD. Ao escolher um arquivo FPD, o boto "Params" e item "paRametros" do menu se tornam disponveis. Ao acionar um destes, aparece a tela que permite escolher quais tabelas quer gravar (em formato FPM) par uso com outras anlises ou programas.

Ao apertar a tecla "ok", o FitopacShell executa o programa Params. Os comandos e opes do programa esto descritas no manual de Fitopac v. 1 (distribudo como arquivo "pdf", junto com Fitopac 1.6) e no sero descritos aqui. Se voc optou para gravar arquivos de parmetros para espcies, etc., estes podem ser utilizados em Fitopac ou exportados para uso em outros programas como "Excel" ou "SYSTAT".

Pr rs eli o m in ar

Ve

47

Calculando Distncias e Coeficientes de Semelhana


Coeficientes de semelhana e distncias em Fitopac
Fitopac capaz de calcular diversos coeficientes de semelhana ou distncias entre objetos que esto representados pelas linhas de uma matriz retangular (tipo FPM) e descritos por descritores ou variveis que so as colunas da matriz. Os valores calculados so armazenados em arquivos do tipo "FPC" ("FitoPac Coeficientes") como uma matriz triangular necessrio armazenar somente uma metade da matriz quadrada de semelhana/distncia pois estas normalmente so simtricas ao redor do diagonal da matriz. Esta matriz pode ser examinada diretamente para determinar o grau de semelhana entre os objetos ou, mais comumente, usada como entrada para anlises com Anlise de Agrupamentos ou Anlise de Coordenados Principais (PCO). O mdulo de clculo de coeficientes ativado apertando o boto "coef" ou o item do menu "Multivar/coefs" (disponveis somente quando um arquivo do tipo FPM j foi aberto). Arquivos de coeficientes/distncias j criados podem ser modificadas usando os comandos de modificao de matrizes de coeficientes disponveis via o boto "Coefs" ou o item Dados/coeficientes no menu principal. Modificaes incluem clculo de complemento da matriz, combinao de diferentes matrizes, clculo do coeficiente cofentico entre matrizes e teste de Mantel para associao entre matrizes.

A tela Coefs

Ao abrir a tela de clculo de coeficientes, os principais passos so:

1) escolher o coeficiente ou distncia desejado. A lista dos coeficientes disponveis depende do tipo de dados na matriz de entrada sendo que arquivos de dados quantitativos ou mistos oferecem uma lista de coeficientes apropriados para dados quantitativos, enquanto um arquivo de dados somente binrios ter disponvel um outro conjunto de coeficientes. Caso queira, por algum motivo, calcular coeficientes apropriados para dados quantitativos com dados binrios, necessrio, primeiro, converter os dados em dados quantitativos (veja transformaes e converses de dados). Veja "coeficientes e distncias usados em Fitopac para mais detalhes sobre coeficientes individuais. 2) Calcular os coeficientes (Boto "Calcular")

3) Gravar os coeficientes. Fitopac NO grava os coeficientes automaticamente ! Quando se calcula uma matriz de coeficientes, o boto "Gravar" muda de cor e aparece um aviso que existem dados no gravados, mas o arquivo gravado somente quando o usurio aperta o boto "Gravar" ou o escolha o item Arquivos/Gravar no menu. Caso queira transformar ou modificar os dados antes de calcular os coeficientes, o boto "Matriz" abre a planilha. O boto "Visualizar" permite inspecionar a matriz de coeficientes e, se desejado, imprimi-la. Note-se, porm, que matrizes grandes produzem uma sada muito extensa que pode ocupar dezenas de pginas quando impressas cuidado!

48

Pr rs eli o m in ar

Ve

Modificando e manipulando arquivos de coeficients

Coeficientes e distncias usados em Fitopac


Os coeficientes de semelhana e distncias usados em Fitopac so definidos pelas seguintes frmulas:-

x x

ik

o valor observado para varivel k na amostra i, para variveis contnuas. a mdia das observaes para amostra i, para todas as variveis de 1 a N.

ik

Para dados binrios, as formulas utilizam a seguinte tabela :UTO i + a

Distncia euclidiana quadrada


2 d ij= ( xik x jk ) 2 k =1 N

Ve
ij

distncias/coeficientes que utilizem dados quantitativos -

Distncia euclidiana simples

d
2

2 ij

Distncia euclidiana quadrada mdia

d d = N
2 ij

ij

Distncia euclidiana mdia

Pr rs eli o m in ar
c d

U T O j

ij

= ( b + c)

para dados binrios,

ij

(b + c)

para dados binrios,

2 ij

( b + c) N

para dados binrios,

49

ij

d N

ij

ij

(b + c) N

para dados binrios,

Distncia Manhattan total {"city block metric"}

d Mij= xik x jk
k =1

Mij

=(b + c)

para dados binrios,

Distncia Manhattan mdia {"Mean Character Difference"}

d Mij=

1 N N k =1 xik x jk

Mij

(b + c) N para dados binrios

Bray - Curtis

BC

(x + x
k =1 ik

k =1 N

"Canberra metric" incluindo zero duplo

CANij

1 = N

x ( x
N k =1

Forma original e mais comum deste coeficiente. Note que as duas formas da distncia Canberra substituam valores de zero com um valor = menor valor na matriz/5.0 (veja Clifford e Stevenson, 1975 para detalhes).

"Canberra metric" excluindo 0 duplo


igual ao anterior, mas excluindo comparaes onde ambos as amostras tem o valor 0. (veja Clifford & Stephenson, 1975).

para dados binrios,

Morisita

Lij

(i + j) N i N j

2 nik n jk

nik = no. de indivduos em amostra i, espcie k,

50

Pr rs eli o m in ar
ik jk jk

x x

BC

(b + c) [ 2a +(b + c)] para dados binrios

Ve
ik ik

x jk

+ x jk )

CANij

( b + c) N para dados binrios

CANij

( b + c) (a + b + c) , excluindo zero duplo

onde

i =

n (n 1) N ( N 1)
ik ik i i

e Ni = no. total de indivduos em amostra i.

Morisita modificado por Horn

= n N igual ao anterior, mas


i i

ik 2

Distncia corda

ij

= 2(1 cos )

cos ij =
onde

x x
k =1 ik M
2

jk
2

x x
k =1 ik k =1

jk

Diferena de tamanho

Diferena de forma

d ij =
ou

Correlao

Ve
d ij =
ik i
2

N N 2 1 N 1 ( xik x jk ) N 2 ( xik x jk )2 N k =1 k =1 k =1

N (b + c)(b c) 2 N2 para dados binrios

r ij =

(x x )(x x ) (x x ) (x x )
jk j ik i jk j

(dados binrios)

Marczewski-Steinhaus

St

2 min( xik , x jk ) ( xik + x jk )


k =1 k =1 k =1 M M

coeficientes que utilizem dados binrios -

Pr rs eli o m in ar
ou
2

d ij =

N N 1 ( xik x jk ) 2 N 2 k =1 k =1

d ij =

(b c) 2 N 2 para dados binrios

ij

( ad bc) ( a + b )( c + d )( a + c)(b + d )

ou = SSOR para dados binrios

51

Concordncia simples {"Simple matching"}

SM

( a + d) N

Jaccard

JAC

a (a + b + c )

Dice/Sorenson/Czekanowski

SOR

2a (2 a + b + c )

Kulczynski

S
OCH

KUL

a a 1 = [ + ] 2 (a + b) (a + c)

Ochiai

a [(a + b)(a + c)]

Baroni - Urbani & Buser

S
RT

BUB

ad + a ( ad + a + b + c)

Rogers-Tanimoto

Hamann

Yule

Ve
Y

Chi - quadrado

N ( ad bc N ) 2 ij = (a + b)(c + d)(a + c2)(b + d) Chi - quadrado com correo de Yates


2

Coeficients para misturas de varaveis

Coeficiente de Gower

W o peso para cada comparao. Para cada varivel, k, se Xik ou Xjk est faltando, ento wk = 0.0.

Pr rs eli o m in ar
S
H

( a + d) (a + d)+ 2(b + c)

(a + d) (b + c) (a + b + c + d)

ad bc ad + bc

ij

N (ad bc) 2 (a + b)(c + d)(a + c)(b + d)

S
para variveis quantitativas : 52

= 1

X (X

ik

max k

X X

jk

min k

)w

= 1.0

para variveis multiestado

Sk = 1.0 se Xik = Xjk

wk = 1.0

para variveis binrias Sk = 1.0 se Xik = Xjk = 1;

e wk = 1.0 onde xik ou xjk = 1 (=SJAC)

SG =

wk S
k =1

w
k =1

Pr rs eli o m in ar
53

Ve

Anlise de Agrupamentos (Cluster Analysis)


Introduo a anlise de Agrupamentos
Anlise de agrupamentos um conjunto de mtodos usados para detectar ou confirmar a presena de agrupamentos dentro de um conjunto de dados. Geralmente, o ponto de partido para este tipo de anlise uma matriz de semelhana ou distncia (arquivo "FPC"), que pode ser gerada utilizando a opo "Coef". Fitopac capaz de fazer anlise de Agrupamentos utilizando os chamados mtodos SAHN (Sequential, Agglomerative, Hierarchic, Nonoverlapping veja Sneath & Sokal 1973 para uma explicao detalhada), gerar dendrogramas e fornece algumas ferramentas para ajudar na interpretao dos resultados. Para usar esta opo, precisa primeiro gerar e carregar uma matriz de semelhana/distncia (arquivo "FPC"), tornando o boto "Agrupar" ou opo Multivar/Agrupar disponvel, que por sua vez abrem a tela de Anlise de AgrupamentosTela_de_Anlise_de_Agrupamentos.

Tela de Anlise de Agrupamentos


A tela de anlise de agrupamentos permite escolher diversas opes antes de realizar uma anlise de agrupamento. A tela oferece os seguintes comandos:

Tipo de Agrupamento escolhe entre os mtodos de agrupamento. Estes mtodos diferem no critrio usado para calcular a distncia/semelhana entre um grupo recm formado (P,Q) e qualquer outro grupo na matriz (R). Consulte Sneath& Sokal () ou Dunn & Everitt para mais detalhes sobre os mtodos. No total so oito mtodos e incluem Ligao simples (lig. mnima, vizinho mais prximo) o critrio usado para calcular a distncia entre o grupo (P,Q) e (R) a menor distncia/maior semelhana entre os membros dos grupos (P,Q) e (R). Este mtodo forma grupos bem irregulares e estendidas no espao, tendo um tendncia de contrair o espao de medio original. Tem uma forte tendncia a encadeiamento, onde os objetos se ligam no dendrograma um a um, produzindo uma "escada" que pouca informativa e sem grupos bem formados. Por este motivo, considerado talvez o menos til de todos os mtodos, mas pode ser o mtodo de escolha em situaes onde sabe-se que existem grupos bem irregulares e estendidos. Ligao completa (vizinho mais distante) neste caso o critrio a maior distncia/menor semelhana entre os membros dos grupos (P,Q) e (R). Este mtodo tende a formar grupos

54

Pr rs eli o m in ar

Ve

esfricos e compactos, e expande o espao. Geralmente bem mais satisfatrio que ligao simples, mas tem uma tendncia de formar grupos, mesmo em situaes onde no so justificveis. Este mtodo, portanto, deve ser usado com um certo grau de cautela Mdia de grupo (UPGMA, ligao mdia) - um dos mtodos mais indicados por estudos de avaliao de metodologia de anlise de agrupamento. Neste caso a distncia (P,Q)-(R) obtida a partir do valor mdio de todas as distncias entre (R) e (P,Q). Este mtodo tem propriedades intermedirios, e geralmente conserva o espao de medio original, produzindo grupos menos compactos, mas evitando os efeitos mais extremos de encadeiamento encontrados no mtodo de ligao simples. Mdia ponderada (WPGMA, mtodo de McQuitty) tem propriedades muito semelhantes mdia de grupo, mas mais indicado em casos onde tem grupos de tamanhos muito desiguais pois d pesos iguais para os grupos (P,Q), mesmo que o nmero de objetos em P for muito maior ou menor que aquele do Q (ao contrrio de mdia do grupo onde a distncia final ponderado pelo nmero de objetos em cada). Centride (UPGMC) neste mtodo, calculado o centride de cada novo grupo e a distncia entre grupos simplesmente a distncia entre centrides. Tem propriedades semelhantes a mdia de grupo, Este mtodo pode produzir inverses no dendrograma, levando alguns autores a rejeit-lo, alegando que torna-se quase impossvel a interpretao do dendrograma quando ocorrem muitos inverses. Inverses podem ser evitados pela escolha da funo objetiva em vez de distncia. Mediano (WPGMC, mtodo de Gower) - uma verso ponderada do centride, onde, mais uma vez, os grupos (P,Q) recebem pesos iguais, mesmo se um for muito maior que o outro. Muito parecido em caractersticas com centride, mas pode dar resultados melhores em casos onde o nmero de objetos em diferentes grupos. Mtodo de Ward (Varincia mnima) - um dos mais teis de todos os mtodos de agrupamento. Tem propriedades semelhantes ligao completa, mas a prtica e estudos de avaliao de metodologia sugerem que este mtodo geralmente produz agrupamentos relativamente fceis de interpretar. necessrio, porm, ter uma pouco de cautela na interpretao, pois este mtodo produzir grupos aparentemente bem separados e dendrogramas visualmente atraentes, mesmo em casos onde no existem grupos bem distintos (por exemplo, criado a partir de dados aleatrios). Por outro lado, excelente como mtodo para criar blocos relativamente homogneos, em situaes de gradiente ecolgico Mtodo flexvel - Atravs do parmetro Beta (nos limites 1,0 ? < 1,0), o usurio pode modificar o comportamento do mtodo, produzindo resultados semelhantes a ligao simples ( prximo a 1,0) ou ligao completa ( prximo a -1,0). Um valor de = 0,0 idntico ao WPGMA. Um valor em torno de 0,25 recomendado por muitos autores, mas estudos de simulao sugerem que valores mais prximos a 0,4 podem ser melhores quando existem muitos "outliers" nos dados (Milligan, ????). Enfim, a principal virtude do mtodo de permitir que se varia continuamente as propriedades de agrupamento, examinando a estrutura dos dados de uma forma muito mais completa. O principal problema com este mtodo a tentao de ficar "ajustando" a anlise, via diferentes valores de , at achar um agrupamento que concorda com as idias preconcebidas do pesquisador. Isso no um uso legtimo do mtodo flexvel! O algortmo usado para calcular as matrizes intermedirias durante o processo de agrupamento (Wishart, ??) no vlido para todas as combinaes de coeficiente e mtodo de agrupamento. Em casos onde existe incompatibilidade, o programa destaca as combinaes que no so vlidas em outra cor e emite um aviso caso o usurio opta por uma destas. Se quiser, pode continuar a anlise, mas deve estar ciente que a anlise resultante NO uma realizao daquele mtodo de agrupamento com aquele coeficiente, mas uma transformao no muito bem definida da matriz original. Neste caso, a responsabilidade para interpretao da baguna resultante inteiramente do usurio! (veja a seo "compatibilidade de coeficientes e mtodos").

Estilo de dendograma permite escolher se quer o dendrograma em formato "normal (ou tradicional)", com nveis de fuso indicados por uma barra horizontal; em formato "cladograma",

Pr rs eli o m in ar

Ve

55

onde o nvel de fuso representado por um ponto e a aparncia geral do dendrograma semelhante a um cladograma; ou "treeview" que uma representao simplificado do dendrograma em formato de uma janela "treeview" do Windows. Note que o que produzido no formato "Cladograma" ainda um dendrograma ou "fenograma" no um cladograma verdadeiro! Medida de fuso permite optar pela distncia (ou coeficiente) original ou a funo objetiva como escala no dendrograma. O principal motivo para uso da funo objetiva que esta escala no produz inverses no dendrograma quando se utiliza os mtodos centride/WPMGC, pois a funo objetiva sempre cresce com sucessivas fuses e no produz as inverses comuns com estes mtodos quando se usa a escala de distncia. Com os outros mtodos, geralmente prefervel usar a escala de distncia que mais fcil de relacionar com a matriz original. O boto Dendrograma manda desenhar o dendrograma, quando as opes foram escolhidas. O boto ver resultados permite examinar o texto produzido pela anlise (coeficiente de correlao cofentico, etc.).

A Tela do Dendrograma
A tela que abre quando se manda desenhar um dendrograma permite uma srie de opes que modificam o dendrograma ou anlises subsidirias que ajudam a interpretar o dendrograma produzido. Estas opes e anlises so controlados pelos botes e outros controles encontradas na barra de comandos acima do dendrograma. As funes mais importantes so 1) as opes de dendrograma 2) anlise de grupos escolhidos no dendrograma e a anlise de qualidade da representao da matriz original via 3) correlao cofentica e 4) representao colorida das matrizes originais.

o primeiro conjunto de botes inclui:

Gravar grava uma cpia do dendrograma com arquivo no disco. Opes de formato de arquivo so "Enhanced Windows Metafile" [.emf] format usado pelo prprio windows e facilmente importada para MS Office, e outros programas. um formato vetorial que permite usar toda a resoluo da impressora, por exemplo, com resultados de boa qualidade. Recomenda-se este formato, especialmente se pretende inserir o grfico dentro de um documento Word. "Windows Metafile" [.wmf] verso simplificada do anterior, pode ser necessrio para alguns programs que no so capazes de ler a verso "enhanced". "Bitmap" [.bmp] um formato bitmap padro de Windows que tem tamanho e resoluo fixos. Quando de amplia, os "pixels" que formam a imagem podem ficar visveis. til para alguns programas de grficos que no aceitam metafiles, ou quando no necessrio ampliar muito a imagem. Note que a resoluo obtida da tela do seu micro e pode variar de um micro para outro, dependendo da configurao. "Dendrograma" grava o dendrograma no formato de arquivo do programa NY-SYSpc, que pode ser usado par desenhar ou analisar o dendrograma (por ex. com rvore de consenso que no est disponvel em FITOPAC).

56

Pr rs eli o m in ar

Ve

Copiar copia o dendrograma para a rea de transferncia ("clipboard") e posteriormente pode ser "colada" em outros documentos, etc. Note que o dendrograma copiado em formato "Enhanced Metafile". Config.[urar] permite configurar o dendrograma usando um controle do pacote "TeeChart" que foi utilizado para produzir os grficos em FITOPAC. Este controle relativamente complexo, mas permite modificar uma srie de caractersticas que no so acessveis no prprio FITOPAC. Recomendo um pouco de cautela (grave uma cpia antes de modificar) no uso deste comando, pois fcil fazer mudanas que alteram profundamente a imagem. Imprimir abre uma janela de "visualizao de impresso" de onde pode modificar as opes da impressora e imprimir o dendrograma. Opes - abre a tela de opes de dendrograma que permite escolher diversas modificaes do dendrograma bsico, incluindo cores, ordem dos objetos, sobreposio das variveis originais, etc. [veja "tela de opes do dendrograma"]. Note que o programa tenta ler o arquivo de dados que foi usado para calcular os coeficientes/distncias usados no dendrograma (necessrio para funcionamento de algumas opes) e dar mensagens de erro se no consegue ler este arquivo. Corr.[elao] cofen[tica] calcula a correlao confentica do dendrograma, uma medida do grau de concordncia entre dendrograma e a matriz de distncia/coeficiente original. Em geral, valores de 0,7 ou mais so considerados satisfatrios, como representao da matriz original, mas este nmero arbitrrio, e valores menores podem ser aceitveis, dependendo do tipo de dados e propsito da anlise. No se recomenda o uso direto deste coeficiente para escolher entre mtodos de agrupamento, pois pode ser demonstrado que alguns mtodos sempre produziro correlaes maiores que os outros (pelo menos com alguns coeficientes). melhor utilizar este ndice principalmente para indicar de a representao obtido no dendrograma adequada. as subopes disponveis so : 1) calculo da "correlao cofentica com grfico" calcula a correlao e mostra um grfico de disperso dos valores de fuso no dendrograma vs. os valores correspondentes na matriz original. Este grfico permite examinar a qualidade da representao com maiores detalhes. 2) clculo sem grfico produz somente o clculo da correlao (no arquivo de sada), sem a produo do grfico, e 3) gravar a matriz cofentica que corresponde ao dendrograma obtido. Esta matriz pode ser usada para calcular a correlao cofentica posteriormente (no mdulo de manipulao de matrizes de distncia/semelhana) ou para comparar com outros dendrogramas. Grupos permite acesso s funes de anlise dos grupos selecionados no dendrograma. Veja a seo "Analisando grupos em dendrogramas" para mais detalhes. Colorir matriz produz uma representao colorida da matriz de distncia/semelhana original e, se disponvel, da matriz de dados usada para ger-la. Ajuda a avaliar melhor a qualidade da representao da matriz original fornecida pela dendrograma. Veja a seo "Colorindo matrizes" para mais detalhes.

Modificando as dimenses do dendrograma na tela. Embora o programa tenta adaptar o dendrograma ao tamanho da tela, o grfico resultante pode ser insatisfatrio por diversos motivos. Se for alto ou largo demais, pode ser reduzido usando os botes com setas para "encolher" o grfico no sentido indicado pela seta. Um problema mais comum ocorre com anlises onde o nmero de objetos sendo analisados muito alto. Neste caso, no possvel colocar o dendrograma inteiro na tela e ainda ter espao suficiente para separar os nomes dos objetos, e o programa desenhar somente uma parte do dendrograma, garantindo espao suficiente para deixar os nomes legveis e as linhas do grfico bem separadas. Para ver as partes "escondidas", pode arrastar o grfico, usando o boto esquerdo do mouse e movimentando o mouse para a direta ou esquerda. Alternativamente, pode "encolher" o espaamento entre os objetos usando o controle deslizante direita dos botes de seta, at conseguir mostrar o dendrograma inteiro na tela, mas neste caso, provvel que os nomes vo ficar ilegveis.

Pr rs eli o m in ar

Ve

57

Escolhendo grupos e o modo "seleo de grupo" O principal objetivo da anlise de agrupamentos a deteco e definio de agrupamentos nos dados. A presena e composio dos grupos reconhecidos podem ser determinadas por inspeo do grfico. muito trabalhoso, porm, determinar o que que separa os grupos e como defini-los em termos das caracteres que foram medidos originalmente. Para ajudar neste processo, FITOPAC tem facilidades para marcar grupos e depois analisa-los usando diversas tcnicas. Para utilizar estes recursos necessrio, primeiro, colocar a tela de dendrograma no modo de seleo de grupos e marcar os grupos que deseja analisar. O modo de seleo ativado quando se clica na caixa "selec. ns" ou, alternativamente, clica no fundo do dendrograma com o boto direito do mouse e escolha "ligar marcar grupos". Neste modo, os ns do dendrograma so destacados com um crculo. Para designar um grupo, ao clicar com o boto esquerda no n que representa a "raiz" ou base do grupo desejado, voc pode escolher um nome e a cor usada para mostrar o grupo na tela. Quando se completa as escolhas de nome e cor, o grupo ser mostrado na tela na cor escolhida e fica marcado at desligar o modo de seleo dos grupos ou at mandar "limpar" os grupos [boto direito do mouse]. Uma vez que foram escolhidos um ou mais grupos, o boto "Grupos" ativada e os recursos do mdulo de anlise dos grupos ficam disponveis. (veja a seo "Analisando grupos em dendrogramas " para mais informaes). Alm de ligar/desligar o modo de seleo, com o boto direito do mouse voc pode: 1) "girar" o n isto , trocar os ramos direito e esquerda do n. Esta mudana no afeta o dendrograma (que pode ser visualizado como um "mobile", com as barras horizontais rgidas e capazes de girar, enquanto as linhas verticais so os "fios" flexveis conectando as barras), mudando somente a seqncia dos objetos dentro do grupo designado pelo no escolhido. 2) "limpar" os grupos e/ou cores escolhidos anteriormente 3) fazer um "zoom" para o n selecionado que fica como raiz da parte visvel do dendrograma. Esta uma outra maneiro de visualizar dendrogramas grandes que no cabem inteiros na tela 4) desfazer um "zoom" feito anteriormente.

Analisando grupos em dendrogramas

Uma vez que algum grupo foi designado na tela de dendrograma, o boto "Grupos" torna-se disponvel e quando acionado, abre uma nova tela de anlise de grupos.

58

Pr rs eli o m in ar

Ve

Listar membros Produzir uma listagem dos membros de cada grupo. Particularmente til com anlises grandes onde pode ser difcil identificar todos os membros de cada grupo. Por grupo fornece uma anlise das variveis originais (mdia, desvio padro, mximo, mnimo) dentro de cada grupo isto , cada varivel analisada dentro de cada grupo. Por varivel os mesmos dados que a opo anterior, mas organizados por varivel, com os grupos analisados individualmente dentro de cada varivel. Grfico BW produz um grfico do tipo "Box and Whiskers" para cada varivel escolhida. Este grfico mostra para cada grupo os limites extremos de variao (separados como pontos isolados no caso de valores realmente extremos "outliers"), a mediana (linha horizontal central) e uma caixa cujos limites so os quartis. Isso quer dizer que 50% das observaes esto "dentro" da caixa, 25% acima e 25% abaixo. Esta representao facilita a comparao entre grupos e mostra claramente se existe sobreposio entre grupos, alm de dar uma idia do tipo de distribuio que tem dentro de cada grupo.

Ve

Salvar Grupos Grava o grupo a qual cada objeto pertence para uso em outras anlises ou como varivel marcadora para grficos, etc. Pode 1) gravar os grupos marcados num arquivo novo, criado com uma nica varivel chamado "Grupo" contendo os nmeros que correspondem aos grupos marcados no dendrograma; 2) Gravar os grupos dentro do arquivo de dados originais particularmente til quando se pretende usar a mesma matriz para ordenao e quer comparar os grupos obtidos com os resultados da ordenao; 3) Gravar os dados em alguma outra matriz, num outro arquivo. Neste caso, importante que o nmero de linhas neste arquivo seja igual ao nmero de objetos na anlise de agrupamento.

Pr rs eli o m in ar

As principais opes disponveis so:

59

Matriz examinar a matriz de dados.

Fitopac oferece esta opo para anlise de matrizes nos mdulos de anlise de agrupamentos e ordenao. No caso de anlise de agrupamento, dois tipos de visualizao so possveis:

1) da matriz de distncia/semelhana neste caso, a matriz reordenada de acordo com a seqncia de objetos no dendrograma. As clulas so coloridas com valores altos de semelhana (baixas distncias) em vermelho, e valores baixas de semelhana (grandes distncias) em azul. Valores intermedirios tero cores intermedirios. Quando uma matriz tem estrutura bem-definida, com agrupamentos bem separados e esta estrutura fielmente representada pelo dendrograma, fica evidente na forma de uma srie de blocos bem separados de alta semelhana ao longo do diagonal da matriz. Quando os grupos tem pouca sobreposio, os blocos so triangulares, refletindo a alta semelhana dentro do grupo e a falta de semelhana com outros grupos. 2) da matriz de dados originais da mesma maneira, a matriz de dados pode ser reordenada, tendo os objetos (normalmente as linhas da matriz) na mesma seqncia que o dendrograma e, no caso de anlise de agrupamentos, as colunas ordenadas de acordo com a correlao entre os valores da varivel e a seqncia de objetos isto , as variveis com maior correlao com o agrupamento obtido esto nos extremos (correlaes negativas e positivas) e variveis que so indiferentes, com pouca correlao com a sequncia do dendrograma, so colocadas no centro da matriz. De novo, os valores so coloridos numa seqncia de azul at vermelha, refletindo valores baixos e altos respetivamente. Neste caso, a colorao aplicada individualmente dentro de cada varivel

60

Ve

Em alguns casos, necessrio investigar o contedo de uma matriz de semelhana/distncia ou uma matriz de dados para avaliar se uma anlise foi bem-sucedida e reflete a estrutura da matriz satisfatoriamente. Embora seja possvel fazer uma anlise deste tipo por inspeo dos valores presentes na matriz original usada para a anlise, este processo difcil e muito trabalhoso e sujeito a erros, especialmente quando a matriz for grande. Este processo pode ser facilitada por duas modificaes: 1) rearranjo das linhas e colunas para refletir os resultados da anlise a ordem dos objetos no dendrograma em anlise de agrupamentos ou a seqncia dos objetos/variveis ao longo do primeiro (ou outro) eixo de uma ordenao. 2) colorir as clulas da matriz de acordo com os valores que contm. Desta maneira, a estrutura da matriz pode ser visualizada diretamente, facilitando o processo de avaliao.

Pr rs eli o m in ar

Colorindo matizes

(coluna) equivalente a estandardizao por varivel. Se desejar estandardizar dentro dos objetos (linhas), pode "desligar" a opo "por coluna".
No caso de ordenao, geralmente somente a segunda representao est disponvel, e as linhas e colunas esto ordenadas pelos escores correspondentes no primeiro eixo da ordenao (escores linhas/colunas na CA e escores/autovetores na PCA).

Exemplos de matrizes com estrutura bem definida e bem representada pelo dendrograma:

uma matriz com estrutura fraca, mal-representada no dendrograma:

matriz de dados com estrutura forte, bem representada por uma ordenao (neste caso, com estrutura de gradiente):

Pr rs eli o m in ar
61

Ve

Opes para dendrogramas

A tela de opes para dendrograms permite selecionar uma srie de opes que modificam o dendrograma e ajudam a interpretar os resultados. Algumas opes (especialmente a opo de colorir ou "pintar" o dendrograma com cores representado as variveis originais) necessitam da matriz original de dados usados para calcular os coeficientes ou distncias que deram origem ao dendrograma. possvel, tambm, usar uma outra matriz de dados para colorir o dendrograma pelos valores das variveis que contm ou para ordenar os ramos do dendrograma por algum critrio externo.

Modificar a matriz de dados, utilizando a planilha Acrescentar dados acrescenta dados de uma outra matriz num arquivo indicado pelo usurio. Esta operao permite acrescentar variveis que no foram usadas para produzir os coeficientes ou distncias que formaram o dendrograma. Por exemplo, valores par variveis de solo poderiam ser sobrepostos num dendrograma que foi construdo utilizando somente dados de composio da vegetao. Desta maneira, possvel verificar visualmente se eventuais agrupamentos na vegetao esto correlacionados com fatores externos como solo. Esta opo tem algumas limitaes: idealmente, a matriz sendo acrescentada deve ter o mesmo nmero de linhas que o nmero de UTOs no dendrograma; Os nomes das linhas devem corresponder exatamente com os nomes das UTOs; No deve haver duplicao de nomes das linhas da

62

Pr rs eli o m in ar

Ve

matriz ou das UTOs no dendrograma. Ao escolher uma matriz a ser acrescentada, o programa far uma operao de juntar matrizes lado ao lado, e os dados sero acrescentados como novas colunas da matriz. Caso ocorra algum problema, as mensagens de erro so aquelas do processo "juntar matrizes lado ao lado ". Colorir o dendrograma o programa oferece diversas opes para colorir ou "pintar" os ramos do dendrograma:uniforme deixa todos os ramos com a mesma cor por grupos deixa os ramos coloridos de acordo com os grupos escolhidos no prprio dendrograma, usando o recurso "marcar grupos". Quando se marca grupos desta maneira, esta opo ligada automaticamente, mas pode ser desligada por outras opes e este comando permite recuperar esta colorao. por varivel talvez o mais interessante das opes, esta permite colorir o dendrograma de acordo com os valores de uma das variveis na matriz de dados (com as variveis originais ou com o acrscimo de outras variveis veja "Acrescentar dados", acima). O efeito desta opo de colorir os ramos que correspondem s UTOs com uma cor que corresponde ao valor da varivel escolhida, com as cores variando continuamente de azul para o valor mnimo da varivel at vermelho para o valor mais alta, enquanto valores intermedirios recebem tonalidades variando de verde at amarelo e laranja. os ramos posteriores que representam agrupamentos recebem uma cor que reflete a mdia aritmtica dos membros do grupo. Assim, possvel representar visualmente a variao de uma varivel escolhida no dendrograma inteiro. Em casos onde foram utilizadas variveis binrias, as cores refletem a freqncia dos estados 0 e 1 em cada ramo do dendrograma. O valor numrico correspondendo cor pode ser revelado se ligar as "etiquetas" dos ns com a opo "valor para cores". por grupo em varivel difere da opo "por grupo" porque usa valores de grupo contido numa varivel da matriz de dados. Estes grupos podem representar resultados de outros mtodos de agrupamento j armazenados num arquivo ou mtodos completamente diferentes como TWINSPAN, ou qualquer varivel descontnua que pode ser considerada como um delimitador de grupos (tipo de solo, taxon, etc.). Difere da opo "por varivel" por que espera dados discretos que podem ser tratados como marcadores de classes distintos e no contnuas, como na opo anterior. Note que as cores usados para demarcar os grupos tambm so descontnuas. Varivel para cores escolhe a varivel usada para colorir o dendrograma

Pr rs eli o m in ar

Ve

63

Ordenao
Ordenao - Introduo
A ordenao consiste um processo de ordenar amostras/objetos ou espcies/caractersticas de acordo com algum critrio para realar algum aspecto ou aspectos dos dados, geralmente com a inteno de explicar a estrutura de uma comunidade ou o padro de variao observado dentro de um conjunto de observaes morfolgicos. As tcnicas usadas para ordenar dados variam de mtodos relativamente simples a mtodos extremamente complexos e difceis de interpretar. Estes mtodos, em geral, so de aplicao muito ampla, podendo ser usados para diversos tipos de estudos em diferentes reas de pesquisa, desde anlise de comunidades a taxonomia e muito alm (inclusive anlises de textos literrios, astronomia, geologia, geografia, arqueologia, etc.). Por causa da diversidade de reas de aplicao, vrias destas anlises tem sido reinventadas mais que uma vez, em diferentes campos de estudo, e com diferentes nomes. Em estudos ecolgicos, o uso mais freqente de ordenao na investigao de gradientes ambientais, pois a presena de um gradiente impe uma estrutura no conjunto de dados que pode ser detectada por diversos mtodos de ordenao. Fitopac contm uma pequena seleo de mtodos de ordenao que permite realizar algumas das analises mais simples. Para anlises mais especializadas ou complexas, sugiro o uso de "pacotes" especficos como "CANOCO" ou pacotes estatsticos como "SYSTAT" ou "Statistica". As anlises fornecidas em Fitopac incluem 1) anlise indireta de gradientes [PCA, CA, PCO] e 2) anlise direta de gradientes [RDA, CCA], segundo a terminologia de ter Braak e Prentice (1988). Anlise indireta de gradientes analisa uma nica matriz, geralmente representando a ocorrncia de espcies dentro das amostras de um levantamento fitossociolgico, e infere a natureza do(s) gradientes(s) presente(s) a partir das correlaes entre as espcies (PCA) ou a relao entre espcies e amostras (CA). A PCO utilizada para investigar a estrutura de matrizes de semelhana ou distncia, quando uma matriz de abundncia no est disponvel, e se tem somente uma estimativa da semelhana ou distncia entre objetos.

Anlise de Componentes Principais (PCA) - Esta anlise tenta produzir um novo sistema de eixos que maximiza a quantidade de varincia do primeiro eixo em diante, sempre sujeito limitao que os eixos so ortogonais isso quer dizer que a rotao dos eixos encontrada por PCA uma rotao rgida, que no muda o ngulo entre eixos, nem as distncias entre objetos. Pressupe que a relao entre espcies (descritores ) seja linear e , portanto, sujeito a graves problemas quando os dados sendo analisados representam um gradiente longo e curvilinear. Nestas circunstncias, CA geralmente prefervel. Alguns autores tratam PCA como obsoleta para anlise de dados ecolgicos, mas onde usada corretamente (ie, em gradientes relativamente curtos e lineares), os resultados freqentemente so melhores e mais fceis de entender que aqueles produzidos por CA, sendo menos afetados por "outliers" (dados extremos) e interpretveis em termos geomtricas. Esta a anlise mais simples de todo o conjunto de mtodos de ordenao includos neste pacote. Anlise de Correspondncias (CA) - Originalmente concebida para anlise de tabelas de contingncia, analisa os desvios das propores esperadas a partir das somas marginais da matriz de dados. Comparada com PCA, esta anlise simtrica, tratando linhas e colunas da matriz da mesma maneira e em escalas diretamente comparveis, mas altera o espao de ordenao antes de procurar os eixos de varincia (ou neste caso "inrcia") mxima, ponderando as amostras pela quantidade de indivduos em cada e as espcies pelo nmero de amostras onde ocorrem, produzindo uma anlise que no to sensvel a relaes curvilineares como PCA. Recomenda-se o uso desta anlise em situaes onde tem gradientes moderados e onde o efeito de "arco" ou "ferradura" pode dificultar a interpretao de uma anlise PCA. Uma desvantagem desta anlise a sua sensibilidade a "outliers" ou dados mais extremos (por exemplo uma espcie relativamente rara que ocorre em abundncia em poucas amostras), que pode resultar em eixos que efetivamente separam somente uma nica amostra/espcies do resto, sendo pouco informativos para o conjunto de dados como um todo.

64

Ve

A) Anlise indireta de gradientes -

Pr rs eli o m in ar

Tambm conhecida como "Mdias Reciprocas Reciprocal Averaging (RA)" e diversos outros nomes (Correspondence Analysis, Analyse Factorielle des Correspondances, Dual Scaling, etc.) Foi desenvolvida inicialmente para anlise de tabelas de contingncia e posteriormente ampliada para uso com outros dados quantitativos. . Anlise de Coordenados Principais (PCO) - Analisa matrizes de distncia ou semelhana, produzindo um sistema de eixos descrevendo as posies dos objetos no espao de tal maneira de as distncias entre os objetos reproduzem a matriz original. Esta uma anlise extremamente verstil, pois pode utilizar quase qualquer distncia ou coeficiente de semelhana, e os resultados refletem as propriedades da distncia ou coeficiente escolhido. Um problema srio pode ocorrer, porm, com o uso de coeficientes no mtricos (??) - estes no tem uma representao exata no espao, e podem levar a situaes onde alguns autovalores so negativos. Os eixos correspondentes no podem ser interpretados e, em casos onde o valor absoluto dos autovalores negativos chega prximo aos valores dos maiores autovalores positivos, a interpretao da ordenao altamente duvidosa e deve ser tratado com muito cautela. Esta anlise tambm conhecido como "Classical Scaling" ou "metric Multidimension scaling".

Biplot de Gabriel
B) Anlise direta de gradientes Anlise de Redundncias (RDA) - Esta uma anlise cannica que tenta encontrar eixos que descrevem o mximo possvel de varincia na matriz de dados, sujeito limitao que os escores obtidos sejam uma combinao linear das variveis contidas numa segunda matriz contendo os dados ambientais. A varincia explicada desta maneira chamada de redundncia e da que vem o nome da anlise. Pode ser descrito como um PCA com restries impostas pela matriz de dados ambientais ou, alternativamente, como uma forma de Anlise de Correlao Cannica (CANCOR) onde se maximiza a varincia explicada entre as matrizes e no a correlao. Sujeito s mesmas limitaes e vantagens que a PCA, esta anlise mais indicada em casos onde os gradientes sendo investigados so relativamente curtas e lineares. Como PCA e CA, RDA menos sensvel a "outliers" que a CCA. Anlise Cannica de Correspondncias (CCA) Outra anlise cannica, mas neste caso a PCA substituda por CA, e a anlise equivalente a CA com a restrio que os escores, de novo, sejam combinaes lineares das variveis ambientais. Compartilha as mesmas vantagens e desvantagens que a CA, mas at um certo ponto pode remover o efeito de arco em gradientes mais longos, se as variveis ambientais tem uma relao linear com o gradiente. As amostras e espcies so tratadas da mesma maneira como em CA, mas esta anlise produz escores em escalas diferentes que representam melhor ou as amostras ou as espcies. O programa oferece os dois tipos de escore como opes. Os escores das amostras tambm podem ser calculadas a partir dos escores das espcies (escores WA), ou a partir das variveis ambientais (escores LC). Em geral, recomenda-se utilizar os escores LC (baseados nos dados ambientais), mas no existe consenso total sobre o melhor conjunto de escores (veja McCune 1997, Palmer http://ordination.okstate.edu/ e Legendre e Legendre 1998), e segundo McCune, os escores WA so preferveis quando existe muito "rudo" no dados ambientais. As diferentes escalas e mtodos de calcular os escores so explicados em detalhes em Legendre e Legerdre (1998). CCA tornou-se uma das anlises mais utilizadas em estudos de comunidades, mas sua interpretao requer bastante cuidado, devido complexidade dos resultados produzidos.

A Tela de Ordenao
Ao escolher Ordenao, abre-se uma janela que permite escolher o tipo de ordenao e a configurao da ordenao.

Pr rs eli o m in ar

Ve

65

Use a caixa "Tipo de anlise" para escolher entre os principais tipos de ordenao. Os tipos disponveis nesta verso so: A) Anlise indireta de gradientes -

Anlise de Componentes Principais (PCA) Anlise de Correspondncias (CA)

Anlise de Coordenados Principais (PCO) Biplot de Gabriel

B) Anlise direta de gradientes Anlise de Redundncias (RDA)

Anlise Cannica de Correspondncias (CCA)

Note que as opes RDA e CCA estaro disponveis somente depois de indicar uma matriz de variveis ambientais, j que estas anlises so utilizadas para investigar a relao entre pares de matrizes, uma de dados de uma comunidade e a outra de dados ambientais. boto Ordenar executa a anlise escolhida, aps a configurao da anlise. boto Modificar Matriz fazer modificaes da matriz principal como transformaes, eliminao de amostras e variveis, etc. antes de comear a anlise. [veja usando a planilha] boto Dados Ambientais usado para escolher um arquivo contendo a matriz de dados ambientais (por exemplo, caractersticas de solo, declividade, elevao, aspecto, etc.) para anlises cannicas (RDA e CCA). No tem efeito para anlises simples (PCA, CA, PCO e Biplot). boto Modificar Dados Ambientais fazer modificaes da matriz secundria de dados ambientais. Ativado somente quando uma matriz de dados ambientais j foi escolhida. [veja usando a planilha]

66

Pr rs eli o m in ar

Ve

As Opes
PCA : Correlao/Covarincia - o uso da opo "correlao" extrai os autovalores e autovetores da matriz das correlaes entre variveis, e equivalente utilizao de dados estandardizados i.e. cada varivel tem mdia = 0,0 e desvio padro = 1,0. Esta opo deve ser usada quando as variveis includas na anlise tem escalas de medio ou unidades muito diferentes (ex. peso em kg e altura em metros), ou quando se deseja reduzir o efeito de variveis com varincias maiores (ex. espcies dominantes num levantamento) que tendem a dominar a anlise quando se usa a matriz de covarincia. Esta opo produz uma anlise onde toda as variveis contribuem igualmente, e onde o total de varincia igual ao nmero de variveis, e tende a enfatizar propores (ou forma) mais do que abundncia (tamanho). Por outro lado, a opo Covarincia extrai os autovalores e autovetores de uma matriz de covarincia e deve ser usada quando as variveis tem escalas e unidades semelhantes, e quando se deseja que variveis com maiores varincias fazem uma contribuio maior varincia total - por exemplo, uma anlise de dados de abundncia de espcies dentro de uma comunidade onde o foco principal de interesse nas espcies dominantes. Esta opo equivalente ao uso das variveis originais, sem qualquer estandardizao, e torna a anlise mais sensvel a abundncia (tamanho) e da menos nfase a proporo (forma). Centrada/No Centrada a opo "Centrada" utiliza um sistema de coordenados onde o origem de cada eixo est na mdia da varivel correspondente. Isso quer dizer que o origem do sistema de coordenados no centride da nuvem de pontos que representam os dados no espao multidimensional. Esta a forma de anlise mais comum, e geralmente mais fcil de interpretar. A verso no centrada utiliza o zero da escala original de medio das variveis como origem. Alguns autores sugerem que os eixos resultantes da anlise no centrada so mais polarizados e fceis de interpretar, quando se trata de uma anlise PCA de comunidades muito distintas, com pouca sobreposio nas espcies presentes em cada (veja Grieg-Smith, 19?? e Pielou, 19?? par mais detalhes e discusso). Os resultados tambm podem ser interpretados em termos de riqueza e diversidade (veja ter Braak, 19?? para detalhes). Esta forma de PCA relativamente pouco usada. Note que estes opes so independentes, sendo possvel escolher 4 combinaes : Correlao/Centrada, Correlao/No-Centrada, Covarincia/Centrada e Covarincia/NoCentrada.

PCO: No momento, no h opes para este tipo de anlise. Disponvel somente com matrizes de semelhana ou distncia. Biplot (Gabriel): No momento, no h opes para este tipo de anlise. RDA: No momento, no h opes para este tipo de anlise.

CCA: Ao escolher CCA, ficam disponveis duas escalas para apresentao dos resultados tipo 1 e tipo 2 - que correspondem aos "scaling 1" e "scaling 2" de Legendre e Legendre (1998). Efetivamente, escala tipo 1 apropriada quando se deseja enfatizar as relaes entre as amostras neste caso os escores representam corretamente as distncias 2 entre as amostras. A escala tipo 2, ao contrrio, indicada para casos onde se deseja dar nfase s espcies, pois os escores neste caso preservam corretamente as distncias entre espcies. "Scaling type 3" de Legendre e Legendre (1998) no est disponvel, no momento. Aps a escolha das opes, utilize o boto "Ordenar" para realizar a anlise. Antes de executar a anlise, o programa tenta detectar eventuais problemas variveis sem variao, linhas que s tem dados faltando, etc. e elimina as linhas/colunas que esto causando o problema alem de tentar detectar condies que no so permitidas pelo mtodo de anlise escolhido por exemplo, valores negativos em CA ou CCA. Dados faltando no so permitidos nestas anlises ao detectar dados faltando, o programa oferece as opes de 1) substituir os valores faltando pela mdia da varivel 2) excluir a linha (objeto) 3) excluir a coluna (varivel) e 4) abandonar a anlise. A ao mais apropriada depende dos dados e da inteno do investigador. A substituio pela mdia permite usar a

Ve

CA : No momento, no h opes para este tipo de anlise.

Pr rs eli o m in ar

67

matriz inteira mas, inevitavelmente, introduz alguma distoro que pode ser severo se o nmero de valores faltando seja grande. Opes 2 e 3 provavelmente so mais corretas, mas envolvem a perda de pelo menos um objeto ou varivel. Em casos onde importante fazer a anlise apesar da presena de dados faltando, uma alternativa o clculo de uma matriz de distncias ou similaridades entre objetos (veja a seo Calculando Distncias....) , que permite valores faltando, seguido por uma anlise PCO da matriz de distncia/similaridade. Note, porm, que a presena de valores faltando pode tornar uma matriz que normalmente seria mtrica numa matriz no-mtrica, causando problemas na interpretao dos resultados.

Visualizando e interpretando resultados de uma ordenao


A tela de resultados de ordenao varia com o tipo de ordenao realizada, especialmente para anlises cannica e no-cannicas, mas ambos consistem de 3 partes principais 1) visualizao dos resultados na forma de tabelas e listagem; 2) gravao dos resultados (tabelas) como arquivos Fitopac (FPM) que podem ser usados para outras anlises ou com outros programas (por exemplo para produo de grficos); 3) Grficos mostrando os principais resultados. Para anlises no-cannicas (PCA, CA, PCO, Biplot) - botes: Vis. Arq(uivo) visualizar um arquivo. Gravar gravar os arquivos contendo as tabelas de resultados (em formato Fitopac FPM). Os arquivos gravados so determinados pelas caixas de seleo no painel "Gravar". Os nomes dos arquivos so gerados automaticamente pelo programa e consistem do nome do arquivo de dados original com o acrscimo de uma descrio do contedo - por ex. "Genebra-CA-escores das linhas.FPM" onde o matriz de dados foi "genebra.fpm". No necessrio gravar estes arquivos, mas so convenientes se pretende fazer outras anlises usando os resultados obtidos ou se quiser usar algum outro programa para fazer grficos dos resultados. Resultados visualiza os resultados como texto no formulrio de sada. Note que este sada NO gravado automaticamente, mas somente quando o usurio manda gravar de dentro do formulrio de resultados.

68

Pr rs eli o m in ar

Ve

Dados faltando em anlises multivariadas


Em diversos tipos de anlise multivariada, a matriz no pode ter dados faltando. Nestes caos, as opes disponveis em Fitopac incluem:

a)

substituir o valor da mdia do varivel no lugar do dados faltando. A mdia usada a mdia aritmtica da coluna da matriz onde o dado faltando se encontra. Aceitvel quando tem poucos valores faltado, mas vai produzir estimativas viciadas de autovalores, escores em eixos, etc. No deve ser usada quando faltam muitos dados nesta situao, a anlise vai ser modificada de maneiras imprevisveis e as estimativas no so confiveis.

b) Eliminar a coluna ou colunas contendo os dados faltando. A melhor opo quando os dados faltando so numerosos e tendem a ficar concentrados em poucas variveis ( por exemplo alguma caracterstica que difcil de medir ou que falta freqentemente em muitos espcimes) c) Eliminar a linha ou linhas contendo os dados faltando. Melhor opo quando os valores faltando esto concentrados em uma ou poucas amostras que so particularmente incompletas (espcime faltando diversos rgos, etc.)

d) Parar a anlise.

Pr rs eli o m in ar

Em casos onde faltam muitos dados (>5% da matriz), provvel que os resultados obtidos sero questionveis com qualquer uma destas opes, exceto a ltima! Nesta situao preciso decidir se realmente vale a pena continuar com uma anlise que inevitavelmente ser muito pouco confivel, ou se no seria mais prudente tentar completar a matriz com dados reais, eliminando este problema.

Ve

69

Chamando outros programas


janela decorana
A janela DECORANA permite escolher diversas opes antes de executar o programa. Algumas destas opes so complexas e requerem um bom conhecimento do programa DECORANA para serem usadas corretamente. Recomenda-se uma leitura cuidadosa do manual do usurio deste programa antes de alterar as opes. Em geral, os valores pr-selecionados pelo FitopacShell correspondem aos valores "default" do programa como descrito por Hill, e para muitas anlises, seria suficiente executar o programa, sem alterar os valores preestabelecidos.

Anlise Distendia - determina se ser utilizada DCA (valor preestabelecido) ou CA (se a caixa estiver em branco) Criar arquivo de saida - se for marcado (padro), grava um arquivo "XXX.SCR" contendo escores para linhas e colunas da matriz original XXX, no formato descrito por Oksanen e Minchin. Pode ser usado por outros programas, mas no diretamente por FITOPAC ou diversos outros pacotes. Saida Fitopac - se for marcado (padro), converte o arquivo "SCR" do DECORANA em dois arquivos FITOPAC - "XXXEscoresDasColunas.FPM" e "XXXEscoresDasLinhas.FPM", contendo os escores das Colunas e Linhas da matriz original respetivamente. Estes arquivos podem ser utilizados por outros programas do FITOPAC ou convertidos a outros formatos utilizando "MATRIZ" ou "Winmat" Eliminar Amostras - permite eliminar algumas amostras antes de executar a anlise. Note que as amostras no so removidas do arquivo original. Ao apertar este boto, aparece mais uma tela que permite escolher quais so as amostras que sero eliminadas. Veja "Eliminando ou Mascarando itens". Utilizar "Anlise Padro" - Se esta caixa for marcada, a anlise ser feita utilizando os valores padro (defaults) do DECORANA - no, de segmentos, "rescaling", etc. Caso queira alterar estes valores, desmarca esta caixa, e os campos adicionais aparecero. Recomendo no alterar estes valores se no entende o que significam ! (veja o manual do usurio de DECORANA para mais detalhes).

70

Pr rs eli o m in ar

Ve

Reduzir peso de espcies raras - quando marcada, aplica uma anlise onde o peso das espcies raras reduzido - provavelmente desejvel na maioria de anlises onde a matriz contem muitas espcies raras. Transformar dados - se for escolhida esta opo, uma transformao dos dados aplicada, utilizando o formato do prprio DECORANA. essencial que voc entende este formato para utilizar esta opo. (veja o manual do usurio de DECORANA par mais detalhes). Em muitos casos, pode ser mais interessante fazer transformaes utilizando MATRIZ ou Winmat e gravando o resultado antes de usar DECORANA. Executar - o boto executar vai executar o programa DECORANA, e deve ser acionado quando tem feito todas as alteraes que deseja fazer nas opes do programa. Ver resultado - Aps a execuo do programa, aparece este boto que, quando acionado, mostra o arquivo de sada principal do programa contendo os resultados da anlise. Estes resultados podem ser gravados como um arquivo rtf que pode ser importado diretamente por "Word" e diversos outros programas.

Cancelar - para cancelar a anlise DCA antes de execut-la.

janela twinspan

Esta tela oferece um interface que permite usar a verso DOS do programa "TWINSPAN" a partir do Fitopac, facilitando seu uso, pois permite utilizar as facilidades de Windows para responder s perguntas do programa DOS que no muito "amigvel" na sua forma original. Deve ser notado, porm, que j existe uma verso Windows do programa, e que a atual verso efetivamente obsoleta, embora produz os clculos corretamente. Em geral, recomendo usar a verso Windows (gratis. Download do site : http://www.canodraw.com/wintwins.htm ou de http://www.ceh.ac.uk/products/software/wintwins.html) provvel que este interface no ser mantido na prxima verso do Fitopac.

A janela TWINSPAN permite escolher diversas opes antes de executar o programa. Algumas destas opes so complexas e requerem um bom conhecimento do programa TWINSPAN para serem usadas corretamente. Recomenda-se uma leitura cuidadosa do manual do usurio deste programa antes de alterar as opes. Em geral, os valores pr-selecionados pelo FitopacShell correspondem aos valores "default" do programa como descrito por Hill, e para muitas anlises, ser suficiente executar o programa, sem alterar os valores preestabelecidos.

Pr rs eli o m in ar

Sair - este boto deve ser acionado para voltar ao programa FitopacShell quando termina a anlise e exame dos arquivos de resultados est completa

Ve

71

No. mximo de nveis de diviso - indica o nmero de nveis de subdiviso dos grupos. Com matrizes grandes, pode ser necessrio usar 5 ou 6 nveis, mas na maioria dos casos (especialmente quando a matriz no muito grande), 3 ou 4 nveis so suficientes.

Quer diagramas das divises - se esta caixa for marcada, o programa imprime um diagrama para cada diviso, mostrando amostras mal-classificadas, etc. Veja o manual de TWINSPAN para maiores explicaes. No. mximo de espcies na tabela - controla quantas espcies vo aparecer na listagem da tabela final. Normalmente deve ser igual ao nmero total de espcies, mas em levantamentos muito grandes, pode ser interessante limitar o nmero de espcies para evitar que a tabela fique muito extensa. Gravar resultados em arquivo - opo do TWINSPAN para gravar os resultados da diviso dos grupos num arquivo que pode ser usado por outros programas. No momento, FITOPAC no capaz de ler estes arquivos, e no conheo programa com esta capacidade. A utilidade desta opo, portanto, meio reduzida. Eliminar Espcies e Eliminar Amostras - estes botes acionam uma tela que permite escolher quais espcies/amostras sero removidas da anlise. Note que esta remoo temporrio - no so removidas da matriz original. (Veja "Eliminando ou Mascarando itens"). Pseudoespcies - este um dos campos mais importantes pois determina como o programa utiliza dados quantitativas, via o mecanismo de criao de "pseudoespcies". A idia que diferentes densidades (ou outra medida) de uma espcie sejam representadas como se fossem espcies distintas (as "pseudoespcies") e estas podem ser usadas como indicadores e no somente a presena ou ausncia da espcie. Assim, uma alta densidade de uma dada espcie pode ser usada como indicador de um

72

Ve

No. mximo de indicadores por diviso - controla o nmero mximo de espcies indicadoras selecionadas para cada diviso feita durante a anlise.

Pr rs eli o m in ar

Tamanho mnimo de grupo - indica o tamanho mnimo do grupo para subdiviso. Se o grupo for menor que este valor, no ser mais subdividido

tipo de vegetao, mesmo que a espcie esteja presente em baixa densidade em todos os outros tipos de vegetao. Para definir as pseudoespcies, necessrio fornecer os nveis de corte para subdiviso das espcies. Trs opes so oferecidas aqui 1) os valores "default" do programa TWINSPAN, com 5 nveis de corte de 0 2 5 10 20. Isso quer dizer que ter os seguintes pseudoespcies :valor x=0 0 < x <= 2 2 < x <= 5 5 < x <=10 10 < x <= 20 x > 20 pseudoespcie ausente (0) 1 2 3 4 5

2) um nico nvel de corte - 0. Tudo tratado como presena ou ausncia (isto , qualquer valor diferente de 0 tratado como "pseudoespcie 1") 3) valores definidos pelo usurio. So permitidos at 9 nveis de corte. Se escolher esta opo, aberta uma caixa de dialogo onde o nmero de nveis informado, e o programa ento abre uma tabela onde pode inserir os nveis de corte, junto com os peso das pseudoespcies e seus potenciais indicadores. O peso (valor inteiro de 0 - 1000000) e potencial indicador (0 ou 1) da pseudoespcie determinam o peso que aquela pseudoespcie receber nos clculos e se pode ser usada como espcie indicadora, respetivamente. Normalmente estes valores seriam 1, mas se quiser dar, por exemplo, importncia maior para pseudoespcies representando maiores valores, pode dar peso maior que 1. comum querer que espcies indicadoras sejam espcies "reais" e no pseudoespcies e, neste caso, pode dar um potencial indicador de 1 para o primeiro nvel e 0 para os outros. Os pseudoespcies devem estar em ordem crescente de abundncia. Note que o FitopacShell no faz qualquer tipo de verificao dos valores e simplesmente passa tudo diretamente para o programa TWINSPAN. (Veja o manual do TWINSPAN para maiores detalhes sobre estas opes).

Executar - o boto executa o programa TWINSPAN, e deve ser acionado aps a escolha de todos as opes da anlise.

Pr rs eli o m in ar

Ve

73

Ver resultado - este boto aparece somente aps de executar o programa e permite examinar o arquivo de resultados produzido e, se quiser, gravar como arquivo rtf que pode ser lido por Word, etc. Sair - voltar para FitopacShell depois de completar a anlise Cancelar - cancelar e voltar para FitopacShell.

74

Pr rs eli o m in ar

Ve

Bibliografia
referncias bibliogrficas
Legendre e Legendre Sneath & Sokal 1973

Pr rs eli o m in ar
75

Ve

Index
A
A Janela Ordenao .....................................................................................................................65 A tela Coefs..................................................................................................................................48 A Tela de Opes em Diagramas de Disperso ...........................................................................43 A Tela do Dendrograma...............................................................................................................56 A Tela Principal .............................................................................................................................9 Agrupamentos ..............................................................................................................................10 Analisando grupos em dendrogramas ..........................................................................................58 Anlise multivariada ....................................................................................................................10 Arquivos FPD ..............................................................................................................................10 Arquivos FPM..............................................................................................................................10

C
CADERNO ..................................................................................................................................10 Calculando Parmetros Fitossociolgicos....................................................................................47 Calcular parmetros fitossociolgicos .........................................................................................10 CLUSTER....................................................................................................................................10 COEF ...........................................................................................................................................10 Coeficientes..................................................................................................................................10 Coeficientes de semelhana e distncias em Fitopac ...................................................................48 coeficientes e distncias usados em Fitopac.................................................................................49 Colorindo matizes ........................................................................................................................60 Comando Arquivos ......................................................................................................................12 Configurao..................................................................................................................................7 Configurao do FITOPAC .........................................................................................................10 Consideraes gerais......................................................................................................................8 Convertendo dados crus em matriz ..............................................................................................18 Cornell..........................................................................................................................................10 CRIAMAT ...................................................................................................................................10 Criando Grficos ..........................................................................................................................39 Criando grficos diretamente .......................................................................................................39

DAD.............................................................................................................................................10 Dados crus....................................................................................................................................10 Dados faltando em anlises multivariadas ...................................................................................69 DECORANA ...............................................................................................................................10 Dendrogramas ..............................................................................................................................45 Diagramas de disperso................................................................................................................41 Diagramas de vetores ...................................................................................................................45 Distncias .....................................................................................................................................10

E
eliminando linhas ou colunas .......................................................................................................28 Eliminando ou Mascarando..........................................................................................................28 Examinando editando e imprimindo dados ................................................................................15

F
FitopacShell - Introduo...............................................................................................................5 Formatos de Arquivo ...................................................................................................................16 FPC ..............................................................................................................................................10

76

Pr rs eli o m in ar

Ve

G
Grficos 3D ..................................................................................................................................46 Grficos de Barra .........................................................................................................................45 Grficos de caixa..........................................................................................................................46 Grficos de linha ..........................................................................................................................45

I
Importando matrizes.....................................................................................................................21 Instalao .......................................................................................................................................7 Introduo ......................................................................................................................................5 Introduo a anlise de Agrupamentos ........................................................................................54

J
Janela DECORANA ....................................................................................................................70 Janela TWINSPAN ......................................................................................................................71

L
Lendo e convertendo dados num arquivo FPD ............................................................................14

M
MATRIZ ......................................................................................................................................10 matriz espcies raras ....................................................................................................................32 Modificando e manipulando arquivos de coeficients ...................................................................49

NMS.............................................................................................................................................10 Nomes suspeitos...........................................................................................................................33

O formulrio de resultados...........................................................................................................37 O Menu Principal .........................................................................................................................10 Opes para dendrogramas ..........................................................................................................62 Ordenao ....................................................................................................................................10 Ordenao - Introduo................................................................................................................64 Os botes de funes....................................................................................................................10 Os tipos de dados usados por Fitopac ............................................................................................8

PARAMS .....................................................................................................................................10 Preparando dados .........................................................................................................................14 PREPARE ....................................................................................................................................10

R
referncias bibliogrficas .............................................................................................................75

S
Similaridade .................................................................................................................................10

T
Tela de Anlise de Agrupamentos ...............................................................................................54 Tela Nomes duplicados ................................................................................................................35 Tela Nomes suspeitos...................................................................................................................34 Tipos de dados em matrizes .........................................................................................................19 TWINSPAN .................................................................................................................................10

U
Usando a planilha.........................................................................................................................22

Pr rs eli o m in ar

Ve

77

V
Variveis mascaradas e Marcadores ............................................................................................20 Visualizando e interpretando resultados de uma ordenao.........................................................68

78

Pr rs eli o m in ar

Ve

You might also like