Professional Documents
Culture Documents
o
/
K
m
p
e
r
c
o
r
r
i
d
o
a
t
o
C
B
D
residncias
terrenos
Figura 2.1 Queda nos preos de residncias e terrenos obtida pelo estudo de
ABELSON (1997).
No estudo feito por CHESHIRE & SHEPPARD (1995) desenvolvido
para verificar a valorizao de imveis nos EUA, observou-se que o preo da
propriedade no varia apenas com a acessibilidade mas, tambm, com
caractersticas da vizinhana, servios pblicos locais e outras caractersticas no
fsicas das residncias. A avaliao de residncias desenvolvida pelos autores
mostrou que o modelo de avaliao melhora substancialmente quando
caractersticas espaciais, como por exemplo, existncia de escolas nas
proximidades, so adicionadas.
LEVIN & WRIGHT (1997) utilizam sries temporais para explicar a
flutuao de preos em Londres e no Reino Unido no perodo de 1965 a 1995.
Nair Cristina Margarido Brondino - 26
Dentre as relaes observadas por eles, salienta-se uma forte relao entre preos e
renda familiar, sendo que em pocas de financiamentos e de mais alta renda, as
pessoas se dispuseram a pagar mais pelo mesmo bem. Outro fato interessante
observado que existe uma relao positiva entre o crescimento dos preos
imobilirios no passado e no futuro, principalmente para Londres. De maneira geral,
a anlise desenvolvida apresentou indcios de que a especulao , possivelmente,
um fator determinante em preos de residncias. Alm destes autores, pode-se citar
o trabalho de GIBB (1994), no qual foram desenvolvidos modelos para estimar
preos de residncias em Glasgow e Edinburgh.
FORREST et al. (1996) tambm estudaram a influncia da
acessibilidade nos valores residenciais na grande Manchester, situada no norte da
Inglaterra. Em seu trabalho, foi estudada a influncia da construo de uma linha de
metr no valor das propriedades da regio. Ao contrrio do que imaginavam, foi
constatado que propriedades muito prximas nova linha desvalorizam,
principalmente devido perturbaes, barulhos etc. De forma geral, a nova linha
no trouxe grandes modificaes nos valores residenciais situados ao longo da
mesma.
O estudo de caso apresentado por PHANG & WONG (1997) para
Singapura mostra que as taxas de juros, crescimento de renda e oferta de habitaes
no tiveram influncia significativa no valor de propriedades privadas. No estudo
em questo, eles observaram que os preos de imveis privados estavam fortemente
correlacionados com os preos de imveis pblicos. Vale ressaltar que o setor
pblico exerce uma forte influncia sobre o sistema habitacional local. Somente
para exemplificar, em 1995, 86% do conjunto de imveis residenciais do pas era
composto por casas populares.
As Redes Neurais se mostraram bastante eficientes em estudo
realizado por ALMOND et al. (1997). Em seu trabalho, algumas aproximaes
foram consideradas, utilizando uma nova forma de aprendizado, onde, inicialmente
uma rede no supervisionada usada para estabelecer classes, que serviro como
entrada para as redes convencionais. Este critrio, segundo os autores, provocou
uma melhora de 10% em relao s previses fornecidas pelo mtodo convencional.
Nair Cristina Margarido Brondino - 27
Pode-se citar ainda um modelo proposto por AOKI et al. (1994), que
consideraram o conceito de custos de transportes, que foi definido no s como
carga monetria mas tambm como stress mental e fsico sofrido dentro dos meios
de transporte de uma cidade. Estes custos foram definidos em termos de
acessibilidade. O primeiro modelo proposto, que s levou em considerao a
acessibilidade, forneceu um coeficiente de determinao de 0,79, mas no obedeceu
outras suposies do modelo de regresso. O segundo modelo incluiu as atividades
urbanas do local: zona de uso da terra (distrito comercial, residencial etc., num total
de 9 categorias), densidade (num total de 14 categorias) e tipo de uso da terra atual
(floresta, rios, etc., num total de 16 categorias). Este ltimo proporcionou uma
melhora substancial do coeficiente de correlao (0,90) e varincia dos resduos
constante. Como resultado, chegou-se concluso de que somente os custos de
transportes no so suficientes para estimar os valores das propriedades.
De maneira geral, pode-se notar que o emprego de alguma medida de
acessibilidade (geralmente a distncia ao distrito central de negcios) uma
constante nos modelos citados. Ela pode servir como uma medida do espalhamento
urbano, que cada vez mais tem preocupado avaliadores e planejadores, no s pelos
custos adicionais que ele proporciona sociedade, como tambm pela m qualidade
de vida, segregao social e problemas ecolgicos que ele pode representar. Neste
contexto, o trabalho de PRATT (1996) faz uma crtica ao problema sob vrios
aspectos. Do ponto de vista ecolgico, tem-se que, cidades espalhadas tendem a
usar mais intensamente os meios de transporte, com conseqente aumento de
poluio. A piora na qualidade de vida se d em funo do maior tempo despendido
para viajar de um local a outro, tempo este que poderia ser gasto com descanso ou
lazer. Como se no bastasse, a estrutura dos meios de transporte permite que alguns
grupos sejam melhor atendidos, dificultando o acesso a outros grupos menos
privilegiados. Pior que isso, geralmente o transporte mais acessvel a pessoas de
mais alta renda. Se o problema no apresenta soluo to imediata, uma forma de
ameniz-lo seria o emprego de alguma ferramenta eficiente, que seja capaz de
extinguir, ou caso isso no seja possvel, reduzir bastante os vazios urbanos. O
primeiro passo para isso poderia ser a implantao de uma poltica de impostos, que
Nair Cristina Margarido Brondino - 28
desmotivasse os proprietrios deste tipo de imvel a possu-los. O autor afirma que,
para tal fim, um critrio de avaliao adequado torna-se imprescindvel, uma vez
que a taxa sobre a propriedade deve ser baseada em seu valor monetrio.
2.6. PRS E CONTRAS DOS IMPOSTOS SOBRE A
PROPRIEDADE
Assim como ocorre em vrias cidades brasileiras, existem cidades e
at mesmo pases, que, de certa forma, tm sua sobrevivncia econmica garantida
atravs dos impostos sobre a propriedade. Dentre estes pases, pode-se citar o Reino
Unido, onde a maior parte da receita do Estado provm deste tipo de imposto.
Portanto, uma forma correta de avaliao imobiliria torna-se imprescindvel, uma
vez que as taxas sobre a propriedade so calculadas a partir de seu valor.
O que diferencia os bens imveis sua fixao no espao, alto valor
unitrio e a longa vida til. Sendo assim, torna-se mais simples implantar e vigiar
impostos sobre a propriedade. Alm disso, o sistema de taxao sobre o valor da
terra, a priori, pode ser pensado como ferramenta potencial para resolver problemas
como espalhamento urbano, concentrao de renda, falta de investimentos,
especulao imobiliria etc. WYATT (1994) contesta esta teoria, assegurando que
mantendo o sistema atual, incentivos como abatimentos ou incrementos de taxas so
fatores pouco importantes para atingir os padres desejados de uso da terra e
desenvolvimento econmico. Ele justifica seu ponto de vista afirmando que o
incentivo dado atravs de reduo de taxas para construes, embora traga um
pequeno efeito, no garante que reas que no precisem de estmulo tambm
atraiam investimento, muitas vezes at maiores que reas carentes. Quanto
distribuio de renda, o autor afirma que, quanto maiores as taxas cobradas, maior a
desigualdade social. Diante destes fatores, ele defende a implantao de um sistema
de imposto progressivo como nica soluo vivel para os problemas mencionados
anteriormente.
Outro trabalho que coloca em questo a importncia do uso de taxas
para baratear o preo da terra urbana apresentado por ROAKES (1996). Em seu
Nair Cristina Margarido Brondino - 29
artigo, ela contesta o uso da taxa por si s, apregoando que as taxas sobre a
propriedade devem ser separadas das taxas de melhorias.
Se por um lado, autores contestam o uso de impostos sobre a
propriedade como ferramenta de planejamento urbano, por outro, alguns deles
conseguem mostrar que a influncia causada por tais taxas no to insignificante
assim. Este o caso de LIM (1992), que usou um modelo terico para verificar a
influncia destas taxas sobre a estrutura urbana. Ele constatou que terrenos vagos,
prximos a zonas residenciais, se sofrerem majorao de tributos, tendem a ser
utilizados para fins residenciais.
O trabalho de BENTICK (1996) se situa entre os dois extremos,
afirmando que ...as taxas sobre a propriedade urbana precisam ser suplementadas
por controles de planejamento para prevenir que consumidores na periferia urbana
se mudem para a rea rural para fugir das taxas. Em seu estudo, ele concluiu que
para uma rea no desenvolvida, uma taxa que no discrimine a terra urbana da
rural, no afeta a periferia urbana, uma vez que as pessoas no sentem necessidade
de se mudar para a rea rural a fim de fugir dos impostos (caso comum nos pases
com forte dependncia do meio de transporte automvel). Por outro lado, uma taxa
discriminatria ir contrair a periferia urbana, mas, tambm reduzir a populao
urbana, exceto se ela for reforada com regulamentos para zoneamento que
previnam a mudana de pessoas para o outro lado da fronteira.
Nair Cristina Margarido Brondino - 30
3. REDES NEURAIS, REGRESSO LINEAR
MLTIPLA E SIG
A primeira seo deste captulo consta de uma introduo sobre a
Inteligncia Artificial, onde um breve histrico sobre as Redes
Neurais, com os principais nomes envolvidos no seu
desenvolvimento, ser traado. Na seqncia, o modelo de Rede
Neural a ser utilizado para o desenvolvimento deste trabalho, ou
seja, a Rede Multlayer Perceptron, ser analisado em maiores
detalhes. A prxima etapa faz uma reviso sobre a Regresso
Mltipla, que o mtodo utilizado para avaliar o desempenho das
Redes Neurais. Finalizando o captulo, outra ferramenta
amplamente utilizada neste trabalho ser apresentada: o Sistema de
Informao Geogrfica (SIG).
3.1 ASPECTOS DA INTELIGNCIA ARTIFICIAL
O desenvolvimento de sistemas inteligentes partiu da sede do ser
humano por conhecimento e do desejo de construir mquinas que executem certas
tarefas to bem quanto ele.
A arquitetura utilizada pela maioria dos computadores convencionais
compreende uma simples unidade de processamento central conectada a uma rea
de memria. O processador ento executa, de forma seqencial, um programa
Nair Cristina Margarido Brondino - 31
armazenado na memria. Portanto, este tipo de computador apenas consegue
executar as tarefas para as quais ele foi programado.
Por outro lado, os neurocomputadores buscam modelar a estrutura do
crebro humano e a maneira pela qual ele consegue processar informao. Para tal
intuito, necessria uma nova arquitetura computacional, que, assim como o
crebro humano, seja composta de um grande nmero de elementos de
processamento altamente conectados, que operem de uma maneira paralela.
O crebro humano consegue executar certas atividades muito mais
rapidamente que o computador, enquanto que outras no. Por exemplo, o
computador executa clculos numricos a uma velocidade muito superior ao
crebro, enquanto que, para a mquina, o reconhecimento de uma imagem ou de um
som muito mais lento e difcil.
HAYKIN (1994) define o crebro humano como um computador com
estrutura altamente complexa, no linear e paralela que tem a capacidade de
organizar neurnios para executar certos tipos de tarefas. este paralelismo do
crebro que garante a ele a capacidade de armazenar e representar o conhecimento
adquirido e torn-lo bastante acessvel. O paralelismo tambm o torna capaz de
processar este conhecimento simultaneamente (BEALE e JACKSON, 1990). A
forma como o crebro consegue executar certas tarefas uma incgnita, tornado
dficil a sua sintetizao. Porm, sabe-se que ele formado de muitas unidades de
processamento altamente interconectadas, os neurnios. Cada neurnio ligado a
outros milhares. E atravs do conhecimento do funcionamento destas unidades
que possvel, hoje em dia, simular, ainda que precariamente, o comportamento
cerebral.
3.1.1 ANALOGIA BIOLGICA
O crebro (humano ou animal) composto de clulas chamadas
neurnios. Estima-se que um crebro humano possua mais de 100 bilhes de
neurnios, e mais de uma centena de tipos destes. Os neurnios funcionam em
grupos, denominados redes, sendo que cada rede pode ser formada por milhares de
Nair Cristina Margarido Brondino - 32
neurnios interconectados. Portanto, o crebro pode ser visto como uma coleo de
Redes Neurais. Tanto o pensamento quanto o comportamento inteligente so
controlados pelo sistema nervoso central e pelo crebro (TRIPPI e TURBAN,
1992).
Cada neurnio formado de dendritos, ncleo e axnio. Ele uma
estrutura simples, que permite trs funes bsicas: entrada, processamento e sada
de sinais. Os dendritos so conexes atravs das quais os sinais de entrada chegam
aos neurnios. O ncleo o processador do neurnio. Ele recebe os sinais de
entrada atravs dos dendritos e os adiciona de alguma forma. Se o valor resultante
estiver acima de um certo limite, o neurnio se excita e tende a propagar o estmulo.
Caso contrrio, ele fica inibido. Os axnios servem como o canal de sada do
neurnio. Eles esto ligados aos dendritos de outros neurnios atravs das sinapses.
As sinapses no so ligaes fsicas, mas sim qumicas e temporrias, e se do
atravs de neurotransmissores.
3.1.2. HISTRICO REDES NEURAIS
Em 1943, McCulloch e Pitts propuseram um modelo de neurnio
artificial, como uma unidade de processamento simples, cuja proposta no era
copiar o neurnio verdadeiro, mas, sim, model-lo (BEALE e JACKSON, 1990). A
rede empregada por eles empregava um modelo extremamente simples de neurnio,
cada um tendo tendo tanto entradas excitatrias quando inibitrias. Quando o
nmero de entradas excitatrias excedesse o nmero de entradas inibitrias, o
neurnio sofria uma ativao e produzia uma sada igual a 1 (LUGER e
STUBBLEFIELD, 1989). O neurnio proposto no apresentava threshold (limiar),
que corresponde a um valor que determina se o neurnio vai responder ou no a
determinada entrada. Se a entrada total for menor que este limiar, o neurnio
permanece inibido. Caso contrrio, ele se excita e tende a propagar o estmulo.
Alguns anos depois, Von Newmann mostrou que, quando
redundncias eram introduzidas nas redes McCulloch-Pitts, elas poderiam continuar
funcionando normalmente apesar do mal funcionamento de elementos individuais.
Nair Cristina Margarido Brondino - 33
Este foi um resultado importante porque faz uma sugesto de como o crebro
humano continua funcionando apesar da perda de clulas nervosas ao longo de
nossa vida (LUGER e STUBBLEFIELD, 1989).
Em 1949, Hebb props uma forma de aprendizado para as Redes
Neurais, qual ele denominou aprendizado hebbiano. Por esta lei de aprendizado,
se dois neurnios esto ativos simultaneamente, a conexo entre eles deve ser
reforada (HAYKIN, 1994).
Nos anos 50, Rosenblatt adicionou thresholds aos neurnios e props
um procedimento pelo qual a rede poderia aprender, ajustando sistematicamente
seus pesos sinpticos. Esta rede foi batizada de perceptron e podia aprender
problemas simples de classificao (LUGER e STUBBLEFIELD, 1989). Porm,
este modelo era bastante limitado. Em 1969, Minsky e Papert mostraram que a rede
perceptron no era capaz de resolver o problema do ou-exclusivo, ou seja, ela s
poderia classificar padres que eram linearmente separveis.
A partir destas descobertas, houve um desaquecimento no estudo
sobre Redes Neurais, que s voltaram tona nos anos 80, quando alguns problemas
apresentados pelo perceptron passaram a ser resolvidos atravs do uso de novos
modelos. Dentre os novos modelos, pode-se citar as redes de Hopfield (BEALE &
JACKSON, 1990), a mquina de Boltzmann (HAYKIN, 1994) e as redes com
vrias camadas.
3.1.3. REDES NEURAIS ARTIFICIAIS
As Redes Neurais artificiais so baseadas em modelos abstratos do
funcionamento do crebro humano e tentam reproduzir sistemas biologicamente
realsticos.
Dentre os benefcios da computao neural, pode-se citar (TUBB,
1993):
habilidade de aprender com exemplos: os computadores neurais
tm a capacidade de aprender com a experincia, objetivando
Nair Cristina Margarido Brondino - 34
melhorar seu desempenho e se adaptar a ambientes novos e
dinmicos, diferentemente dos computadores comuns;
robustez: as Redes Neurais tem habilidade em lidar com rudos. Elas
so tolerantes falhas e podem apresentar degradao gradual, ou
seja, apesar de alguma falha no sistema, elas continuam a fornecer
respostas adequadas por um bom tempo, o que as diferencia dos
computadores convencionais, onde uma falha pode causar prejuzo
do sistema como um todo;
velocidade de processamento: como as Redes Neurais consistem de
um grande nmero de unidades de processamento operando em
paralelo, elas podem operar em velocidades considerveis em relao
aos mtodos computacionais comuns.
Alm das vantagens j mencionadas, em muitos casos e dependendo
do problema para o qual so utilizadas, o desempenho das Redes Neurais tm se
mostrado bastante superior aos mtodos estatsticos usados para o mesmo fim
(FALAS, 1995). SUBRAMANIAN et al. (1993), fizeram um estudo onde
compararam as Redes Neurais com alguns mtodos estatsticos de classificao. A
concluso a que chegaram que, em todas as circunstncias, incluindo tamanhos de
amostras pequenos e funes mais complexas, as Redes Neurais apresentaram
solues bastante superiores.
Um outro estudo, feito por KWON et al. (1995), usou modelos de
regresso mltipla e Redes Neurais para encontrar solues para o problema do
caixeiro viajante. Numa comparao dos dois mtodos, verificou que as rotas
fornecidas pelas Redes Neurais apresentaram superioridade. Ainda comparando
regresso e Redes Neurais, pode-se citar o trabalho de GUEDES (1994), que usou
modelos de regresso e Redes Neurais para fazer estimativas dos valores de
apartamentos no Rio de Janeiro, tambm obtendo melhores resultados com a
aplicao deste ltimo.
Nair Cristina Margarido Brondino - 35
3.1.3.1. O NEURNIO ARTIFICIAL
O neurnio artificial uma unidade de processamento
matematicamente simples, que recebe uma ou mais entradas e as transforma em
sadas. Cada entrada tem um peso associado, que determina sua intensidade (TUBB,
1993). A Figura 3.1, a seguir, mostra um esquema de neurnio artificial.
.
.
.
.
.
.
x
1
x
2
x
n
w
k1
w
k2
w
kn
(.)
sinais
de
entrada
pesos
sinpticos
funo
soma
funo de
ativao
k
threshold
sada
y
k
u
k
Figura 3.1 - Modelo no linear de um neurnio (HAYKIN, 1994).
possvel distinguir alguns elementos importantes no neurnio
mostrado na Figura 1:
1. as sinapses, que so caracterizadas por um peso, w, que pode
representar a sua intensidade. O papel do peso w
kj
multiplicar o
sinal x
j
na entrada da sinapse j, conectada a um neurnio k. O peso
w
kj
positivo se a sinapse associada excitatria e negativo se a
sinapse associada inibitria;
2. um somatrio, que adiciona as entradas ponderadas pelos seus pesos
respectivos, ou seja,
=
=
n
1 j
j kj k
x w u
(1)
Nair Cristina Margarido Brondino - 36
3. um limiar (threshold),
k
, que tem um papel determinante na sada
do neurnio. Se o valor de u
k
for menor que este limiar, ento, a
sada do neurnio fica inibida. Caso contrrio, o neurnio fica ativo.
4. uma funo de ativao, que funciona como um limitante
amplitude da sada do neurnio, ou seja, a entrada normalizada
dentro de um intervalo fechado, comumente [0,1] ou [-1,1];
5. a sada do neurnio, y
k
, onde:
y u
k k
=
k
( )
(2)
onde a funo de ativao.
Em geral, o valor do threshold aplicado com a incluso de uma
entrada x
0
igual a -1 e um peso w
k0
igual ao valor de
k
. Portanto, a nova entrada
da funo de ativao, j incluindo o limiar, dada por:
v w x
k kj j
j
n
=
=
1
k
(3)
3.1.3.2. TIPOS DE FUNO DE ATIVAO
A funo de ativao define a sada do neurnio em termos do nvel
de atividade do mesmo (HAYKIN, 1994). Dentre as funes de ativao mais
comuns, se enquadram as seguintes:
funo linear:
i
(t+1) = v
i
(t)
funo threshold ou limiar:
i
(t+1) = 1, se v
i
(t)
0, se v
i
(t) <
funo sigmide logstica:
i
(t+1) = 1/(1+ e
-
vi(t)
)
funo tangente hiperblica:
i
(t+1) = (1 - e
-
vi(t)
) / (1+ e
-
vi(t)
)
Nair Cristina Margarido Brondino - 37
funo linear por partes:
i
(t+1) = +1, se v
i
(t) >
-1, se v
i
(t) <
v
i
(t), em outra parte
3.1.3.3. TOPOLOGIA DA REDE
A maneira como os neurnios so organizados chamada de
topologia da rede. A topologia ir afetar o desempenho da rede, assim como as
aplicaes para as quais ela desejada, e sua estrutura est intimamente ligada ao
algoritmo de aprendizado usado para a fase de treinamento. Algumas redes
permitem que as conexes caminhem tanto no sentido entrada-sada, quanto sada-
entrada. Outras permitem que os neurnios da mesma camada estejam conectados.
Ainda h as que permitem que o neurnio envie sinais de volta para ele mesmo
(TUBB, 1993).
Dentre as topologias, pode-se citar a Multlayer Perceptron, que
formada de uma camada de entrada, uma ou mais camadas intermedirias e uma
camada de sada e o tipo de arquitetura mais encontrado. H tambm a rede de
Kohonen, que formada por uma camada de entrada e uma nica camada de sada,
onde cada neurnio est conectado a todos os seus vizinhos. Na rede de Hopfield,
no h neurnios de entrada ou sada. A entrada de um neurnio a sada dos
demais neurnios e a sua sada vai ser a entrada do demais neurnios da rede. A
rede ART formada por camada de entrada e sada, alm de controladores de fluxo
de sinais. Para este estudo foi escolhida a rede Multlayer Perceptron devido ao fato
desta ser mais adequada para fazer classificaes deste tipo, alm de ser a mais
conhecida e utilizada, tendo, inclusive, softwares para sua implementao
disponveis na Internet.
3.1.3.4. ALGORITMOS DE APRENDIZADO
Segundo CARVALHO et al. (1998), denomina-se algoritmo de
aprendizado a um conjunto de regras bem definidas para a soluo de um problema
Nair Cristina Margarido Brondino - 38
de aprendizado. Existem vrios tipos de algoritmos de aprendizado, que so
especficos para determinados modelos de redes neurais e que diferem entre si,
principalmente, pela forma com que os pesos so atualizados.
Os paradigmas de aprendizado, por sua vez, definem a maneira como
a rede se relaciona com o ambiente e se dividem em trs grupos principais:
supervisionado, no supervisionado e hbrido.
Para o aprendizado supervisionado, apresenta-se rede, na fase de
treinamento, um conjunto de entradas acompanhadas de suas respectivas sadas. O
objetivo minimizar o sinal de erro, que uma funo da diferena entre a sada
desejada e aquela fornecida pela rede. Esta minimizao se d pelo ajuste dos pesos
da rede. Um exemplo deste paradigma de aprendizado o mtodo backpropagation,
que ser discutido mais adiante.
No aprendizado no supervisionado, a rede aprende sozinha, sem uma
mensagem de erro externa, ou seja, no h superviso externa. necessrio que
entradas parecidas sejam apresentadas rede, para que esta possa extrair
caractersticas estatisticamente relevantes e criar classes de maneira automtica.
O aprendizado hbrido, por sua vez, consiste de uma combinao dos
aprendizados supervisionado e no supervisionado. Um exemplo o aprendizado
por reforo, onde a rede aprende de seu prprio ambiente, a partir dos dados de
entrada. A nica informao externa que a rede recebe a indicao de que a
resposta fornecida est correta ou no.
3.1.3.5. A REDE Multlayer Perceptron
Como mencionado anteriormente, a rede perceptron, que
constituda de apenas duas camadas (uma de entrada e outra de sada) s consegue
classificar padres que sejam linearmente separveis. Diante deste problema, uma
possvel aproximao seria usar mais que um perceptron, cada um sendo
empregado para distinguir sees linearmente separveis da entrada e ento
combinando suas sadas em outro perceptron, que poderia produzir uma indicao
Nair Cristina Margarido Brondino - 39
final da classe a que aquela entrada pertence (BEALE e JACKSON, 1990). A
Figura 3.2 mostra esta idia graficamente.
entradas
*
+ +
+
*
1
*
*
*
*
+ +
+
+ +
+
2
3
Figura 3.2 - Comportamento de classificao de dois padres de uma rede com uma
camada intermediria.
A nova rede arranja as unidades perceptron em camadas e o novo
modelo passa a ser chamado multlayer perceptron. O novo modelo de rede passa a
contar com uma ou mais camadas de neurnios intermedirias. Cada unidade
pertencente camada intermediria funciona como o perceptron, exceto porque sua
funo de ativao no mais a funo degrau e sim, a funo sigmide ou a
funo threshold linear. Esta escolha pelo tipo de funo de ativao se d porque,
com a utilizao de uma das duas alternativas apresentadas, a atualizao dos pesos
se d de forma mais suavizada, ou seja, os pesos no vo sofrer alteraes bruscas.
A topologia de uma rede multlayer perceptron com trs camadas (uma
intermediria) mostrada na Figura 3.3.
Nair Cristina Margarido Brondino - 40
Figura 3.3 - Topologia de uma rede multlayer perceptron com uma camada
intermediria.
3.1.3.5.1. ALGORITMO DE APRENDIZADO PARA UMA
REDE MLP
A regra de aprendizado utilizada para treinar uma rede multlayer
perceptron denominada Regra Delta Generalizada ou, mais comumente,
backpropagation.
Quando um padro apresentado rede pela primeira vez, esta
produz uma sada aleatria. A diferena entre esta sada e a desejada constitui o
erro. A inteno do trabalho de treinamento buscar cada vez mais diminuir o
valor deste erro. Para tal intuito, o valor dos pesos deve ser ajustado a cada nova
iterao. A regra backpropagation proporciona que os pesos da camada de sada
sejam os primeiros a serem ajustados e, posteriormente, os pesos das demais
camadas, de trs para frente (da o nome da regra).
Seja E
p
, a funo erro para o padro p, d
pj
, o valor da sada desejado
(para o padro p e o n j), o
pj
, o valor da sada obtido e w
ij
, o peso do n i para o n
j. Ento, a funo E
p
pode ser dada por:
E d
p pj
j
pj
=
1
2
2
( o )
(4)
Portanto, o objetivo minimizar esta funo de erro. Se esta funo
for simples, a rede tem garantia de encontrar soluo. Caso contrrio, a rede pode
cair em um mnimo local e no produzir uma sada satisfatria.
Nair Cristina Margarido Brondino - 41
A atualizao dos pesos se d pela adio de um termo de variao a
eles (w
ij
), ou seja, para um peso w
ij
, o seu peso atualizado vai ser dado por:
ij ij ij
w ) t ( w ) 1 t ( w + = +
(5)
onde :
w x o o
ij i j j j
= ( ) 1
(6)
j = (d
j
-o
j
), para ltima camada (7)
j
= w
jk
k
, para camadas intermedirias (8)
A varivel denominada taxa de aprendizado. Seu valor vai
determinar o quo suavemente se dar a atualizao dos pesos. Se for grande, o
valor de w
ij
ser grande e, conseqentemente, os pesos sofrero uma alterao
mais brusca.
Uma outra varivel, que pode ser includa na atualizao de pesos, o
momentum (). Este novo termo pode aumentar a velocidade do aprendizado e tem
por caracterstica acelerar o treinamento em regies planas da superfcie de erro.
Com a adio do momentum, w
ij
passa a ser dado por:
w t x o o w t w t
ij i j j j ij ij
( ) ( ) ( ( ) ( ) + = ) + 1 1 1
(9)
A atualizao de pesos pode se dar de duas maneiras: por padro ou
por ciclo. Na primeira, os pesos so atualizados aps a apresentao de cada
padro. Na segunda, os pesos so atualizados aps a apresentao de todos os
padres. A maneira a ser utilizada depende da aplicao. Se o conjunto de dados
grande e redundante (poucos padres e muitas entradas, por exemplo), a primeira
melhor. Caso contrrio, quando o conjunto apresenta muitos padres a serem
classificados, melhor utilizar a atualizao por ciclo.
O algoritmo backpropagation apresenta alguns problemas, quanto
dificuldades de aprendizado. Em superfcies muito complexas, o treinamento
Nair Cristina Margarido Brondino - 42
muito lento e existe o risco da rede cair num mnimo local. Alm disso, pode
ocorrer overfitting, fenmeno que surge depois de um certo tempo de treinamento,
quando a rede memoriza os padres que j foram apresentados e o processo de
classificao piora sensivelmente. Possveis solues para estes problemas so:
diminuir a taxa de aprendizado, adicionar ns na camada intermediria, utilizar
momentum e adicionar rudos.
Finalmente, as Figuras 3.4 e 3.5 mostram diagramas esquemticos
dos algoritmos de treinamento e teste de uma rede Multlayer Perceptron (MLP).
Nair Cristina Margarido Brondino - 43
iniciar pesos com
valores aleatrios e
fazer erro = 0
apresentar as n entradas e
as m sadas associadas
calcular a sada
y wx
pj i i
i
n
=
=
( )
0
1
passar o valor de sada obtido
para a prxima camada e
computar, ao final de todas
as camadas, a sada o
pj.
atualizar os pesos da ltima
camada para a anterior e assim
por diante, at a primeira
camada.
se o
pj
d
pj
, ento calcular o valor
da funo de erro (eq. 4).
erro >
sim
FIM
no
INCIO
Figura 3.4 - Diagrama esquemtico do treinamento de uma rede MLP.
Nair Cristina Margarido Brondino - 44
apresentar o padro X para
teste
calcular a sada da rede o
pj
comparar o
pj
com d
pj
e classificar o
padro na classe que apresentar
menor erro (sada mais parecida com
a desejada).
FIM
INCIO
Figura 3.5 - Diagrama esquemtico da fase de teste de uma rede MLP.
3.2. ANLISE DE REGRESSO
3.2.1. O MODELO LINEAR
O modelo de Regresso Linear Mltipla usado para estudar a relao
entre uma varivel dependente e vrias variveis independentes. Sua frmula
genrica dada por:
,...,n , i x x x x x x f y
i iK K i i i iK i i i
2 1 , ... ) ,..., , (
2 2 1 1 2 1
= + + + + = + = (10)
onde:
y a varivel dependente ou explicada
x
i
, x
2
, ... , x
K
so as variveis independentes ou explicativas
Nair Cristina Margarido Brondino - 45
e o termo
i
representa o distrbio aleatrio, que pode se originar devido a diversas
circunstncias, tais como a ausncia de fatores influentes no modelo e distrbios
causados por erros de medida.
3.2.1.1. SUPOSIES DO MODELO DE REGRESSO
LINEAR CLSSICO
O Modelo de Regresso Linear Clssico consiste de uma srie de
suposies que descrevem as formas do modelo e tambm ditam os procedimentos
adequados de estimao e inferncia.
3.2.1.1.1. LINEARIDADE DO MODELO DE REGRESSO
Assuma que o vetor coluna x
k
representante as n observaes na
varivel x
k
, k=1, 2,...,K e que estes dados esto alocados em uma matriz X de
dimenso n K. Na maioria dos casos, a primeira coluna da matriz X composta
somente de 1's, de forma que
1
o termo constante no modelo. Assumindo tambm
que y represente as n observaes y
1
, y
2
, ..., y
n
e que um vetor coluna contendo
os n distrbios, o modelo dado em (10) pode ser rescrito como:
y= x
1
1
+ x
2
2
+ ...+ x
K
K
+ (11)
Ou, similarmente, na forma da Suposio 1 dada por:
Suposio 1: y = X + (12)
A suposio de linearidade do modelo de regresso inclui o distrbio
aditivo e deve ser da forma descrita pela equao (11) ou na forma das variveis
originais ou para alguma transformao adequada destas. Portanto, no contexto da
regresso, a linearidade se refere forma pela qual os parmetros e o distrbio
entram na equao e no necessariamente relao entre as variveis envolvidas.
Nair Cristina Margarido Brondino - 46
Neste contexto, uma relao no linear da forma pode ser linearizada
atravs do uso dos logaritmos de x e y: ln y = + ln x + .
e Ax y =
3.2.1.1.2. POSTO COMPLETO
Esta suposio diz respeito aos regressores do modelo, onde deve-se
assumir que no existe relao linear perfeita entre as variveis independentes. Para
que isto ocorra, necessrio que a matriz X tenha posto completo, ou seja, que as
colunas desta matriz sejam linearmente independentes e que haja pelo menos K
observaes. Desta forma, a suposio 2 pode ser escrita como:
Suposio 2: X uma matriz n K com posto K (13)
3.2.1.1.3 VALOR ESPERADO DO DISTRBIO
Deve-se assumir que o valor esperado do distrbio seja zero para cada
observao, ou seja:
E[
i
/X] = 0 (14)
Assim, para o grupo completo de observaes, a suposio 3 pode ser
escrita como:
Suposio 3: (15) 0
] X / [ E
] X / [ E
] X / [ E
) X / [ E
n
2
1
=
(
(
(
(
Em muitos casos, esta suposio no restritiva. Porm, se o modelo
original no contm o termo constante, supor E[
i
] = 0 poderia no ser uma deciso
correta. Por um lado, se E[
i
] puder ser expressa como uma funo linear dos x
i
,
Nair Cristina Margarido Brondino - 47
ento, uma transformao do modelo poderia produzir distrbios com mdia zero.
Por outro lado, uma mdia dos distrbios diferente de zero poderia constituir uma
parte substantiva da estrutura do modelo. Assim, como regra geral, modelos de
regresso no devem ser especificados sem o termo constante, a menos que isto seja
ditado pela teoria pertinente. Se houver razes para especificar que a mdia do
distrbio seja diferente de zero, isto deve ser construdo na parte sistemtica da
regresso, deixando no distrbio somente a parte desconhecida de .
3.2.1.1.4. DISTRBIOS ESFRICOS
A quarta suposio diz respeito varincia e covarincia dos
distrbios:
Var [
i
/X] =
2
, para todo i = 1, ..., n e
Cov [
i
,
j
/X] = 0, para todo i j
A varincia constante chamada homocedasticidade e a falta de
correlao entre os distrbios chamada no-autocorrelao. A no-autocorrelao
no implica que as observaes y
i
e y
j
so no correlacionadas, mas sim que os
desvios dos valores observados destas com relao aos valores esperados so no
correlacionados. Estas duas suposies implicam que:
(
(
(
(
(
=
(
(
(
(
=
2
2
2
2 1
2 2 2 1 2
1 2 1 1 1
0 0
0 0
0 0
] / [ ] / [ ] / [
] / [ ] / [ ] / [
] / [ ] / [ ] / [
] / ' [
X E X E X E
X E X E X E
X E X E X E
X E
n n n n
n
n
(16)
que pode ser resumida na seguinte suposio:
Suposio 4: E['/X] =
2
I (17)
Nair Cristina Margarido Brondino - 48
Os distrbios que encontram as suposies de homocedasticidade e
no-autocorrelao so chamados distrbios esfricos.
3.2.1.1.5. REGRESSORES NO-ESTOCSTICOS
Em geral, assume-se que x
i
no-estocstico, o que permite ao
analista escolher os valores dos regressores e ento observar os y
i
, ao contrrio do
que ocorreria em uma situao experimental. Assim, a suposio 5, que consiste da
especificao das variveis independentes, fica da seguinte maneira:
Suposio 5: X uma matriz de constantes conhecida, com dimenso n K (18)
3.2.1.1.6. NORMALIDADE
conveniente assumir que os distrbios so normalmente
distribudos, com mdia zero e varincia constante. Esta suposio, que til
principalmente na construo de testes estatsticos, implica que as observaes em
i
so estatisticamente independentes, apresentada a seguir:
Suposio 6: /X ~ N(0,
2
I) (19)
3.2.1.2. O MTODO DOS MNIMOS QUADRADOS
Sejam os parmetros desconhecidos da relao y
i
= x
i
' +
i
, os
objetos de estimao. Ento, se b e e
i
so as estimativas amostrais de e
i
, ento, a
regresso populacional dada por E[y
i
/x
i
] = x
i
', enquanto que sua estimativa
denotada por:
i
y = x
i
'b (20)
Nair Cristina Margarido Brondino - 49
Sendo assim, o distrbio associado com a i-sima observao dado
por:
i
= y
i
- x
i
' (21)
Para um dado valor de b,
i
pode ser estimado atravs da seguinte
expresso:
e
i
= y
i
- x
i
'b (22)
A partir das definies, obtm-se a relao dada por (23), que
mostrada graficamente na Figura 3.6.
y
i
= x
i
' +
i
=
x
i
'b + e
i
(23)
E(y) = + x
e
bx a Y + =
+ x
a + bx
y
Figura 3.6 - Regresses amostral e populacional (GREENE, 1997).
Nair Cristina Margarido Brondino - 50
3.2.1.2.1 O VETOR DOS COEFICIENTES OBTIDO POR
MNIMOS QUADRADOS
O vetor dos coeficientes obtido por Mnimos Quadrados (
0
) deve ser
escolhido de maneira a minimizar a Soma de Quadrados dos Resduos, dada por:
) X y ( )' X y (
0 0 0
'
0
= (24)
Desta forma, para encontrar o valor de
0
que minimiza a Soma de
Quadrados dos Resduos, deve-se diferenciar a expresso (24) com relao a
0
e
igualar o resultado a zero. Se a inversa de (X'X) existe, ento a soluo do sistema
obtido, denotada por b, dada por:
b = (X'X)
-1
X'y (25)
3.2.1.2.1.1. TESTES DE HIPTESE E INTERVALOS DE
CONFIANA PARA O COEFICIENTE
K
Se o distrbio aleatrio possui Distribuio Normal Multivariada,
ento pode-se provar que a distribuio de b/X dada por:
b/X ~ N(,
2
(X'X)
-1
) (26)
ou seja, b/X apresenta distribuio Normal Multivariada. Desta forma, cada
elemento de b/X tambm normalmente distribudo:
b
k
/X ~ N(
k
,
2
[(X'X)
kk
]
-1
) (27)
Usando estes resultados, pode-se elaborar testes de hipteses ou
construir intervalos de confiana para os elementos do vetor . Para tanto, torna-se
necessrio conhecer a matriz de covarincia
Nair Cristina Margarido Brondino - 51
Var[b] =
2
(X'X)
-1
. (28)
Se
2
conhecido, uma estimativa da varincia de b
k
dada pelo k-
simo elemento da matriz dada em (28). Ento, seguindo a suposio de
normalidade, uma estatstica de teste para
k
seria dada por:
kk 2
k k
k
S
b
z
= (29)
onde S
kk
o k-simo elemento da matriz (X'X)
-1
.
Por outro lado, se
2
desconhecido, ento um estimador no viciado
para a varincia da regresso dado por:
K n
e e
s
=
'
2
(30)
A matriz de covarincias estimada para b pode ento ser calculada
atravs da seguinte expresso:
Estimativa da Var[b] = s
2
(X'X)
-1
(31)
Conseqentemente, a varincia de b
k
dada pelo k-simo elemento da
matriz dada em (31). Se s
2
for utilizado em lugar de
2
e se b e s
2
so
independentes, pode-se mostrar que a razo:
kk
k k
k
S s
b
t
2
= (32)
Nair Cristina Margarido Brondino - 52
tem distribuio t-Student com (n-K) graus de liberdade. Utilizando este mesmo
resultado, pode-se construir intervalos de confiana para os
k
's com nvel (1-) de
confiana:
= + < < 1 ) s t b s t b ( Prob
bk 2 / k k bk 2 / k
(33)
3.2.1.3. VERIFICAO DA ADEQUABILIDADE DA
REGRESSO AJUSTADA
Uma medida de adequabilidade da regresso ajustada pode ser dada
pelo coeficiente de determinao, R
2
. Este coeficiente serve para verificar o
percentual da varincia de y que explicado pelo modelo ajustado e, para seu
clculo, alguns valores devem ser conhecidos a priori. O primeiro destes valores a
Variao Total em y (SST), cujo valor obtido pela expresso (34).
SST =
y (34)
=
n
i
i
) y (
1
2
Se SSE denota a Soma de Quadrados dos Resduos (e'e), ento pode-
se mostrar que:
SST = SSR + SSE (35)
onde SSR: Soma de Quadrados devido Regresso.
De posse destes valores, pode-se, ento, calcular o coeficiente de
determinao:
SST
SSR
=
2
R (36)
Nair Cristina Margarido Brondino - 53
O valor do R
2
pode variar de 0, o que ocorre quando todos os
elementos do vetor b, exceto o termo constante, so iguais a zero. Neste caso, os
valores preditos para y so sempre iguais a y e, portanto, diferentes valores para x
no conduzem a diferenas nos valores preditos para y, ou seja, x no possui poder
explicativo. Por outro lado, o valor mximo para o R
2
igual a 1, o que ocorre
quando os resduos do modelo so iguais a zero e, portanto, 100% da varincia de y
explicada pelo modelo (situao ideal). Portanto, quanto mais prximo de 1
estiver o valor do R
2
, mais adequado o modelo de regresso ajustado.
Os clculos necessrios para a obteno do R
2
podem ser resumidos
em uma nica tabela, denominada Tabela de Anlise de Varincia.
Tabela 3.1 - Tabela de Anlise de Varincia.
Fonte Graus de liberdade Quadrado Mdio
Regresso
b'X'y - n
2
y
K - 1
Resduo e'e n - K s
2
Total
y'y - n
2
y
n - 1 S
yy
/(n-1) = s
2
y
Coeficiente de determinao R
2
= 1 - e'e/(y'y - n
2
y )
Os resultados mostrados anteriormente tambm podem ser utilizados
para testar a significncia da regresso. Para tal, torna-se necessrio testar a hiptese
de que todos os coeficientes, exceto o termo constante, so iguais a zero. Conforme
j foi mencionado, se todos os coeficientes so iguais a zero, ento R
2
tambm
igual a zero e, portanto, o teste pode ser construdo com base neste valor. Assim, se
2
= 0 (onde
2
a parte do vetor que no inclui a constante) e os distrbios tm
Distribuio Normal, pode-se mostrar que a estatstica:
) )( (
) /(
K n R 1
1 K R
F
2
2
= (37)
Nair Cristina Margarido Brondino - 54
tem Distribuio F com (K-1) e (n-K) graus de liberdade. Grandes valores para F
so induzidos por altos valores do R
2
, o que contradiz a hiptese inicial.
Embora no se aplique a este estudo e, portanto, no ser assunto
includo neste captulo, pode-se generalizar o modelo clssico de regresso para
situaes onde o distrbio no apresenta Distribuio Normal ou a matriz X no
estocstica. Para maiores detalhes, ver GREENE (1997).
3.2.1.4. MULTICOLINEARIDADE
O problema da multicolinearidade existe quando as variveis
independentes so excessivamente autocorrelacionadas, dificultando uma anlise
precisa de seus efeitos individuais. Este tipo de problema fere uma das suposies
bsicas do modelo clssico de regresso que a de que a matriz X deve ter posto
completo, ou seja, no deve existir relao linear perfeita entre as variveis
independentes. Esta suposio feita para assegurar a existncia da inversa de X'X.
So dois os possveis casos de colinearidade: perfeita ou prximo da
multicolinearidade. No primeiro caso, h um nmero infinito de vetores de
parmetros que podem ser consistentes com o mesmo valor esperado. Assim,
independentemente de quantos dados pode-se obter, impossvel estimar os
parmetros do modelo. No segundo caso, o posto da matriz X L<K. Segue disso
que na matriz X h somente L<K fontes independentes de variao. Este um caso
comum quando as variveis so altamente correlacionadas mas esta correlao no
perfeita.
3.2.1.4.1. POSSVEIS SINTOMAS E ALGUMAS MEDIDAS
DE MULTICOLINEARIDADE:
Pequenas mudanas nos dados causam grandes mudanas nas estimativas
dos parmetros;
Nair Cristina Margarido Brondino - 55
Coeficientes podem ter desvio padro elevado e baixo nvel de
significncia embora sejam conjuntamente significantes e o R
2
da
regresso seja elevado;
Coeficientes apresentam o sinal errado ou uma magnitude implausvel.
A seguir so sugeridas algumas medidas de Multicolinearidade
(GREENE, 1997):
1. Seja a matriz X de dimenso K composta de uma coluna de 1's e as demais
colunas representando K-1 variveis medidas em desvios com relao suas
mdias amostrais. Ento, o primeiro elemento diagonal da matriz (X'X)
-1
igual
a 1/(S
11
(1-R
1
2
)), onde R
1
2
o coeficiente de determinao da regresso de x
1
em
uma constante e todas as demais variveis independentes. Conseqentemente, a
varincia de b
1
dada por:
Var (b
1
) =
11
2
1
2
S ) R 1 (
(38)
Ento, se uma varivel altamente correlacionada com x
1
for
adicionada Regresso, S
11
no sofrer mudana radical enquanto que o R
1
2
aumentar, assim como Var (b
1
). Porm, a regra de considerar as correlaes
simples entre as variveis pode no dar uma indicao adequada do problema.
2. Uma outra sugesto a medida proposta por LEAMER (1978)
2
.
2 / 1
1
kk
1
i
2
k ik
k 2
] ) X ' X [(
] ) x x ( [
) b ( c
(39)
2
Lemaer, E. Specification Searches: Ad Hoc Inferences with Nonexperimental Data. New York: John Wiley
and Sons, 1978.
Nair Cristina Margarido Brondino - 56
que eqivale raiz quadrada da razo das verdadeiras varincias de b
k
estimadas
sem e com as outras variveis. Se x
k
no correlacionado com as outras variveis, o
valor em (39) 1. Caso contrrio, este valor seria equivalente a (1 - R
1
2
)
1/2
, que
sugere novamente a utilizao dos coeficientes de determinao.
3. Uma terceira alternativa comparar o coeficiente de determinao da regresso
(R
2
) com os R
i
2
's. Se o valor do R
2
for menor que um dos R
i
2
, ento existe o
problema da multicolinearidade nos dados.
4. Uma quarta sugesto dada por BELSLEY et al. (1980)
3
, onde a grandeza do
nmero de condio (raiz quadrada entre a mxima e a mnima razes
caractersticas) da matriz X'X analisada. Para este clculo, ele sugere que a
matriz X'X deve ser normalizada, dividindo-se cada uma de suas colunas por
(x'
k
x
k
)
1/2
. Quanto maior o nmero de condio, maior a intercorrelao entre as
variveis. O autor sugere que valores acima de 20 so crticos.
5. BELSEY et al. (1980)
2
ainda sugerem uma outra medida de colinearidade. Para
obteno desta medida, parte-se do princpio de que a matriz de covarincia do
vetor obtido por Mnimos Quadrados pode ser escrita em termos de sua
decomposio espectral:
= =
K
1 k
'
k k k
2 2 1 2
c c ) / 1 ( ' C C ) X ' X ( (40)
onde
k
a k-sima raiz caracterstica de X'X, estando os auto-valores ordenados
em ordem decrescente, e c
k
o vetor caracterstico associado. Ento, a varincia do
parmetro b
k
pode ser escrita da seguinte forma:
3
Belsley, D., E. Kuh and R. Welsch. Regression diagnostics: Identifying Influential Data and Sources of
Collinearity. New York: John Wiley and Sons, 1980.
Nair Cristina Margarido Brondino - 57
2
kl l
k
1 l
2
k
C ) / 1 ( ) b ( Var
=
= (41)
Cada varincia pode, ento, ser quebrada na proporo associada com
cada raiz caracterstica, atravs da seguinte expresso:
1
kk
l
2
kl
kl
) X ' X (
/ C
(42)
tal que
kl
, tal que deve-se prestar ateno para grandes valores nas colunas da
tabela, especialmente os que excedem 0,5. Teoria adicional sobre a obteno dos
auto-valores e seus respectivos auto-vetores pode ser encontrada em livros de
lgebra Linear como, por exemplo, LIPSCHULTZ (1968) e ANTON (1991).
3.2.1.4.2. POSSVEIS SOLUES PARA O PROBLEMA DA
MULTICOLINEARIDADE
Duas solues tm sido propostas com o objetivo de lidar com o mais
bvio problema da multicolinearidade: o alto desvio-padro dos parmetros. A
primeira a utilizao do estimador de regresso Ridge, que dado por:
b
r
= [X'X + rD]
-1
X'y (43)
onde D uma matriz diagonal contendo os valores diagonais de (X'X) e r
escolhido arbitrariamente. Uma sugesto iniciar com um valor pequeno de r como,
por exemplo, 0,01 e ir aumentando-o gradativamente at que os coeficientes se
estabilizem. Porm, o estimador Ridge, alm de ser viciado, de difcil inferncia.
Nair Cristina Margarido Brondino - 58
A segunda soluo para o problema o uso de componentes
principais, cujo objetivo o de extrair da matriz X um pequeno nmero de variveis
que contribuem para a maior parte da variao em X. Porm, o estimador obtido por
este critrio tambm viciado e sua utilizao pode apresentar problemas.
Apesar dos problemas j mencionados, este trabalho far uso de
Regresso Ridge, devido s maiores facilidades computacionais deste mtodos.
3.2.1.5. HETEROCEDASTICIDADE
O problema de heterocedasticidade ocorre quando a varincia do
distrbio no constante. Quando isto ocorre, pode-se mostrar que o estimador do
vetor b obtido por Mnimos Quadrados ineficiente e, portanto, outro tipo de
estimador deve ser utilizado (GREENE, 1997). Alm da simples anlise visual,
alguns testes podem ser elaborados com o objetivo de verificar heterocedasticidade,
cujo objetivo testar uma hiptese do tipo H
0
:
i
2
= para todo i.
O primeiro teste o Teste Geral de White. Para obter a estatstica de
teste, basta calcular o valor de nR
2
na regresso de e
i
2
com todas as variveis nicas
da matriz X. Esta estatstica assintoticamente distribuda com uma Distribuio
Qui-Quadrado com P-1 graus de liberdade, onde P o nmero de regressores,
incluindo o termo constante. Este teste extremamente geral e, embora possa
revelar a existncia de heterocedasticidade, no consegue identificar outros erros de
especificao.
Outro teste sugerido o Teste de Goldfeld-Quandt. Para este teste,
assume-se que o grupo de dados possa ser dividido em dois grupos de maneira que,
sob a hiptese de homocedasticidade, as varincias dos distrbios seriam iguais para
os dois grupos. Para executar tal teste, CASSIDY (1981) sugere que as observaes
devem ser ordenadas pela varivel suspeita de heterocedasticidade, que pode ser
indicada atravs da anlise dos grficos de resduos. A partir da, o conjunto de
dados deve ser dividido em trs subconjuntos: o primeiro e o ltimo com m
observaes e o segundo com (n - 2m) observaes. A estatstica de teste , ento
dada por:
Nair Cristina Margarido Brondino - 59
2
1
SSE
SSE
F = (44)
onde SSE
1
e SSE
2
so as Somas dos Quadrados dos Resduos obtidas das regresses
do primeiro e do ltimo conjuntos de observaes, respectivamente. A estatstica F
apresenta distribuio F com (m-K) e (m-K) graus de liberdade, onde K o nmero
de parmetros estimados.
3.2.1.6. OS EFEITOS DE INTERAO
Segundo GUNST & MASON (1980), os termos de interao em um
modelo de regresso so produtos de duas ou mais variveis preditoras. Tais termos
so usuais quando se acredita que o efeito de uma varivel preditora na resposta
depende dos valores de outra(s) varivel(is) preditora(s).
Uma forma de analisar este tipo de efeito sugerida por GREENE
(1997). Seja o modelo dado por:
2 1 4 2 3 1 2 1
x x x x y + + + = (45)
Derivando- se y com relao a x
1
e x
2
, obter-se- as seguintes
relaes:
1 4 3
2
2 4 2
1
x
x
y) ( E
e x
x
) y ( E
+ =
+ =
(46)
As relaes mostradas em (46) implicam no fato de que, se
4
positivo, o efeito marginal de x
1
aumentando quando x
2
aumenta. O mesmo ocorre
quando se avalia o efeito marginal de x
2
. Para a construo de testes de hipteses
Nair Cristina Margarido Brondino - 60
e/ou intervalos de confiana para estes efeitos marginais, a varincia calculada
conforme mostrado na expresso (47) para o efeito marginal de x
1
. Neste caso, um
valor para x
2
deve ser escolhido. Uma escolha natural seria o valor amostral mdio,
embora em algumas circunstncias, seja melhor utilizar o valor mximo obtido.
)
( Cov x 2 )
( Var x )
( Var
x
) y ( E
Var
4 2 2 4
2
2 2
1
+ + =
|
|
.
|
\
|
(47)
3.3. OS SISTEMAS DE INFORMAO GEOGRFICA (SIG)
So vrias as definies para os Sistemas de Informao Geogrfica.
De certa forma, o que muda de uma para outra so apenas as palavras, pois todas
elas conduzem ao mesmo tipo de raciocnio. Somente para exemplificar, algumas
destas definies so listadas a seguir.
Segundo CMARA et al. (1996), os SIGs podem ser definidos da
seguinte maneira:
Sistemas de Informao Geogrfica SIGs so sistemas
automatizados usados para armazenar, analisar e manipular dados
geogrficos, ou seja, dados que representam objetos e fenmenos em que
a localizao geogrfica uma caracterstica inerente informao e
indispensvel para analis-la.
Segundo BUZAI & DURAN (1997), existem diferentes definies,
que foram sendo dadas ao longo do desenvolvimento deste tipo de sistema. A
primeira sugerida por Dacey
4
:
4
Dacey, M. F. Linguistics Aspects of maps and Geographic Information. In: Ontario Geography, n. 5, Ontario. 1970.
Nair Cristina Margarido Brondino - 61
Qualquer coisa que funcione como um mapa, ao comunicar
geograficamente a informao solicitada pelos usurios do sistema.
Porm, os autores consideram tal definio ultrapassada, pois, desde o
aparecimento da geoinformtica, possvel armazenar, processar e reportar dados
espaciais atravs da tecnologia computacional. Neste caso, ainda segundo BUZAI
& DURAN (1997), torna-se mais adequada a definio de Marble
5
:
um sistema baseado em computao para o manejo de dados
espaciais.
Segundo HUXHOLD (1991):
H tantas definies quantas so as disciplinas envolvidas na
utilizao de Sistemas de Informao Geogrfica, quais sejam:
geografia, planejamento urbano, engenharia, processamento de dados,
arquitetura, cincia ambiental e outras. Alm disso, os SIGs consistem
de uma classe de ferramentas que profissionais nestas disciplinas usam
para melhorar a maneira como trabalham. Assim como telefones,
calculadoras e processadores de palavras so ferramentas para tornar o
trabalho mais fcil, rpido e significativo, um SIG produz ferramentas
para o profissional melhorar sua eficincia e eficcia no trabalho com
informao em mapas e atributos de dados no grficos.
Diante do que se exps, as definies dos SIGs refletem a
multiplicidade de usos e vises possveis desta tecnologia e conduzem a um carter
interdisciplinar desta. Sendo assim, possvel indicar duas importantes
5
Marble, D. Geographic Information Systems: An overview. In: Peuquet, D. & Mable, D. (Eds.) Introductory
Readings in Geographic Information Systems. Taylor & Francis. London. 1990.
Nair Cristina Margarido Brondino - 62
caractersticas dos SIGs: a primeira que estes sistemas possibilitam a integrao,
numa nica base de dados, de informaes geogrficas provenientes de fontes
diversas (dados cartogrficos, dados de censo e cadastro urbano e rural, imagens de
satlite e modelos numricos de terreno) e a segunda que os SIGs oferecem
mecanismos para recuperar, manipular e atualizar estes dados, atravs de algoritmos
especficos para estes propsitos.
3.3.1. HISTRICO
As primeiras tentativas de automatizar o processamento de dados
georeferenciados ocorreram na Gr-Bretanha e nos USA, visando diminuir os
custos de produo e atualizao de mapas. No primeiro caso, o sistema foi
desenvolvido para pesquisas em botnica, enquanto que no segundo o objetivo
principal era a engenharia de trfego (CMARA et al., 1996).
Somente nos anos 60 surgiram os primeiros SIGs propriamente ditos.
Seu desenvolvimento teve origem no Canad atravs de um plano estratgico
governamental de longo prazo para criar um inventrio automatizado de recursos
naturais, com vistas ao planejamento destes recursos e ao uso do solo.
Durante os anos 70 desenvolveram-se fundamentos matemticos
voltados para a cartografia. Data desta dcada o surgimento da topologia aplicada,
que permitiu anlises espaciais entre elementos cartogrficos.
Porm, os SIGs, que somente eram utilizados por grandes
organizaes at a dcada de 80, passaram a se difundir, o que ocorreu devido
popularizao e barateamento das estaes de trabalho, dos computadores pessoais
e dos bancos de dados.
Este mesmo progresso tecnolgico permitiu aperfeioar os
mecanismos de aquisio de dados georeferenciados, o que aumentou a
complexidade de coleta, armazenamento, manipulao e visualizao dos dados, em
funo do seu volume, variedade e heterogeneidade.
Nair Cristina Margarido Brondino - 63
CMARA
6
considera trs geraes de Sistemas de Informao
Geogrfica.
A primeira, baseada em CAD cartogrfico, caracteriza-se por
sistemas herdeiros da tradio de Cartografia, com suporte de banco de
dados limitado e cujo paradigma tpico de trabalho o mapa. Esta
classe de sistemas utilizada principalmente em projetos isolados, sem a
preocupao de gerar arquivos digitais de dados. Esta gerao tambm
pode ser caracterizada como sistemas orientados a projeto.
A segunda gerao de SIGs, baseada em banco de dados
geogrficos, chegou ao mercado no incio da dcada de 90 e
caracteriza-se por ser concebida para uso em ambientes cliente-
servidor, acoplado a gerenciadores de bancos de dados relacionais e
com pacotes adicionais para processamento de imagens. Desenvolvida
em ambientes multiplataforma com interfaces em janelas, esta gerao
tambm pode ser vista como sistemas para suporte a instituies.
Para o final da dcada de 90, previsto o aparecimento de uma
terceira gerao de SIGs baseada em bibliotecas digitais geogrficas
ou centros de dados geogrficos, caracterizada pelo gerenciamento de
grandes bases de dados geogrficos, com acesso atravs de redes locais
e remotas, pblicas ou privadas. Para esta terceira gerao, o
crescimento de bancos de dados geogrficos e a necessidade de seu
compartilhamento com outras instituies requer o recurso de
tecnologias como bancos de dados distribudos e federativos. Estes
Sistemas devero seguir os requisitos de interoperabilidade, de maneira
a permitir o acesso de informaes espaciais por SIGs distintos. A
terceira gerao do SIG pode ainda ser vista como o desenvolvimento de
sistemas orientados troca de informaes entre uma instituio e os
demais componentes da sociedade.
6
Camara G, Modelos, Linguagens e Arquiteturas para Bancos de Dados Geogrficos. Tese de Doutorado, INPE,
1995.
Nair Cristina Margarido Brondino - 64
3.3.2. TRATAMENTO DA INFORMAO
Conforme mencionado nas definies de SIG apresentadas
anteriormente, o grande objetivo desta ferramenta, de forma bastante resumida,
associar um banco de dados alfanumricos a um banco de dados grficos. Porm,
para que esta associao ocorra com sucesso, deve obedecer certos pr-requisitos
com relao ao tratamento prvio dos respectivos dados de entrada.
3.3.2.1. TRATAMENTO DE DADOS ALFANUMRICOS
O tratamento de dados alfanumricos pode ser realizado atravs do
uso de editores de texto (que armazenam informaes em ASCII), administradores
de bancos de dados (que organizam os dados em forma matricial, onde as linhas
representam os registros e as colunas representam as caractersticas de cada
registro) e planilhas de clculo. Uma outra alternativa so os programas de anlise
estatstica, onde o tipo de tratamento de dados se baseia em dois grandes grupos:
anlise descritiva das distribuies e medio por agrupamentos (inclui diferentes
tipos de anlises numricas e suas conseqentes representaes grficas) e o da
associao de fenmenos (dominado por diferentes formas de anlises de
associao atravs do uso de coeficientes de correlao por exemplo, anlise de
clusters).
Outra opo o uso de dados provenientes de sensores localizados em
satlites artificiais, atravs do uso de GPS (sistema militar desenvolvido pelo
Departamento de Defesa dos Estados Unidos que permite obter, mediante utilizao
de sinais emitidos por satlites artificiais e de receptores na terra, as coordenadas
geogrficas de qualquer ponto sobre a superfcie terrestre), cujas medies podem,
em certas circunstncias, fornecer preciso inferior a um metro.
Nair Cristina Margarido Brondino - 65
3.3.2.2. TRATAMENTO DOS DADOS GRFICOS
O tratamento de dados grficos pode se dar atravs de Projeto
Assistido por Computador (CAD Computer Aided Design) ou Cartografia
Assistida por Computador (CAC). A utilizao deste tipo de ferramenta se realiza
mediante a utilizao de programas que servem para a digitalizao de entidades
grficas vetoriais, basicamente pontos, arcos e polgonos que, combinados, formam
um mapa denominado vetorial. Este tipo de programa possui grande capacidade e
preciso no manejo com dados em duas ou trs dimenses. Em geoinformtica se
aplica principalmente de maneira bidimensional para realizar cartografia assistida
por computador (CAC), incorporando ao formato digital os mapas analgicos em
papel mediante digitalizao em mesa.
Uma segunda alternativa o Processamento Digital de Imagens (PDI),
que realizado atravs da utilizao de software utilizado em geoinformtica
especificamente para o tratamento de imagens digitais provenientes do uso de
scanners ou satlites espaciais. O tipo de estrutura de imagens provenientes dos
scanners e dos sensores incorporados aos satlites se denomina raster (ou matricial)
e ser discutido em maiores detalhes no prximo item.
A Modelagem Numrica de Terreno consiste de um procedimento
computacional pelo qual se representa o espao geogrfico em trs dimenses.
O tratamento combinado dos arquivos correspondentes aos dois tipos
de bases de dados e sua georeferenciao pode ser executado atravs da tecnologia
dos SIGs, cuja estrutura pode ser representada atravs do diagrama mostrado na
Figura 3.7.
Nair Cristina Margarido Brondino - 66
BASES DE DADOS
ALFANUMRICA:
EDITORES DE TEXTO
ADMINISTRADORES DE BASES
DE DADOS
PLANILHAS DE CLCULO
PROGRAMAS DE ANLISE
ESTATSTICA
SISTEMAS DE POSICIONAMENTO
GLOBAL
GRFICA:
CAD (Desenho Assistido por Computador)
CAC (Cartografia Assistida por Computador)
PDI (Processamento Digital de Imagens)
MNT (Modelagem Numrica de Terrenos)
SISTEMAS DE INFORMAO
GEOGRFICA
Figura 3.7 Diagrama esquemtico de um SIG.
3.3.3. ESTRUTURAS DE REPRESENTAO DO ESPAO
GEOGRFICO
A forma como o software armazena e representa os dados na tela tem
um importante papel no tipo de anlise a ser conduzida. Dentre as estruturas de
representao do espao geogrfico pelo SIG, duas tm se destacado: o modelo
matricial e o modelo vetorial.
No modelo matricial, a representao grfica formada por uma
matriz quadriculada, onde cada clula representa uma unidade mnima de resoluo
espacial: o pixel. A informao sobre o espao geogrfico que cada pixel contm
numrica e o nmero contido no pixel constitui uma das caractersticas descritivas
em que se apresenta a composio cartogrfica atravs de um grafismo ou de uma
cor. A informao contida provm da associao de um nmero digital a cada pixel
como unidade mnima de representao. Este valor numrico e sua escala vai de
zero (branco total) a 255 (preto total) em sua mxima possibilidade grfica.
Desta forma, o tratamento matricial de cada mapa oferece vrios tipos
de representao para uma mesma rea de estudo. A anlise das informaes se
efetua por superposio de vrias camadas temticas. Um exemplo de modelo
matricial ou raster apresentado na Figura 3.8.
Nair Cristina Margarido Brondino - 67
1
1
1
2
2 2
2 3
2
2
3
3
2
2
3
3
REPRESENTAO EM CAMADAS:
CAMADA 1
CAMADA 2
CAMADA 3
Figura 3.8 Modelo matricial (ou raster).
O modelo quadtree uma variante do modelo raster. Neste modelo,
tem-se que em uma nica composio cartogrfica pode-se contar com diferentes
tipos de pixels. Em localizaes onde a homogeneidade espacial se mostra extensa,
os pixels so maiores, enquanto que em locais onde as variaes de categorias so
muito pronunciadas, se usa clulas menores. O quadtree uma estrutura de dados
baseada na decomposio regular da imagem em quadrantes e subquadrantes. Esta
estrutura divide hierarquicamente o espao em determinados nveis de quadtrees.
No nvel 1, o espao dividido em quatro quadrantes. Se no h homogeneidade,
cada um dos quadrantes do nvel 1 dividido em mais quatro quadrantes e assim
por diante (TEIXEIRA et al., 1992).
O modelo vetorial opera representando o espao geogrfico de
maneira contnua e se baseia nas entidades caractersticas de todo desenho
cartogrfico: o ponto, a linha e a rea. As bases de dados utilizadas por este modelo
so do tipo relacional, onde os campos contm a informao espacial e os registros
Nair Cristina Margarido Brondino - 68
representam a totalidade das unidades espaciais consideradas. Uma base de dados
geogrfica difere da base convencional, uma vez que contm a localizao espacial
de cada registro e uma tabela topolgica guarda suas relaes. De maneira geral, em
uma base de dados geogrfica pode-se associar a informao alfanumrica grfica.
Um modelo de uma base de dados vetorial mostrado na Figura 3.9.
3
1
2
1
2
3
3
1
2
BASE DE DADOS DE PONTOS
BASE DE DADOS DE LINHAS
BASE DE DADOS DE REAS
Figura 3.9 Modelo vetorial.
3.3.4. DIFERENAS ENTRE OS SIGs E O CAD
Segundo SILVA et al. (1997), a principal diferena entre um SIG e
um CAD reside no fato de que o primeiro capaz de identificar as relaes entre
objetos, ou seja, a topologia. Um exemplo de como a topologia em sistemas deste
tipo funciona, pode ser quanto interpretao do desenho. Enquanto que um CAD
interpreta um quadrado como a juno de quatro linhas, o SIG pode interpretar o
mesmo quadrado como uma rea, cujas caractersticas esto armazenadas em um
banco de dados associado, o que torna possvel realizar anlises com as
caractersticas espaciais dos objetos.
Nair Cristina Margarido Brondino - 69
3.3.5. SITUAO ATUAL DO USO DE SIG NA
AVALIAO IMOBILIRIA
Os SIGs vm sendo utilizados nas mais diversas reas de pesquisa,
com resultados bastante satisfatrios. Dentre estas reas, pode-se mencionar estudos
recentes de avaliao imobiliria, que tm utilizado esta ferramenta como banco de
dados para anlises e como um fator de visualizao espacial de caractersticas,
valores reais e valores estimados.
Entre estes estudos, pode-se mencionar o trabalho de HADDAD (1995
e 1997), que consta de um estudo sobre o mercado imobilirio para a cidade de So
Paulo feito a partir de dados de propriedades venda. Em seu trabalho foi feito um
estudo temporal-espacial da valorizao destas propriedades, assim como dos plos
de valorizao da cidade.
Em outro trabalho, levado a cabo por SILVA & WAERDEN (1997)
para fins de taxao, se estudou, atravs do uso de SIG, a aplicao de dois modelos
designados a calcular o custo adicional para levar redes de infra-estrutura e de
transporte urbano a bairros localizados na periferia e separados da cidade por
grandes vazios urbanos. Ainda com vistas taxao de propriedades, pode-se citar o
relato de ULUACHA (1997), desenvolvido para a Nigria.
BRONDINO & SILVA (1998a e 1998b) tambm utilizaram SIG em
aplicaes de seus modelos de avaliao para duas cidades brasileiras: So Carlos e
Araariguama, respectivamente.
Dentro da literatura brasileira, pode-se citar ainda outros casos de
utilizao de SIGs em trabalhos de avaliao de imveis, tais como DUARTE &
GABBAY (1995), YUAA (1996), RAIA JR et al. (1996a e 1996b) e SILVA
(1998). A utilizao da ferramenta para este fim se intensifica devido ao fato de que
em um SIG, as propriedades de grficos interativos permitem ao usurio gerar
sadas grficas rapidamente e resumir ou relacionar dados estatsticos num contexto
geogrfico. Esta tcnica grfica fornece um mtodo efetivo de avaliao dos
resultados de anlise, particularmente com grandes conjuntos de dados (HSIAO &
Nair Cristina Margarido Brondino - 70
STERLING, 1992). Esta propriedade do SIG pode ser ainda incrementada com o
uso de um conjunto de tcnicas especficas denominado estatstica espacial, como
se pode ver no prximo tpico.
3.3.6. ESTUDOS PRELIMINARES SOBRE ESTATSTICA
ESPACIAL
A estatstica espacial definida como uma coleo de tcnicas para
anlise geogrfica onde o resultado da anlise depende do arranjo espacial dos
eventos. Evento geogrfico entendido como uma coleo de pontos, linhas ou
objetos, localizados no espao, ligados com uma classe de atributos... (HAINING,
1995).
Baseado na coleo sistemtica de informao quantitativa, os
objetivos da estatstica espacial so:
1) Descrio cuidadosa e precisa de eventos no espao geogrfico
(incluindo a descrio de padres);
2) Explorao sistemtica do padro dos eventos e a associao entre
eventos no espao com o objetivo de ganhar um melhor
entendimento dos processos que podem ser responsveis pela
distribuio dos eventos observada, e
3) Melhorar a habilidade de predizer e controlar eventos que ocorrem
no espao geogrfico.
O interesse por ferramentas de estatstica espacial acopladas aos
Sistemas de Informao Geogrfica (SIG) tem crescido significativamente
(LONGLEY & BATTY, 1996). Alguns SIGs j tm ferramentas deste tipo
acopladas ao programa, como o caso do software ARC INFO. Alguns
pesquisadores, por sua vez, fazem ligaes entre pacotes estatsticos e SIGs.
Outros, ainda, desenvolvem macros especficas para este tipo de anlise dentro do
prprio SIG.
Nair Cristina Margarido Brondino - 71
Os resultados obtidos at o presente momento sugerem que os grupos
de mtodos para os quais a ligao com o SIG vm produzindo melhores resultados
seriam aqueles das estatsticas descritivas simples e os relacionados com a estrutura
de anlise de covarincia. Outras reas da estatstica tais como mtodos de
alisamento, funes-K e regresso espacial podem produzir benefcios equivalentes.
Porm, at o presente momento, um progresso moderado tem sido em direo
visualizao geogrfica. Algum progresso tambm tem sido observado com relao
a mtodos estatsticos descritivos, o que conduz impresso de que muita coisa
ainda pode ser feita com relao ao casamento estatstica espacial-SIG. Neste
sentido, esforos podem ser destinados no ao desenvolvimento de ferramentas
internas ao SIG mas sim na melhora da interface entre programas estatsticos e
SIGs.
Segundo LEVINE (1996), h algumas estatsticas espaciais que
podem descrever a distribuio espacial dos dados. As variveis que podem ser
descritas espacialmente podem tanto ocorrer em localizaes pontuais nicas
(acidentes, construes, pessoas) ou estar agregadas (zonas de trfego, limites da
cidade etc.). As estatsticas que podem descrever tanto pontos quanto reas
pertencem a trs categorias gerais:
1. Medidas de distribuio espacial: descrevem o centro, a disperso,
direo e forma da distribuio de uma varivel;
2. Medidas de auto-correlao espacial: descrevem a relao entre as
diferentes localizaes para uma varivel simples, indicando o grau
de concentrao ou disperso, por exemplo, anlise de clusters;
3. Medidas de associao espacial entre duas ou mais variveis:
descrevem a correlao ou associao entre variveis distribudas no
espao, por exemplo, correlacionar lojas de bebidas com lugares
onde ocorrem acidentes.
Nair Cristina Margarido Brondino - 72
O mesmo LEVINE (1996) recomenda alguns programas de
computador j disponveis para executar este tipo de anlise de acordo com o tipo
de problema a ser estudado.
Desta forma, utilizando estes conceitos, cada vez mais, pesquisadores
tm feito uso desta tcnica, que no entanto ainda bastante incipiente. Um exemplo
da utilizao de estatstica espacial em avaliao imobiliria vem do trabalho de
BULLEN (1997). Em seu trabalho, modelos de regresso foram usados para estimar
valores de propriedades no Reino Unido. A autora apresenta uma introduo
modelagem em mltiplos nveis (Multilevel), onde modelos diferentes de avaliao
so estimados para diversas regies. Os resduos so, ento, adicionados a um
Sistema de Informao Geogrfica, onde as regies com preos abaixo e acima da
mdia podem ser visualmente identificadas.
Ainda nesta direo, o trabalho de PATKAR (1997) sugere
combinaes possveis de ferramentas matemticas e SIG e o trabalho de WONG &
WU (1995) alerta para o perigo da agregao, sugerindo alguns mtodos para
calcular os erros e distores provocados por este procedimento.
Alm dos mtodos estatsticos convencionais para anlise espacial,
um estudo desenvolvido por WYATT (1997) faz uso de Redes Neurais (Kohonen)
para fazer anlise de agrupamentos.
Como pode ser observado por esta breve pesquisa bibliogrfica, a
estatstica espacial se apresenta como uma ferramenta poderosa de anlise em vrios
campos de estudo (RIPLEY, 1981). Porm, sua unio com os SIGs est ainda em
fase bastante inicial e se apresenta como uma ferramenta potencial de anlise.
Nair Cristina Margarido Brondino - 73
4. METODOLOGIA
Neste capitulo sero explicados os procedimentos adotados para o
desenvolvimento deste trabalho. Na seqncia, haver uma
explanao sobre as cidades que foram objeto deste estudo e do
processo de coleta de dados empregado para cada uma delas.
O mtodo empregado para o desenvolvimento desta pesquisa foi
desenvolvido com base nos principais objetivos deste trabalho que, de forma
resumida, so os seguintes:
Identificar variveis importantes para a formao do valor da propriedade
Utilizar Redes Neurais para estimar valores das propriedades
Avaliar a influncia da acessibilidade na valorizao da propriedade urbana
Estabelecidos os objetivos, houve a necessidade de se identificar as
fontes de dados necessrias. Para tal fim, as prefeituras de duas cidades foram
contatadas: Araariguama e So Carlos. A primeira, colocou disposio um
levantamento de caractersticas da maioria das propriedades locais, feito em 1995.
Quanto segunda, alm dos dados do Censo de 1991, fornecidos pelo IBGE, a
prefeitura colocou disposio alguns dados constantes no setor de cadastro.
Escolhidas as cidades, o prximo passo foi decidir quais variveis
fariam parte do modelo de avaliao, com base na bibliografia pesquisada. Para a
Nair Cristina Margarido Brondino - 74
cidade de Araariguama, as variveis escolhidas ficaram limitadas aos principais
aspectos constantes na ficha de cadastro. Para So Carlos, foi elaborada uma ficha
com diversas caractersticas das propriedades a serem pesquisadas.
O prximo passo foi o de coleta da amostra. Para Araariguama, a
amostra constou, praticamente, da totalidade de terrenos vazios situados em seis
bairros. Para So Carlos, a amostra foi dimensionada com base no valor por m
2
.
Os preos dos terrenos em Araariguama tambm foram fornecidos
por um cadastro da prefeitura. Para So Carlos, caractersticas e preos de terrenos
venda foram levantados junto s imobilirias.
Os terrenos amostrados foram, ento, digitalizados nos mapas de
ambas as cidades atravs de recursos do software TransCAD
7
, para que as
caractersticas espaciais, como a acessibilidade, pudessem ser levantadas.
Construdos os conjuntos de dados, estes foram divididos, de forma
aleatria, em trs grupos distintos, destinados para cada uma das trs fases do
modelo de Redes Neurais, ou seja, treinamento (50% dos dados), validao e teste
(25% dos dados em cada). Esta diviso foi feita trs vezes para cada uma das
cidades, gerando trs grupos distintos de dados. Como, em geral, a definio do
nmero de camadas escondidas e de neurnios em cada uma delas camadas se d
por experimentao, redes com vrias configuraes foram testadas, utilizando
como ferramenta o software Neural Planner, verso 4.2. Cada configurao de rede
foi testada para cada um dos trs grupos de dados e o erro relativo total, cuja
frmula dada pela equao (48), foi calculado em cada caso. Desta forma, gerou-
se trs valores de erro para cada topologia. O prximo passo constou do clculo da
mdia destes erros. Assim, o valor mnimo para esta mdia conduziu melhor
topologia, ou seja, configurao de rede que forneceria estimativas mais prximas
ao valor real observado.
=
o
e o
erros
(48)
7
TransCAD um programa criado e comercializado pela Caliper Corporation, 1172 Beacon Street, Newton,
MA 02161, USA.
Nair Cristina Margarido Brondino - 75
onde o representa o valor observado e e, o valor estimado pelo modelo.
Alm da mdia dos valores dos erros fornecidos pela equao (48), os
valores do R
2
, obtido pelo mesmo critrio utilizado na regresso, tambm foi
utilizado para verificar a adequabilidade do modelo escolhido.
Para verificar a influncia das variveis no valor dos lotes, aps
escolhida a melhor configurao de rede, NATH et al. (1997) sugerem que a
relevncia de cada varivel no modelo pode ser analisada segundo o mtodo
proposto por Garson
8
. Este mtodo particiona os pesos sinpticos entre a camada
intermediria e a de sada em componentes associados a cada n de entrada. Assim,
o peso resultante associado a cada entrada um reflexo de sua importncia.
Tal mtodo descrito aqui de forma resumida. Inicialmente, assume-
se que w
ij
(i=1,...,k; j=1,...,p) seja o peso que conecta o neurnio de entrada i com o
neurnio j na camada intermediria. Da mesma forma, assume-se que w
rs
(r=1,...,p)
seja o peso que conecta o neurnio r da camada intermediria com o neurnio de
sada. Ento, o peso w
rs
, independentemente de seu sinal pode ser incorporado aos
pesos w
ij
, usando a expresso (49), a seguir:
{ }( )
rs j ij ij
W S w w /
*
= (49)
onde
=
=
k
i
ij j
W S
1
.
A seguir, para cada n de entrada, os pesos ajustados so somados
para cada um dos ns da camada intermediria, ou seja, para todo i calcula-se
.
Desta forma, o percentual dado pela equao (50) serve como uma medida de
salincia da varivel representada pelo n de entrada.
*
ij
w
=
p
j
ij
w
1
*
8
Garson, D. G. Interpreting neural-network connection weights. AI Expert, 1991, April, 47-51.
Nair Cristina Margarido Brondino - 76
= =
=
=
k
i
p
j
ij
*
ij
w
w
1 1
*
p
1 j
(%) i varivel da relevncia (50)
Uma vez identificadas as variveis relevantes, uma nova rede
treinada considerando-se apenas estas variveis como entrada. O percentual de
representao de uma varivel que a torne irrelevante depende do autor e do
assunto. Para este estudo em particular, foram retiradas as variveis que
apresentavam percentuais de representao iguais ou menores a 5%.
O prximo passo constou da comparao espacial dos resultados,
objetivando verificar se os erros obtidos pelos mtodos empregados possuam
algum padro de distribuio espacial. Esta comparao de resultados partiu da
idia de verificar em quais bairros os modelos no apresentavam boas estimativas e,
se possvel, corrigir a distoro existente, atravs da adio de algum elemento novo
ao modelo. A primeira alternativa para este tipo de estudo seria a utilizao de um
programa especfico para anlise espacial, conforme o sugerido por LEVINE
(1996). Porm, como no havia disponibilidade imediata deste tipo de software,
resolveu-se utilizar um mtodo misto, onde tcnicas estatsticas de agrupamento
foram utilizadas e o resultado obtido foi adicionado ao SIG.
Para a construo dos mapas temticos em questo, os erros relativos
obtidos para cada um dos trs conjuntos, utilizando o Modelo de Regresso como
padro, foram agrupados pelo mtodo dos k-vizinhos mais prximos. Para cada
conjunto, os erros foram divididos em quatro clusters, cujos limites tambm foram
utilizados para construir os intervalos dos erros obtidos pelas ANN. A seguir,
verificou-se o percentual de pontos que se enquadrava em cada cluster para ambos
os mtodos.
4.1. A CIDADE DE ARAARIGUAMA
Araariguama uma cidade localizada a aproximadamente 40 km de
So Paulo e foi, durante muitos anos, distrito do municpio de So Roque e somente
Nair Cristina Margarido Brondino - 77
h pouco tempo conseguiu sua emancipao. Como caracterstica principal do
lugar, pode-se citar que ela uma cidade do tipo dormitrio, ou seja, boa parte de
sua populao economicamente ativa trabalha nas cidades vizinhas, principalmente,
So Paulo, So Roque e Sorocaba.
Atualmente, o nmero de habitantes no lugar est em torno de 6000 e
o nmero de propriedades, aproximadamente 1500, entre terrenos e construes. A
cidade est dividida em nove bairros, a saber: Centro, Vila Real, Vale da Beno,
Chcara Dora, Terra Baixa, Vila Alumnio, Cintra Gordinho, Estncia Imperial e
Vila Nova.
4.1.1 COLETA DE DADOS
Por ocasio do levantamento de dados para este projeto, a Prefeitura
local havia iniciado os trabalhos de cadastramento das propriedades e possua
registros apenas daquelas localizadas em seis dos bairros citados: Centro, Vila Real,
Vale da Beno, Chcara Dora, Estncia Imperial e Vila Nova. Dentre as
caractersticas constantes nos arquivos originais deste cadastro, procurou-se retirar
as mais relevantes para construir o modelo de avaliao, com base na bibliografia
pesquisada.
As variveis retiradas do cadastro, acompanhadas das codificaes
empregadas na construo do banco de dados, so dadas a seguir:
FORMA: forma do terreno - varivel binria, assumindo valor 1
(regular) ou 0 (irregular);
TESTADA: testada principal do terreno (m);
REA: rea do terreno (m
2
);
MURO: existncia de muro - varivel binria, assumindo valor 1
(presena) ou 0 (ausncia);
CALADA: existncia de calada - varivel binria, assumindo
valor 1 (presena) ou 0 (ausncia);
Nair Cristina Margarido Brondino - 78
SITUAO: situao dentro da quadra - varivel binria,
assumindo valor 1 (esquina) ou 0 (outros);
A stima varivel empregada, menor caminho percorrido at o centro
atravs da malha viria em quilmetros (MC), foi obtida atravs de uma rotina do
software TransCAD.
Os preos dos imveis foram obtidos, tambm de cadastro da
Prefeitura, por um ex-aluno de Engenharia Civil desta Escola, oriundo da cidade em
questo, como parte de um trabalho de graduao.
Diante do que se exps, pode-se dizer que no houve, para este
projeto, no caso de Araariguama, um trabalho prvio de dimensionamento da
amostra, nem um critrio de amostragem especfico. Porm, a amostra constituda
de 157 lotes, ou seja, mais que 10% do total de endereos (contando-se construes
e terrenos vazios) da cidade. Para os seis bairros citados, a amostra constituda
praticamente da totalidade da populao de imveis no construdos.
Um mapa da cidade, onde podem ser vistos os terrenos constantes da
amostra, apresentado na Figura 4.1.
Figura 4.1 - Distribuio espacial dos lotes pesquisados na cidade de Araariguama.
Nair Cristina Margarido Brondino - 79
4.2 A CIDADE DE SO CARLOS
So Carlos situa-se na regio centro-oeste do estado de So Paulo,
distante 230 km da capital. Possui cerca de 160.000 habitantes e conta hoje com um
importante centro industrial, quando comparada s demais cidades do interior com
mesmo porte. Possui empresas como Johann Faber (utenslios para desenho e
escrita), Tecumseh (compressores), Eletrolux Prosdcimo (eletrodomsticos),
Latina (eletrodomsticos) e Volkswagen (automotiva). Possui ainda vrias empresas
de pequeno e mdio porte, que atuam na rea de mquinas agrcolas, componentes
para as empresas de porte maior e informtica. Conta ainda com o Parque de Alta
Tecnologia, estrutura montada para fornecer apoio a novos empreendimentos
ligados a tecnologias de ponta.
Possui tambm duas Universidades pblicas, um campus da
Universidade de So Paulo e o campus da Universidade Federal de So Carlos, que
somados EMBRAPA (Empresa Brasileira de Pesquisa Agropecuria) tornam a
cidade um importante centro de pesquisas.
4.2.1 COLETA DE DADOS
Como se pode notar pelos modelos citados anteriormente, cada
modelo de avaliao pode fazer uso dos mais diversos tipos de variveis. Cada lugar
apresenta caractersticas prprias de valorizao e deve ser tratado individualmente.
Um modelo que produz bons resultados para uma cidade, pode no fornecer boas
estimativas para outra, mesmo estando as duas muito prximas fisicamente.
Para a coleta de dados em So Carlos, recorreu-se inicialmente ao
Setor de Cadastro da Prefeitura Municipal, onde os fechamentos de quadra, que so
uma espcie de planta de cada quarteiro, foram obtidos. Nestes fechamentos
constam todos os imveis pertencentes quadra, assim como os respectivos
endereos. Tais dados, totalizando mais de 2800 quadras, foram utilizados para a
execuo do plano de amostragem e para a localizao dos lotes amostrados no
mapa da cidade.
Nair Cristina Margarido Brondino - 80
Para a escolha das variveis que fariam parte deste estudo, foram
consultados alguns especialistas na rea imobiliria em So Carlos, a fim de
verificar quais so os fatores que mais pesam para o comprador na aquisio de um
imvel. De posse destas informaes, de algumas variveis utilizadas em estudos
similares e das variveis sugeridas pela Norma NBR 5676, elaborou-se uma ficha
para a execuo da pesquisa de campo. As variveis constantes nesta ficha,
acompanhadas de suas codificaes para entrada no banco de dados, so dadas a
seguir:
REA: rea do terreno (m
2
);
TESTADA: testada principal do terreno (m);
TOPOGRAFIA: declividade do terreno varivel binria,
assumindo valor1 (plano) ou 0 (outros);
FORMA: forma do terreno - varivel binria, assumindo valor 1
(regular) ou 0 (irregular);
SITUAO: situao dentro da quadra - varivel binria,
assumindo valor 1 (esquina) ou 0 (outros);
EDIF: existncia de edificaes na quadra varivel binria
assumindo valor 1 (sim) ou 0 (no);
GUA: existncia de rede de gua tratada varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
ESGOTO: existncia de rede de esgoto varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
LUZ: existncia de rede de energia eltrica - varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
ASFALTO: existncia de pavimentao varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
MURO: existncia de muro - varivel binria assumindo valor 1
(presente) ou 0 (ausente)
Nair Cristina Margarido Brondino - 81
CALADA: existncia de calada - varivel binria assumindo
valor 1 (presente) ou 0 (ausente)
As caractersticas fsicas obtidas foram lanadas num Sistema de
Informaes Geogrficas. A medida de acessibilidade utilizada, ou seja, a distncia
ao centro atravs da malha viria dada em quilmetros (MC), tambm foi obtida a
partir dos recursos do SIG utilizado, neste caso, o software TransCAD.
A princpio, duas eram as possibilidades para a aquisio de dados:
uma junto s imobilirias locais e outra junto ao Cartrio de Registro de Imveis da
cidade. A segunda opo foi logo descartada porque, conforme informaes de
corretores, em geral, as escrituras na cidade so registradas utilizando-se o valor
venal do imvel fornecido pela Prefeitura, que bastante baixo comparado ao valor
de mercado, tornando esta informao muito pouco confivel. Optou-se, ento, por
procurar os dados nas imobilirias.
Segundo alguns profissionais do setor imobilirio consultados em So
Carlos, h atualmente na cidade uma grande oferta de terrenos, devido ao ltimo
plano de estabilizao monetria do governo federal (Plano Real). Quem adquiriu
um terreno antes do Plano Real para vend-lo mais tarde a um preo mais elevado
teve uma surpresa: ningum quer comprar. Estas pessoas querem agora vender os
imveis a um preo que seja, no mnimo, igual ao preo que pagaram. Acontece que
este preo ainda est acima do valor que os compradores aceitam pagar hoje,
fazendo com que haja hoje uma grande oferta de terrenos, mas com preos muito
altos. Portanto, os preos dos terrenos a serem utilizados sero aqueles a princpio
almejados pelos proprietrios destes e que muitas vezes esto acima do valor de
mercado e acabam sendo vendidos com descontos.
Alm disso, infelizmente, a maioria das imobilirias no dispe de
todos os dados desejados sobre as caractersticas dos lotes. Quase todas as
imobilirias organizam os dados em fichas e cadernos, pouqussimas organizam em
computadores pessoais e, em algumas, somente o corretor tem conhecimentos sobre
os dados dos terrenos, o que dificulta muito a coleta. Outro fator que atrapalha a
amostragem a ausncia de exclusividade de venda do terreno pela imobiliria. O
Nair Cristina Margarido Brondino - 82
dono do terreno pode coloc-lo venda em quantas imobilirias ele quiser, por isso
quase no h placas em terrenos que esto venda, impossibilitando uma coleta de
dados in loco antes de realizar a pesquisa em imobilirias. No caso de haver dados
do mesmo terreno em mais que uma imobiliria, assumiu-se como seu preo a
mdia entre todos os valores pedidos por ele.
4.2.1.1 DIMENSIONAMENTO DA AMOSTRA
Para a coleta de dados, a cidade foi dividida em trs grupos diferentes
de terrenos. Esta escolha deu-se pelo fato da cidade possuir propriedades com os
mais variados valores por metro quadrado e caractersticas. Optou-se, ento, por
dividir a cidade em bairros de trs categorias, a saber: A, B e C, sendo os do tipo A,
os bairros que apresentam o m
2
mais caro. Com esta diviso, alm de conseguir
bons resultados com amostras menores, pode-se obter modelos mais precisos em
termos de avaliao. Um modelo que contivesse todos os tipos de propriedades,
implicaria numa grande variabilidade de valores e poderia subestimar ou
superestimar o valor de algumas. Para esse fim, foram consultados especialistas na
rea de mercado imobilirio e, a partir dos dados fornecidos por estes e do
mapeamento de renda obtido pelos dados do Censo de 1991, a diviso em classes
foi elaborada como consta nas Tabelas 4.1, 4.2 e 4.3. Como bairros do tipo A, foram
considerados aqueles cujos terrenos apresentassem valores maiores que R$ 50,00
por m
2
. Como bairros do tipo B, classificou-se aqueles onde o valor por metro
quadrado est situado na faixa de R$ 36,00 a R$ 50,00 e do tipo C, os de valor por
m
2
abaixo de R$ 36,00.
Nair Cristina Margarido Brondino - 83
Tabela 4.1 - Classificao dos bairros da cidade de So Carlos pela classe de preo
A.
Centro Chcara So Joo
Cidade Jardim Jardim Bethania
Jardim Macarengo Jardim Ricetti
Jardim Santa Helena Jardim Santa Paula
Parque Arnoldo Schimid Parque Estncia Suia
Parque Nova Estncia Suia Parque Sabar
Parque Santa Mnica Vila Elisabeth
Vila Monteiro Vila Nery
Jardim Nova Santa Paula Jardim So Carlos
Loteamento Albertini Loteamento Centreville
Loteamento Taba Yacy Vila Prado
Tabela 4.2 - Classificao dos bairros da cidade de So Carlos pela classe de preo
B.
Chcara So Caetano Jardim Bandeirantes
Jardim Brasil Jardim Centenrio
Jardim Gilbertoni Jardim Hikari
Jardim Luthfalla Jardim Nossa Senhora Aparecida
Jardim Nossa Senhora de Ftima Jardim Nova So Carlos
Jardim Paulista Jardim Paulistano
Morada dos Deuses Ncleo Residencial Silvio Villari
Parque Industrial Miguel Abdelnur Parque Paraso
Parque Primavera Parque So Jos
Portal do Sol Recreio dos Bandeiraantes
Solar do Engenheiros Tijuco Preto
Vila Arnaldo Vila Bela Vista
Vila Boa Vista Vila Brazilia
Vila Costa do Sol Vila Marina
Vila Pelicano Vila Pureza
Vila Rancho Velho Vila Santo Antnio
Vila So Jos Vila Vista Alegre
Jardim Alvorada Jardim Cardinalli
Parque Santa Mnica II Vila Deriggi
Planalto Paraso Vila Faria
Jardim So Joo Batista Jardim So Paulo
Vila Alpes Vila Marcelino
Vila Marigo Vila Morumbi
Vila Redeno
Nair Cristina Margarido Brondino - 84
Tabela 4.3 - Classificao dos bairros da cidade de So Carlos pela classe de preo
C.
Chcara Bataglia Chcara Monjolinho
Chcara Paraso Chcaras de Recreio Mont Carlo
Cidade Aracy Jardim Beatriz
Jardim Botafogo Jardim Cruzeiro do Sul
Jardim das Rosas Jardim Gonzaga
Jardim Guanabara Jardim Jockey Clube
Jardim Maracan Jardim Maria Alice
Jardim Medeiros Jardim Pacaembu
Jardim Paraso Jardim Real
Jardim Santa Maria Jardim Santa Tereza
Jardim So Gabriel Jardim Tangar
Loteamento D'Aquino Ncleo Residencial Castello Branco
Parque Delta Parque Delta II
Parque Industrial Parque Sisi
Recreio So Judas Tadeu Residencial Itamaraty
Santa Felcia So Carlos II
So Carlos III So Carlos IV
Vila Carmen Vila Celina
Vila Conceio Vila Isabel
Vila Jacobucci Vila Monte Carlo
Vila Santa Madre Cabrini Vila Santa Maria
Vila Marques
Estimao do tamanho da amostra:
O primeiro passo foi definir o tamanho da amostra que iria ser retirada
de cada grupo. Uma escolha natural seria a de que o tamanho da amostra deveria ser
proporcional populao total do grupo a que ela pertencia.
Pelo critrio de amostragem sugerido por COCHRAN (1953), pode-se
dimensionar o tamanho da amostra e, conseqentemente o de cada grupo, a partir de
uma varincia desejada, V, que pode ser obtida atravs de estudos prvios ou
situaes parecidas. Esta varincia pode, ainda, ser obtida atravs de um coeficiente
de variao, estimado como sendo igual a um percentual do valor da mdia. Como
no havia, pelo menos nos ltimos anos, algum trabalho em avaliao de terrenos
atravs do qual uma estimativa para esta varincia pudesse ser obtida, foi feita uma
estimativa grosseira do valor da mdia dos terrenos para toda a populao e
atribuiu-se um desvio padro, aceitvel, que fosse igual a 20% do valor desta mdia.
Nair Cristina Margarido Brondino - 85
Em termos quantitativos, para uma mdia global igual a R$43,63, foi assumido um
desvio padro como sendo 20% deste valor, ou seja, igual a 0,20 que multiplicado
por 43,63, resultou em 8,73. Foi atravs deste desvio-padro desejado, que o
dimensionamento da amostra foi obtido. O valor estimado desta mdia global foi
obtido a partir de informaes fornecidas por algumas imobilirias, onde faixas de
valores por m
2
para terrenos situados em alguns dos bairros das categorias A, B e C
foram obtidas.
De posse do valor de V, o tamanho total da amostra, n, foi obtido
atravs da equao (51):
n
n
V
N s
h h
=
+
0
2
1
1
(51)
onde:
( )
n
N s
V
h h
0
2
=
;
s
h
2
: varincia amostral do grupo h;
N
h
: tamanho da populao do grupo h.
Sendo n
h
o tamanho da amostra que vai ser retirada do grupo h, este
nmero vai ser dado por:
n
nW s
W s
h
h h
h h
=
(52)
onde: W
N
N
h
h
=
Atravs dos registros armazenados nos fechamentos de quadra no
Setor de Cadastro da cidade fez-se a contagem de quantos terrenos sem construo
existem em So Carlos, ou seja, o nmero total de lotes, N, chegando-se a um total
de 15052. A partir da, estas propriedades foram classificadas de acordo com as
classes citadas nas Tabelas 4.1, 4.2 e 4.3, chegando-se s caractersticas de cada
estrato, conforme mostrado na Tabela 4.4. Os valores das varincias utilizadas
tambm foram calculados com base em informaes de corretores, que forneceram,
a priori, a faixa de preos por m
2
, em vrios bairros das classes A, B e C da cidade.
Nair Cristina Margarido Brondino - 86
Tabela 4.4 - Caractersticas das categorias.
GRUPO
TAMANHO
DO GRUPO
(N
h
)
VARINCIA DOS
VALORES POR
M
2
DESVIO PADRO
DOS VALORES
POR M
2
(s
h
)
W
h
= N
h
/N
A 1701 2116 46,00 0.11
B 3790 11,36 3,37 0.25
C 9561 7,10 7,10 0.64
A dimenso total da amostra foi obtida pela equao (51), utilizando-
se os valores da Tabela 4.4, chegando-se a um valor de n igual a 2641. Os tamanhos
das amostras para cada grupo foram obtidos pela equao (52) e so dados por
1301, 212 e 1128, para os estratos A, B e C, respectivamente.
Com o objetivo de verificar a adequabilidade do tamanho da amostra
proposta por COCHRAN (1953), outra estimativa foi feita com base na frmula
para dimensionamento de n, proposta por LEVY & LEMESHOW (1991).
Suponha que desejamos determinar o nmero de elementos
necessrios para ter 100 x (1 - )% de certeza de obter, da amostra aleatria
estratificada, uma mdia estimada, x que difere da verdadeira mdia
str
X em no
mais que 100 x %... A frmula para o n requerido como segue:
n
z
N
N
X
z
N
N
X
h hx
h h
L
h hx
h
L
|
\
|
.
|
|
\
|
.
|
+
|
\
|
.
|
|
\
|
.
|
1 2
2
2
2 2
2
1
2 1 2
2
2
2
2
1
/
/
(53)
onde: N: tamanho populacional
N
h
: tamanho do grupo h
z: valor tabelado da Distribuio Normal
X
2
: mdia global
hx
2
: varincia do grupo h
h
= n
h
/n
Nair Cristina Margarido Brondino - 87
Utilizando os mesmos dados do caso anterior, com =20%, o valor de
n obtido pela frmula (53) vai ser igual a 1637, ou seja, menor que o obtido
anteriormente. Os tamanhos das amostras a serem retiradas dos grupos A, B e C
ficaram com as seguintes dimenses: 809, 131 e 697, respectivamente.
Calculados os tamanhos amostrais, iniciou-se a coleta de dados. No
foi possvel, entretanto, obter o tamanho da amostra desejado a princpio pois toda a
populao de terrenos venda na cidade de So Carlos, tanto os ofertados em
imobilirias quanto em jornais, esgotou-se, totalizando 480 lotes amostrados.
Porm, isso no se torna um problema, pois, a maioria dos autores que publica
estudos sobre avaliao utiliza apenas uma amostra dentre os imveis que esto
venda. Somente para exemplificar, pode-se citar aqui os seguintes trabalhos:
GONZLEZ (1995 e 1996), GONZLEZ & FORMOSO (1994), VERTELO
(1996), TRIVELLONI et al. (1996) e BRANDO et al. (1995). O mapa para a
cidade de So Carlos, com os terrenos amostrados mostrado na Figura 4.2.
Figura 4.2- Distribuio espacial dos lotes pesquisados na cidade de So Carlos.
Nair Cristina Margarido Brondino - 88
5. RESULTADOS
Este captulo inicia com os resultados relativos ao primeiro estudo
de caso deste trabalho: Araariguama. Sero apresentados o modelo
de regresso estimado, os resultados obtidos com a aplicao das
Redes Neurais e uma comparao numrica e espacial do
desempenho dos dois mtodos. Em seguida, mostrado o estudo de
caso para a cidade de So Carlos, seguindo a mesma estrutura de
apresentao.
5.1. ESTUDO DE CASO: ARAARIGUAMA
5.1.1. MODELO DE REGRESSO PARA A CIDADE DE
ARAARIGUAMA
A escolha de um modelo adequado para a cidade de Araariguama
obedeceu a um processo de tentativa e erro, onde vrios modelos foram testados, a
fim de obter aquele que melhor se adequasse ao conjunto de dados.
Inicialmente ajustou-se um modelo do tipo linear aos dados,
considerando-se o preo por m
2
como varivel resposta. O valor 0,53 encontrado
para o coeficiente R
2
, mostrou que o modelo ajustado no era satisfatrio. Tentou-
se, ento, adicionar fatores de interao entre rea e testada, rea e menor caminho e
Nair Cristina Margarido Brondino - 89
testada e menor caminho, obtendo-se uma melhora significativa no coeficiente de
determinao, que passou de 0,53 para 0,72. Quando a interao destes trs fatores
foi acrescentada a este modelo, no entanto, este coeficiente sofreu um aumento
desprezvel, em torno de 0,01. Alm disso, tal modelo no obedeceu s suposies
de Normalidade e varincia constante do distrbio aleatrio.
A alternativa encontrada foi fazer novas tentativas, empregando-se
transformaes aos dados numricos. Para tal, foram feitos grficos de preo/m
2
versus rea, preo/m
2
versus testada e preo/m
2
versus menor caminho.
Posteriormente, foram ajustadas curvas aos pontos de cada um destes grficos, cujos
melhores resultados foram obtidos atravs das seguintes relaes:
Preo/m
2
= funo (rea
-0.5
), cujo valor para o R
2
foi aproximadamente igual
ao obtido para a relao Preo/m
2
= funo (ln (rea))
Preo/m
2
= funo (testada
-0.6
), cujo valor para o R
2
foi aproximadamente
igual ao obtido para a relao Preo/m
2
= funo (ln (testada))
Preo/m
2
= funo (mc + mc
2
)
Devido maior facilidade de anlise, a relao do tipo logartmica foi
escolhida para introduzir no modelo as variveis rea e testada. J para a varivel
mc, com o objetivo de facilitar a interpretao dos resultados, seguiu-se a sugesto
de CASSIDY (1980), que recomenda que apenas um dos termos seja adicionado ao
modelo, preferencialmente o termo quadrtico. Porm, quando o modelo geral foi
testado, este termo conduziu a um menor valor para o R
2
, com relao ao modelo
que s continha esta varivel em sua forma pura.
Os resultados obtidos para as melhores tentativas so mostrados na
Tabela 5.1, onde foram includas apenas as equaes que obtiveram um R
2
maior
que 0,30.
Nair Cristina Margarido Brondino - 90
Tabela 5.1 - Melhores modelos de regresso ajustados, considerando o preo por
m
2
para a cidade de Araariguama.
MODELO R
2
1
(Preo/m
2
) = funo (rea, testada, forma, muro,
calada, menor caminho, situao)
0,53
2
(Preo/m
2
) = funo (rea, testada, forma, muro,
calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc )
0,72
3
(Preo/m
2
) = funo (rea, testada, forma, muro,
calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc,
rea*testada*mc)
0,73
4
(Preo/m
2
) = funo ((rea)
-0.5
, testada, forma,
muro, calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc)
0,74
5
(Preo/m
2
) = funo ((rea)
-0.5
, (testada)
-0.6
, forma,
muro, calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc)
0,76
6
(Preo/m
2
) = funo ((rea)
-0.5
, (testada)
-0.6
, forma,
muro, calada, (mc)
2
, situao, rea*testada,
rea*mc, testada*mc)
0,72
7
(Preo/m
2
) = funo (mc, forma, situao, muro,
calada, (rea)
-0.5
, testada
-0.6
, (mc)
2
,
rea*testada, rea*mc, testada*mc)
0,81
8
(Preo/m
2
) = funo (mc, forma, situao, muro,
calada, ln (rea), ln (testada), rea*testada,
rea*mc, testada*mc)
0,81
Escolhida a funo a ser utilizada (nmero 8 na Tabela 5.1), uma
anlise da multicolinearidade envolvendo as variveis independentes foi executada.
O nmero de condio obtido para a matriz normalizada X'X foi igual a 46,07,
indicando a possvel existncia de dependncia linear entre duas ou mais variveis.
Para identificar as variveis envolvidas em multicolinearidade, os valores do
2
ij
R
ij
foram calculados para cada par de variveis. Os resultados obtidos so mostrados
nas Tabelas 5.2 e 5.3, respectivamente.
Nair Cristina Margarido Brondino - 91
Tabela 5.2 - Valores de
ij
obtidos para as colunas da matriz X'X para
Araariguama.
MC FORMA SITUAO MURO
LN
(REA)
CALADA
LN
(TESTADA)
MC 0,21 0,37 0,00 0,01 0,01 0,34 0,06
FORMA 0,27 0,32 0,27 0,00 0,09 0,04 0,00
SITUAO 0,03 0,03 0,61 0,15 0,13 0,04 0,00
MURO 0,00 0,01 0,00 0,39 0,49 0,01 0,12
LN (REA) 0,00 0,00 0,00 0,00 0,00 0,03 0,97
CALADA 0,00 0,02 0,02 0,20 0,19 0,53 0,02
LN (TESTADA) 0,00 0,01 0,14 0,35 0,48 0,01 0,01
Tabela 5.3 - Valores dos obtidos para cada par de variveis para a cidade de
Araariguama.
2
ij
R
MC FORMA SITUAO MURO CALCADA LN (REA) LN (TESTADA)
MC 1,00
FORMA 0,03 1,00
SITUAO 0,00 0,08 1,00
MURO 0,00 0,02 0,00 1,00
CALCADA 0,01 0,00 0,00 0,08 1,00
LN (REA) 0,07 0,07 0,00 0,01 0,01 1,00
LN
(TESTADA)
0,01 0,04 0,01 0,02 0,00 0,56 1,00
Pode-se observar pela Tabela 5.2 que as variveis ln (rea) e ln
(testada) apresentaram um valor para o
ij
maior que 0,5, o que poderia ser
indicativo de uma possvel fonte de multicolinearidade. A Tabela 5.3 revela que o
valor do para esta relao no maior que aquele obtido para o R
2
ij
R
2
geral. Porm,
segundo GREENE (1997), a regra utilizada para comparar os R com o R
2
ij
2
geral
apenas sugestiva e "...no d indicao de como proceder". Desta forma, optou-se
por utilizar os valores da Tabela 5.2 para a tomada de deciso. Para resolver este
problema, duas eram as possveis solues. A primeira seria a execuo de uma
regresso do tipo Ridge, o que geraria estimadores viciados e um conseqente
comprometimento do resultado dos testes de hipteses. A outra alternativa seria a
retirada de uma destas duas variveis do modelo, assim como dos fatores de
interao envolvendo-as, o que poderia conduzir perda de informao. Optou-se,
ento, por elaborar as duas tentativas, verificar os resultados e, a partir da, tomar a
deciso sobre a escolha do modelo.
Nair Cristina Margarido Brondino - 92
Para a regresso Ridge iniciou-se com um valor de r igual a 0,01, que
foi sendo acrescido em 0,01 at que parmetros estveis fossem obtidos. A
estabilidade no valor dos parmetros foi obtida com r=0,04. O modelo final
apresentou um R
2
igual a 0,70 e os parmetros estimados so apresentados na
Tabela 5.4.
Tabela 5.4 - Modelo de Regresso Ridge obtido para Araariguama utilizando o
valor do m
2
como varivel dependente.
PARMETRO
ESTIMADO
DESVIO
PADRO
ESTATSTICA
t
p-level
CONSTANTE 144,49 13,1578 10,98132 7,93E-21
MC -12,5288 1,832527 -6,83692 2,05E-10
FORMA -5,88981 1,566124 -3,76075 0,000245
SITUAO 2,74178 2,122308 1,291886 0,198438
MURO -2,4022 2,983959 -0,80504 0,422107
LN (REA) -11,3232 2,155853 -5,25229 5,21E-07
AR*MC 0,002285 0,000449 5,084042 1,12E-06
CALADA 11,2199 9,237964 1,214543 0,226501
TEST*MC 0,149612 0,047678 3,137973 0,002058
LN (TEST) -11,858 3,476079 -3,41133 0,000836
AREA*TES -2,1E-05 1,08E-05 -1,95433 0,052573
A tomada de deciso sobre qual das duas variveis retirar do modelo
foi baseada no valor do R
2
. Na primeira regresso, cujo coeficiente de determinao
obtido foi igual a 0,67, tanto a varivel ln (rea) quanto os fatores de interao
envolvendo-a foram retirados. A segunda tentativa constou em retirar a varivel ln
(testada), assim como seus fatores de interao. Nesta nova situao, cujos
parmetros podem ser vistos na Tabela 5.5, o R
2
obtido foi igual a 0,72, da sua
escolha.
Nair Cristina Margarido Brondino - 93
Tabela 5.5 - Modelo de Regresso obtido para Araariguama utilizando o valor do
m
2
como varivel dependente aps a retirada da varivel ln (testada).
PARMETRO
ESTIMADO
DESVIO-
PADRO
ESTATSTICA t p-level
CONSTANTE 146,4912 13,62418 10,75229 2,56E-20
MC -10,0447 1,873369 -5,36181 3,08E-07
FORMA -6,49788 1,545863 -4,2034 4,51E-05
SITUAO 2,753884 2,055459 1,33979 0,182353
MURO -5,13412 2,9238 -1,75597 0,081148
LN (REA) -16,7819 2,436357 -6,88809 1,48E-10
REA * MC 0,002686 0,000387 6,938565 1,13E-10
CALADA 15,77541 9,091707 1,735143 0,084783
Uma comparao entre as Tabelas 5.4 e 5.5 mostra que os parmetros
obtidos para as variveis muro, ln (rea) e calada sofreram as maiores alteraes
relativas. Pode-se verificar tambm que tanto o parmetro estimado para a varivel
muro quanto para as variveis calada e situao no so significativos e, portanto,
as alteraes observadas no so um problema maior. Por outro lado, o aumento no
coeficiente da varivel ln (rea) pode ter decorrido da retirada do ln (testada) do
modelo.
Alm do valor dos parmetros, uma comparao entre as somas dos
Quadrados dos Resduos (SSE) para os dois casos foi feita com o objetivo de
verificar qual das duas situaes gerou menor erro de estimao. Para a regresso
Ridge, a SSE obtida foi igual a 11560,98 contra um valor igual a 10984,75 para a
outra alternativa.
Diante dos resultados obtidos, optou-se pelo modelo mostrado na
Tabela 5.5, uma vez que, alm de no ter sido notada nenhuma mudana
significativa com relao ao outro modelo, pode-se fazer inferncias mais seguras
com relao aos parmetros estimados.
Como os testes com relao aos parmetros s so eficientes se o
distrbio aleatrio possuir Distribuio Normal e varincia constante, estas
suposies deveriam ser verificadas a princpio. Assim, com o objetivo de verificar
a suposio de Distribuio Normal, foi elaborado um teste do tipo Qui-quadrado
para verificar a distribuio do resduo da regresso. A estatstica de teste obtida foi
Nair Cristina Margarido Brondino - 94
igual a 11,02, cujo valor foi comparado ao tabelado a um nvel de significncia de
5%, donde a suposio de distribuio Normal no foi rejeitada.
Para analisar a suposio de heterocedasticidade foi elaborado, a
princpio, o Teste Geral de White. A estatstica de teste obtida, com valor igual a
2,59 10
-14
, foi comparada com o valor tabelado da Distribuio Qui-quadrado para
um valor crtico igual a 95% e 7 graus de liberdade (14,07). Como o valor calculado
menor que o tabelado, a hiptese de homocedasticidade no foi rejeitada.
Outro teste elaborado foi o Teste de Goldfeld-Quandt. Para tal, a
amostra foi ordenada de acordo com o valor da varivel mc e dividida em trs
grupos, o primeiro e o ltimo com 55 pontos e o intermedirio com 37 pontos. A
hiptese de que a varincia no primeiro grupo seria maior que a do ltimo foi
rejeitada a um nvel de significncia igual a 5% (estatstica de teste obtida foi igual
a 0,337 - cujo valor foi comparado ao valor tabelado da Distribuio F para um
valor crtico igual a 95% com n
1
=47 e n
2
=47 graus de liberdade). Portanto, por este
teste, a hiptese de homocedasticidade tambm no foi rejeitada.
Obedecidas as suposies de homocedasticidade e Distribuio
Normal, pde-se, ento, fazer inferncias sobre os parmetros do modelo. Os dados
da Tabela 5.5 revelam que, alm do termo constante, os parmetros obtidos para as
variveis mc, forma, ln (rea) e para a interao entre a rea e a distncia so
significativos. Desta forma, pode-se notar que a forma irregular causa decrscimo
no valor do m
2
. Por sua vez, a rea e a distncia ao centro no podem ser tratadas de
forma individual. Assim, pode-se verificar que o efeito marginal (proporcional a
0,0027rea) da varivel distncia ao centro sobre o preo do m
2
sofre um ligeiro
aumento quando a rea aumenta, ou seja, reas grandes e localizadas longe da
regio central tm seu preo aumentado. Por sua vez, o efeito marginal da varivel
rea sobre o valor estimado no to fcil de ser medido, uma vez que este vai ser
proporcional a [(1/rea)+0,0027mc].
Nair Cristina Margarido Brondino - 95
5.1.2. REDES NEURAIS PARA A CIDADE DE
ARAARIGUAMA
Inicialmente, o conjunto de dados foi subdividido, de forma aleatria,
em trs subconjuntos: o primeiro para treinamento da rede, o segundo para
validao e o terceiro para teste, num total de 77, 40 e 40 lotes, respectivamente.
Esta subdiviso foi executada trs vezes, gerando trs conjuntos diferentes de dados.
O tipo de topologia empregada foi a MLP (Multlayer Perceptron) com
uma camada escondida e o algoritmo de aprendizado escolhido foi
backpropagation, com atualizao dos pesos por padro.
Inicialmente, os dados no sofreram nenhum tipo de pr-
processamento e foram montadas diversas redes, variando a taxa de aprendizado, o
momentum e o nmero de ns na camada intermediria. Como os resultados obtidos
no se mostraram satisfatrios, optou-se por normalizar os dados entre 0 e 1 e,
posteriormente, entre 0,1 e 0,9, variando-se tambm a taxa de aprendizado e o
momentum para estes dados. Os resultados das melhores tentativas, com a incluso
de todas as variveis, so mostrados na Tabela 5.6.
Para cada um dos trs conjuntos de treinamento, foram calculados os
somatrios dos erros de previso de preos, cujos valores foram obtidos atravs da
equao (35) e que tambm so mostrados na Tabela 5.6. A ltima coluna da tabela
refere-se mdia dos somatrios dos erros obtidos.
Nair Cristina Margarido Brondino - 96
Tabela 5.6 - Resultados das melhores simulaes, usando todas as variveis para a
cidade de Araariguama.
taxa Momentum Mdia dos
MODELO
n
o
neurnios na
camada intermediria aprendizado erros
1 Dados brutos 3 0,3 0,3 28,84
2 Dados brutos 7 0,5 0,8 28,79
3 Dados brutos 4 0,5 0,8 31,99
4 dados brutos 7 0,3 0,8 30,65
5 dados brutos 7 0,2 0,8 30,02
6 dados brutos 7 0,4 0,4 27,48
7 dados brutos 7 0,3 0,3 29,48
8 norm. 0 -1 7 0,4 0,3 29,29
9 norm. 0 -1 7 0,5 0,8 31,08
10 norm 0,1- 0,9 4 0,3 0,4 33,22
11 norm 0,1- 0,9 7 0,3 0,4 17,47
12 norm 0,1- 0,9 4 0,3 0,4 16,91
13 norm 0,1- 0,9 4 e 3 (2 cam. int.) 0,3 0,4 16,00
14 norm 0,1- 0,9 3 e 2 (2 cam. int.) 0,3 0,4 16,37
Pode-se verificar pelos valores acima que, com os dados normalizados
entre 0,1 e 0,9, a rede apresentou erro menor. Observa-se, tambm, que os melhores
valores para a taxa de aprendizado e o momentum ficam na escala 0,3 a 0,4.
Devido ao fato de que o mtodo de salincia de variveis proposto por
Garson somente pode ser empregado em redes com apenas uma camada
intermediria, a configurao nmero 12 foi escolhida para o seu emprego, embora
as redes 13 e 14 tenham apresentado erro ligeiramente menor. A Tabela 5.7
apresenta a salincia calculada para cada varivel em cada um dos trs conjuntos
distintos de dados.
Tabela 5.7 - Relevncia de cada varivel para a cidade de Araariguama.
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV.(%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
MC 34 MC 59 MC 41
REA 18 REA 10 REA 18
TESTADA 18 SITUAO 9 TESTADA 13
CALADA 16 TESTADA 7 SITUAO 7,5
FORMA 5 FORMA 6 FORMA 6
MURO 5 MURO 5 MURO 6
SITUAO 5 CALADA 4 CALADA 6
Nair Cristina Margarido Brondino - 97
Embora a cidade em questo seja de pequeno porte, os dados da
Tabela 5.7 revelam que a varivel menor caminho exerce a maior influncia sobre o
valor estimado para os trs conjuntos de dados, seguida pela varivel rea. Ao
contrrio do modelo de regresso, a varivel testada aparece em terceiro lugar em
dois dos conjuntos. Pode-se notar tambm que as variveis forma e muro exercem
pouca influncia sobre os valores estimados. Conforme proposto na Metodologia
apresentada aqui, as variveis cuja influncia fosse menor que 5% deveriam ser
retiradas do conjunto de dados e haveria, ento, um novo treinamento da rede.
Portanto, diante dos valores observados na Tabela 5.7, optou-se, ento, por retirar
somente a varivel muro, embora esta tenha mostrado salincia superior a este valor
para o ltimo conjunto de dados. A mesma configurao de rede foi ento treinada
para esta nova situao e a mdia dos erros obtida baixou para 16,54.
5.1.3. COMPARAO DOS RESULTADOS OBTIDOS
PELOS DOIS MTODOS PARA A CIDADE DE
ARAARIGUAMA
Os mesmos conjuntos de dados utilizados para a parte de teste das
Redes Neurais foram utilizados para estimar os erros obtidos pelo modelo de
regresso. Alm destes erros, o R
2
tambm foi calculado para os dois modelos.
Estes resultados so mostrados na Tabela 5.8.
Tabela 5.8 - Erros e R
2
obtidos para os dois modelos e os trs conjuntos de dados
para Araariguama.
REGRESSO RN
ERRO R
2
ERRO R
2
conjunto 1 29,49 0,23 18,77 0,23
conjunto 2 18,99 0,55 12,88 0,45
conjunto 3 22,61 0,62 17,98 0,79
MDIA 23,70 - 16,54 -
Os resultados mostrados na Tabela 5.8 indicam que o erro relativo
total obtido pelo modelo de regresso ficou em torno de 43% maior que aquele
fornecido pelas Redes Neurais. Quanto ao valor do R
2
, no se pode concluir muita
Nair Cristina Margarido Brondino - 98
coisa, uma vez que os valores obtidos oscilaram muito de um conjunto de dados
para outro.
Ainda com o objetivo de comparar os erros relativos obtidos atravs
da equao (48) para os dois mtodos, foram feitos os grficos mostrados nas
Figuras 5.1, 5.2 e 5.3 mostrando estes valores para ambos os mtodos e os
conjuntos de dados 1, 2 e 3, respectivamente.
GRUPO 1
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (ANN) ERRO (REG)
Figura 5.1 - Erros relativos obtidos para os dois mtodos e o primeiro conjunto de
dados para a cidade de Araariguama.
GRUPO 2
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (ANN) ERRO (REG)
Figura 5.2 - Erros relativos obtidos para os dois mtodos e o segundo conjunto de
dados para a cidade de Araariguama.
Nair Cristina Margarido Brondino - 99
GRUPO 3
0
1
2
3
4
147
1
0
1
3
1
6
1
9
2
2
2
5
2
8
3
1
3
4
3
7
4
0
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (ANN) ERRO (REG)
Figura 5.3 - Erros relativos obtidos para os dois mtodos e o terceiro conjunto de
dados para a cidade de Araariguama.
Os grficos mostrados nas Figuras 5.1, 5.2 e 5.3 indicam que, quando
observados ponto a ponto, os resultados obtidos com as Redes Neurais
apresentaram, em geral, erro relativo menor. Pode-se notar que para o primeiro e o
segundo conjuntos, a maioria dos valores fornecidos por este mtodo situou-se em
torno de 0,5, podendo-se notar a existncia de apenas um ponto discrepante para o
primeiro conjunto. Para o terceiro grupo de dados, a situao um pouco diferente,
pois pode-se notar que os erros obtidos so um pouco maiores do que os observados
anteriormente.
Num prximo passo, erros encontrados para o modelo de regresso
para cada um dos trs conjuntos foram agrupados em cinco clusters atravs da
utilizao do pelo mtodo denominado K-means clustering. Os mesmos extremos
foram, ento, utilizados para agrupar os erros fornecidos pelas Redes Neurais. A
proporo de pontos em cada categoria foi identificada (Tabela 5.9) e utilizada para
a comparao dos resultados.
Nair Cristina Margarido Brondino - 100
Tabela 5.9 - Proporo de erros relativos nos clusters encontrados com os dois
modelos para os trs conjuntos de dados para Araariguama.
Conjunto/Cluster Limites de
classe
REGRESSO RN
Conjunto 1 - Cluster1 <= 0,209 19,0% 25,5%
Conjunto 1 - Cluster 2 0,209 a 0,602 32,5% 66,0%
Conjunto 1 - Cluster 3 0,603 a 0,890 30,0% 6,5%
Conjunto 1 - Cluster 4 0,891 a 1,302 8,5% 0,0%
Conjunto 1 - Cluster 5 >= 1,303 10,5% 2,0%
Conjunto 2 - Cluster 1 <= 0,160 21,5% 32,0%
Conjunto 2 - Cluster 2 0,161 a 0,348 24,0% 16,0%
Conjunto 2 - Cluster 3 0,349 a 0,602 27,0% 35,0%
Conjunto 2 - Cluster 4 0,603 a 0,890 16,0% 16,0%
Conjunto 2 - Cluster 5 >= 0,891 11,0% 0,0%
Conjunto 3 - Cluster 1 <= 0,224 25,0% 25,0%
Conjunto 3 - Cluster 2 0,225 a 0,359 15,0% 17,5%
Conjunto 3 - Cluster 3 0,360 a 0,719 27,5% 40,0%
Conjunto 3 - Cluster 4 0,720 a 1,302 20,0% 12,5%
Conjunto 3 - Cluster 5 >= 1,303 12,5% 2,5%
Os resultados mostrados na Tabela 5.9 indicam que para os trs
conjuntos de dados, a concentrao de pontos localizados nos intervalos que
apresentam erros menores (clusters 1, 2 e 3) aumentou quando as RN foram
utilizadas. Disso, pode-se concluir que, de maneira geral, o erro de estimao
diminuiu quando esta tcnica foi utilizada. Outra informao importante que pode
ser retirada da mesma tabela a diferena entre a concentrao de pontos no cluster
5 para os dois mtodos. Enquanto para a regresso este valor foi sempre superior a
10%, para as RN ele nunca superou os 2,5%.
Identificadas as propores de pontos em cada cluster, partiu-se para a
representao espacial dos resultados, atravs da construo de mapas temticos. As
Figuras 5.4, 5.5, 5.6, 5.7, 5.8 e 5.9 mostram como os erros de estimao esto
distribudos espacialmente para ambos os mtodos e os trs conjuntos de dados.
Nair Cristina Margarido Brondino - 101
Figura 5.4 Distribuio espacial dos erros para o modelo de regresso e o
primeiro grupo de dados de Araariguama.
Figura 5.5 Distribuio espacial dos erros para as RN e o primeiro grupo de
dados de Araariguama.
Nair Cristina Margarido Brondino - 102
Figura 5.6 Distribuio espacial dos erros para o modelo de regresso e o
segundo grupo de dados de Araariguama.
Figura 5.7 Distribuio espacial dos erros para as RN e o segundo grupo de
dados de Araariguama.
Nair Cristina Margarido Brondino - 103
Figura 5.8 Distribuio espacial dos erros para o modelo de regresso e o terceiro
grupo de dados de Araariguama.
Figura 5.9 Distribuio espacial dos erros para as RN e o terceiro grupo de dados
de Araariguama.
A Figura 5.4 revela que a maioria dos pontos cujo erro de estimao
maior se concentra no bairro localizado abaixo da estrada. Neste mesmo bairro
tambm se localiza o nico ponto do cluster 5 para as RN (Figura 5.5). Para os
mapas mostrados nas Figuras 5.6 e 5.7, pode-se observar uma maior concentrao
Nair Cristina Margarido Brondino - 104
de valores grandes de erro no bairro localizado no lado superior esquerdo para
ambos os modelos. Para o terceiro conjunto de dados e o modelo de regresso
(Figura 5.8), no entanto, observa-se valores maiores de erros espalhados pelos dois
bairros. J para as RN, o nico ponto pertencente ao cluster 5 tambm se localiza no
bairro situado abaixo da estrada. Diante do que foi observado, pode-se dizer que a
distribuio espacial dos erros no apresenta um padro de localizao especfico
para a Regresso. Por outro lado, observa-se que os maiores erros fornecidos pelas
RN se localizam num bairro especfico para dois dos conjuntos de dados (1 e 3).
5.2. ESTUDO DE CASO: SO CARLOS
5.2.1. MODELO DE REGRESSO PARA A CIDADE DE
SO CARLOS
A metodologia para obteno do Modelo de Regresso de So Carlos
foi a mesma utilizada no Modelo de Regresso de Araariguama. A nica diferena
est no maior nmero de variveis qualitativas e maior nmero de registros.
Inicialmente, optou-se por trabalhar com o preo por m
2
como
varivel resposta. O primeiro modelo ajustado foi o linear, onde foram includas
todas as variveis independentes, mas sem considerar os fatores de interao. O
valor de R
2
obtido foi 0,34.
Ao fazer uma transformao logartmica na varivel dependente, o R
2
elevou-se para 0,51. A partir da, outras tentativas de transformaes tanto na
varivel dependente quanto nas independentes tambm no conduziram a grandes
melhoras (ver Tabela 5.10).
Diante destes valores, optou-se por fazer grficos de (preo/m
2
) versus
rea, (preo/m
2
) versus testada e (preo/m
2
) versus menor caminho, a fim de
verificar possveis relaes atravs de regresses simples. As melhores relaes
obtidas para as variveis duas a duas so mostradas a seguir:
Nair Cristina Margarido Brondino - 105
Preo/m
2
= funo (rea
0.50
)
Preo/m
2
= funo (testada
0.50
) e Preo/m
2
= funo (e
testada*0,02
) que
apresentaram aproximadamente o mesmo R
2
.
Preo/m
2
= funo (e
-0.2*mc
) e Preo/m
2
= funo (mc
-0,2
) que apresentaram
aproximadamente o mesmo R
2
.
A incluso destas transformaes ao modelo tambm no trouxe
melhoras substanciais em termos de R
2
, cujo valor passou para 0,43. Outras
transformaes nas variveis independentes e tambm na dependente foram feitas,
no conduzindo a nenhuma melhora significativa, em termos de coeficiente de
determinao, como pode ser observado na Tabela 5.10 (na qual s so
apresentados os modelos que forneceram R
2
maior que 0,30). A incluso da
categoria a que pertence o lote no modelo, contudo, gerou uma melhora substancial.
Para a incluso desta varivel, adicionou-se ao modelo duas variveis binrias:
TERR_B (assumindo valor 1 para terrenos da categoria B e 0, caso contrrio) e
TERR_C (assumindo valor 1 para terrenos da categoria C e 0, caso contrrio). Desta
forma, terrenos pertencentes categoria A possuram valor (0,0) para as variveis
TERR_B e TERR_C. O novo modelo, que incluiu somente as variveis em sua
forma pura e sem transformao na varivel dependente conduziu a um R
2
igual a
0,57. O modelo que incluiu uma transformao do tipo logartmica na varivel
dependente gerou um coeficiente de determinao igual a 0,73 e, portanto, foi o
escolhido para a anlise.
De maneira similar escolha do modelo para Araariguama, uma
anlise da multicolinearidade envolvendo as variveis independentes foi executada
aps a escolha do modelo. O nmero de condio obtido para a matriz normalizada
X'X foi igual a 158,02, indicando a possvel existncia de dependncia linear entre
duas ou mais variveis. Novamente, para identificar as variveis envolvidas em
multicolinearidade, os valores do
ij
e do R foram calculados para cada par de
variveis. Os resultados obtidos so mostrados nas Tabelas 5.11 e 5.12,
respectivamente.
2
ij
Nair Cristina Margarido Brondino - 106
A Tabela 5.11 indica valores maiores que 0,5 para as seguintes
relaes: rea e testada, testada e categoria, calada e categoria, asfalto e testada,
edificao e asfalto e gua e luz. Pelos valores observados na Tabela 5.12 verifica-
se que as relaes rea e testada e gua e luz apresentam coeficientes de
determinao maiores que o obtido para o modelo geral (0,73) e iguais a 0,87 e
0,80, respectivamente, indicando possveis fontes de multicolinearidade.
Novamente, duas eram as possveis solues: uma regresso do tipo Ridge ou a
retirada de algumas variveis e nova estimao do modelo. Da mesma forma que
para Araariguama, as duas tentativas foram analisadas.
Para a regresso do tipo Ridge, iniciou-se com um valor igual a 0,01
para r, que sendo foi acrescido em 0,01 at que os parmetros atingissem a
estabilidade. O modelo obtido, com r=0,01 e R
2
igual a 0,72 praticamente no difere
daquele em que o tipo de modelagem convencional foi utilizado e mostrado na
Tabela 5.13.
Pelos mesmos motivos mencionados no estudo de caso para
Araariguama, optou-se por utilizar os valores dos
ij
para a retirada de variveis
envolvidas em multicolinearidade. Desta forma, optou-se por retirar a varivel
testada, uma vez que esta aparecia em trs relaes cujo valor para o
ij
era maior
que 0,5, mantendo-se, ento as variveis categoria, rea e asfalto. Outra relao que
poderia ser considerada como possvel fonte de multicolinearidade envolvia as
variveis calada e categoria. Assim, optou-se por retirar a varivel calada, uma
vez que a categoria havia sido mantida no modelo. O mesmo motivo conduziu
retirada da varivel edificao em lugar da varivel asfalto. O critrio para a retirada
das variveis gua ou luz obedeceu ao mesmo princpio utilizado para
Araariguama, ou seja, o valor do R
2
. Como este no sofreu alterao alguma,
optou-se, ento, por retirar a varivel gua. O modelo obtido mostrado na Tabela
5.14.
Nair Cristina Margarido Brondino - 107
Tabela 5.10 - Melhores modelos de regresso ajustados, considerando o preo/m
2
para So Carlos.
MODELO R
2
1
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua)
0,34
2
(Preo/m
2
) = funo (rea
0.5
, e
testada*0.02
, forma, muro, calada,
e
-mc*0.2
, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua)
0,38
3
(Preo/m
2
) = funo (rea
0.5
, e
testada*0.02
, forma, muro, calada,
e
-mc*0.2
, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc)
0,38
4
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc)
0,34
5
(Preo/m
2
) = funo (rea
0.5
, testada
0.5
, forma, muro, calada,
mc
-0.2
, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc)
0,31
6
(Preo/m
2
) = funo (1/rea, 1/testada, forma, muro, calada,
1/mc, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua)
0,31
7
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc,
rea*testada*mc)
0,37
8
Ln (Preo/m
2
) = funo (rea, testada, forma, muro, calada,
menor caminho, situao, topologia, asfalto, existncia de
edificaes na quadra, esgoto, luz, gua, rea*testada, rea*mc,
testada*mc)
0,51
9
Ln (Preo/m
2
) = funo (1/rea, 1/testada, forma, muro, calada,
1/mc, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*test, rea*mc, testada*mc)
0,38
10
Ln (Preo/m
2
) = funo (1/rea, 1/testada, forma, muro, calada,
1/mc, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*test, rea*mc, testada*mc,
rea*testada*mc)
0,51
11
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, categoria)
0,53
12
Ln (Preo/m
2
) = funo (rea, testada, forma, muro, calada,
menor caminho, situao, topologia, asfalto, existncia de
edificaes na quadra, esgoto, luz, gua, categoria)
0,73
Nair Cristina Margarido Brondino - 108
T
O
P
.
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
1
0
,
0
3
0
,
0
1
0
,
0
3
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
R
E
A
0
,
2
1
0
,
6
6
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
1
0
,
0
7
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
M
C
0
,
0
3
0
,
1
0
0
,
3
3
0
,
2
8
0
,
0
4
0
,
0
5
0
,
0
1
0
,
1
1
0
,
0
0
0
,
0
1
0
,
0
3
0
,
0
0
0
,
0
1
0
,
0
1
T
E
S
T
.
0
,
0
8
0
,
8
1
0
,
0
4
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
2
0
,
0
2
0
,
0
2
0
,
0
0
0
,
0
1
0
,
0
0
F
O
R
M
A
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
1
0
,
0
3
0
,
2
2
0
,
6
2
0
,
0
2
0
,
0
4
0
,
0
6
0
,
0
0
S
I
T
.
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
3
0
,
0
0
0
,
0
3
0
,
4
4
0
,
3
9
0
,
0
6
0
,
0
3
0
,
0
0
0
,
0
3
0
,
0
0
C
A
T
.
0
,
0
0
0
,
0
0
0
,
0
1
0
,
5
7
0
,
0
2
0
,
1
0
0
,
0
0
0
,
1
0
0
,
0
8
0
,
1
0
0
,
0
1
0
,
0
0
0
,
0
1
0
,
0
0
M
U
R
O
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
4
0
,
2
1
0
,
3
9
0
,
2
4
0
,
1
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
0
C
A
L
.
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
1
0
,
2
2
0
,
0
1
0
,
6
8
0
,
0
3
0
,
0
2
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
A
S
F
.
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
4
0
,
0
4
0
,
0
3
0
,
2
1
0
,
0
7
0
,
5
8
0
,
0
3
0
,
0
0
0
,
0
0
E
D
I
F
.
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
2
0
,
0
2
0
,
0
1
0
,
0
0
0
,
0
3
0
,
6
9
0
,
2
3
0
,
0
0
0
,
0
0
E
S
G
.
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
3
0
,
0
2
0
,
9
3
0
,
0
0
0
,
0
0
L
U
Z
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
1
0
,
0
7
0
,
9
2
G
U
A
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
2
0
,
9
8
T
O
P
O
G
.
R
E
A
M
C
T
E
S
T
A
D
A
F
O
R
M
A
S
I
T
.
C
A
T
E
G
.
M
U
R
O
C
A
L
.
A
S
F
.
E
D
I
F
.
E
S
G
.
L
U
Z
G
U
A
T
a
b
e
l
a
5
.
1
1
-
V
a
l
o
r
e
s
d
e
i
j
o
b
t
i
d
o
s
p
a
r
a
a
s
c
o
l
u
n
a
s
d
a
m
a
t
r
i
z
X
'
X
p
a
r
a
S
o
C
a
r
l
o
s
.
Nair Cristina Margarido Brondino - 109
T
O
P
O
G
1
,
0
0
R
E
A
0
,
0
0
1
,
0
0
M
C
0
,
0
3
0
,
0
7
1
,
0
0
F
O
R
M
A
0
,
0
1
0
,
1
3
0
,
0
0
1
,
0
0
S
I
T
.
0
,
0
0
0
,
0
4
0
,
0
0
0
,
1
2
1
,
0
0
C
A
T
.
0
,
0
0
0
,
0
7
0
,
4
5
0
,
0
0
0
,
0
0
1
,
0
0
M
U
R
O
0
,
0
0
0
,
0
0
0
,
0
3
0
,
0
0
0
,
0
0
0
,
0
2
1
,
0
0
C
A
L
.
0
,
0
3
0
,
0
1
0
,
0
9
0
,
0
0
0
,
0
0
0
,
0
6
0
,
1
1
1
,
0
0
A
S
F
.
0
,
0
1
0
,
0
1
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
3
0
,
0
3
0
,
0
3
1
,
0
0
E
D
I
F
0
,
0
1
0
,
0
1
0
,
0
1
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
3
0
,
0
3
0
,
3
6
1
,
0
0
E
S
G
.
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
2
0
,
0
1
0
,
2
9
0
,
3
3
1
,
0
0
L
U
Z
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
3
0
,
0
4
0
,
0
9
1
,
0
0
G
U
A
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
0
0
,
0
4
0
,
0
5
0
,
1
1
0
,
8
0
1
,
0
0
T
E
S
T
A
D
A
0
,
0
0
0
,
8
7
0
,
0
3
0
,
0
9
0
,
0
4
0
,
0
5
0
,
0
0
0
,
0
1
0
,
0
1
0
,
0
1
0
,
0
0
0
,
0
0
0
,
0
0
1
,
0
0
T
O
P
O
G
.
R
E
A
M
C
F
O
R
M
A
S
I
T
.
C
A
T
.
M
U
R
O
C
A
L
.
A
S
F
.
E
D
I
F
.
E
S
G
.
L
U
Z
G
U
A
T
E
S
T
A
D
A
T
a
b
e
l
a
5
.
1
2
-
V
a
l
o
r
e
s
d
o
s
R
i
j
2
o
b
t
i
d
o
s
p
a
r
a
c
a
d
a
p
a
r
d
e
v
a
r
i
v
e
i
s
p
a
r
a
a
c
i
d
a
d
e
d
e
S
o
C
a
r
l
o
s
.
Nair Cristina Margarido Brondino - 110
Tabela 5.13 - Modelo de Regresso Ridge obtido para So Carlos utilizando o
valor do m
2
como varivel dependente.
PARMETRO
ESTIMADO
DESVIO-
PADRO
ESTATSTICA t p-level
CONSTANTE 4,312927 0,15962 27,01994 0
TOPOGRAFIA 0,052628 0,032766 1,606169 0,108917
AREA -6,8E-05 0,000134 -0,50649 0,612753
MC -0,07765 0,010264 -7,5657 2,09E-13
TESTADA 0,006377 0,00519 1,228618 0,219838
FORMA 0,029272 0,058809 0,497743 0,618901
SITUAO -0,07487 0,042791 -1,74964 0,080842
TERR_B -0.43542 0.034308 -12.6913 7,01E-32
TERR_C -0,80181 0,044431 -18,0461 0
MURO -0,04215 0,029719 -1,41819 0,156807
CALADA 0,008085 0,031415 0,257368 0,797008
ASFALTO -0,0169 0,05512 -0,30654 0,759332
EDIFICAO -0,01243 0,064541 -0,19259 0,847367
ESGOTO 0,117046 0,083914 1,394834 0,163733
LUZ 0,042453 0,262258 0,161876 0,871474
GUA 0,037644 0,297839 0,126391 0,899477
Tabela 5.14 - Modelo de Regresso obtido para So Carlos utilizando o valor do
m
2
como varivel dependente aps a retirada das variveis testada,
calada, edificao e gua.
PARMETRO
ESTIMADO
DESVIO-
PADRO
ESTATSTICA t p-level
CONSTANTE 4,277913 0,146914 32,52175 0
TOPOGRAFIA 0,051465 0,03197 1,60977 0,108122
REA 8,32E-05 5,29E-05 1,571414 0,116762
MC -0,07623 0,009909 -7,69263 8,6E-14
FORMA 0,040086 0,057437 0,697917 0,485576
SITUAO -0,08141 0,042281 -1,92556 0,054765
TERR_B -0.43542 0.034308 -12.6913 7,01E-32
TERR_C -0,80181 0,044431 -18,0461 0
MURO -0,04342 0,028126 -1,54361 0,123358
ASFALTO -0,02148 0,050163 -0,42826 0,668662
ESGOTO 0,116266 0,077692 1,496499 0,135198
LUZ 0,061065 0,126934 0,48108 0,630684
Uma comparao entre as Tabelas 5.13 e 5.14 revela que no existe
grande diferena entre o modelo estimado atravs de regresso Ridge e aquele
encontrado aps a retirada de algumas variveis. Alm do valor dos parmetros,
Nair Cristina Margarido Brondino - 111
uma comparao entre as somas dos Quadrados dos Resduos (SSE) para os dois
casos tambm foi feita. Para a regresso Ridge, a SSE obtida foi igual a 34,138
contra um valor igual a 33,659 para a outra alternativa. Desta forma, mais uma vez,
devido maior confiabilidade com relao aos testes de hipteses, optou-se por
utilizar o modelo apresentado na Tabela 5.14.
Antes dos testes t, porm, as suposies sobre a distribuio e
varincia do distrbio aleatrio deviam ser verificadas. Os testes utilizados para
verificao destas suposies foram os mesmos do caso anterior, ou seja, Qui-
Quadrado para verificar Normalidade e Teste Geral de White e Teste de Goldfeld-
Quandt para homocedasticidade.
A estatstica obtida para o teste de Normalidade foi igual a 65,89, cujo
valor foi comparado ao tabelado da Distribuio Qui-Quadrado para um valor
crtico de 95%, donde a suposio de distribuio Normal no foi rejeitada.
Para analisar a suposio de heterocedasticidade foi elaborado, a
princpio, o Teste Geral de White. A estatstica de teste obtida , com valor igual a
4,35, foi comparada com o valor tabelado da Distribuio Qui-quadrado para um
valor crtico igual a 95% e 10 graus de liberdade (18,31). Como o valor calculado
ficou menor que o tabelado, a hiptese de homocedasticidade no foi rejeitada.
Para o Teste de Goldfeld-Quandt, a amostra foi ordenada de acordo
com o valor da varivel rea e dividida em trs grupos, o primeiro e o ltimo com
168 pontos e o intermedirio com 144 pontos. A hiptese de que a varincia no
primeiro grupo seria maior que a do ltimo foi rejeitada a um nvel de significncia
igual a 5% (estatstica de teste obtida foi igual a 0,324 - cujo valor foi comparado ao
valor tabelado da Distribuio F para um valor crtico igual a 95% com 158 e 158
graus de liberdade). Portanto, por este teste, a hiptese de homocedasticidade
tambm no foi rejeitada.
Obedecidas as suposies de Normalidade e varincia constante, os
testes t com relao aos parmetros do modelo puderam, ento, ser executados. Os
valores mostrados na Tabela 5.14 indicam que os nicos parmetros significativos
so os estimados para as variveis mc e categoria. O sinal negativo observado para
o coeficiente da varivel mc indica que um aumento na distncia ao centro provoca
Nair Cristina Margarido Brondino - 112
uma diminuio no preo. Atravs dos resultados, pode-se notar tambm que os
logaritmos dos preos por m
2
de lotes situados nas categorias B e C so diminudos
de 0,435 e 0,870, respectivamente, com relao queles situados na categoria A.
5.2.2. APLICAO DAS REDES NEURAIS ARTIFICIAIS
PARA SO CARLOS
Da mesma forma que para o estudo de caso anterior, para o emprego
das RN, a princpio, o conjunto de dados foi dividido de forma aleatria em trs
subconjuntos distintos: treinamento (50% dos casos), validao (25% dos casos) e
teste (25% dos casos). Este procedimento foi ento repetido trs vezes, o que gerou
trs diferentes conjuntos de dados. Redes com vrios tipos de configuraes foram
ento simuladas e o erro relativo total fornecido por cada uma destas, calculado. A
taxa de aprendizado, o momentum e o erro admitido para a fase de treinamento
tambm foram variados. Inicialmente, 13 variveis (rea, testada, esquina, muro,
calada, existncia de edificaes na quadra, distncia ao centro, topografia, gua,
luz, esgoto, asfalto e forma) foram utilizadas. Como os resultados no foram
favorveis, uma dcima quarta varivel, indicando a categoria em que o terreno se
enquadra (A, B ou C), de acordo com as categorias de amostragem, foi adicionada.
Os resultados da Tabela 5.15, obtidos para um erro admitido na fase de treinamento
igual a 0,03, mostram a mdia dos erros obtidos pela utilizao dos trs conjuntos
de dados, assim como as topologias das redes testadas quando o valor do m
2
foi
utilizado como varivel resposta.
Tabela 5.15 - Resultados das melhores simulaes, usando todas as variveis e o
preo do m
2
para So Carlos.
NS NA
CAMADA
INTERM.
TAXA
DE
APREN.
MOMENTUM
MDIA
DOS
ERROS
R
2
(conj. 1)
R
2
(conj. 2)
R
2
(conj. 3)
5 0,5 0,8 30,08 0,51 0,40 0,50
6 0,3 0,4 28,99 0,53 0,48 0,55
6 0,5 0,8 31,11 0,27 0,32 0,53
13 0,5 0,8 29,26 0,54 0,43 0,47
6 - 4 0,5 0,8 27,88 0,53 0,41 0,55
13 - 5 0,5 0,8 27,87 0,52 0,42 0,56
14 - 6 0,5 0,8 27,63 0,53 0,44 0,56
Nair Cristina Margarido Brondino - 113
Conforme pode ser observado na Tabela 5.15, os valores obtidos para
o R
2
ficaram baixos com relao ao observado para o modelo de regresso. Desta
forma, foi feita uma tentativa de transformao logartmica na varivel resposta
com o objetivo de verificar se a sada fornecida pela rede iria se adequar melhor aos
dados. Os novos resultados obtidos, para um erro de treinamento igual a 0,03, so
mostrados na Tabela 5.16.
Tabela 5.16 - Resultados das melhores simulaes, usando todas as variveis e o ln
do preo do m
2
para So Carlos.
NS NA
CAMADA
INTERM.
TAXA
DE
APREN.
MOMENTUM
MDIA
DOS
ERROS
R
2
(conj. 1)
R
2
(conj. 2)
R
2
(conj. 3)
6 0,5 0,6 7,86 0,63 0,56 0,65
6 0,5 0,8 7,91 0,63 0,54 0,65
6 0,4 0,4 7,74 0,69 0,64 0,73
6 0,3 0,4 7,86 0,68 0,56 0,73
6 0,5 0,5 7,81 0,68 0,56 0,72
6 0,4 0,3 7,31 0,68 0,66 0,73
6 0,4 0,2 7,74 0,68 0,68 0,73
9 - 8 0,5 0,8 7,38 0,66 0,64 0,66
10 - 8 0,5 0,8 7,41 0,63 0,69 0,68
14 - 6 0,5 0,8 7,14 0,65 0,67 0,66
8 - 7 0,5 0,8 7,14 0,66 0,66 0,69
8 - 6 0,5 0,8 7,70 0,64 0,66 0,68
8 - 8 0,5 0,8 6,97 0,67 0,63 0,66
8 - 9 0,5 0,8 7,60 0,65 0,66 0,68
9 - 8 0,4 0,4 7,90 0,65 0,66 0,69
8 - 7 0,4 0,4 7,40 0,67 0,63 0,67
Os valores obtidos para o R
2
observados na Tabela 5.16 mostraram
uma melhora significativa quando a transformao logartmica foi aplicada
varivel resposta. Pode-se observar tambm que a melhor configurao de rede
observada foi aquela com 6 ns na camada intermediria, taxa de aprendizado igual
a 0,4 e momentum igual a 0,2.
Da mesma forma que o caso anterior, a importncia de cada varivel
no valor estimado final foi calculada atravs do mtodo proposto por Garson. Os
resultados obtidos so mostrados na Tabela 5.17.
Nair Cristina Margarido Brondino - 114
Tabela 5.17 - Relevncia de cada varivel para a cidade de So Carlos.
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV. (%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
CATEGORIA 17 MC 17 MC 16
MC 15 CATEGORIA 14 CATEGORIA 14
MURO 12,5 MURO 7,5 MURO 12
REA 9,5 REA 7,5 REA 11
GUA 7 ESGOTO 7,5 GUA 8
LUZ 6 CALADA 6,5 CALADA 7
ESGOTO 6 FORMA 6,5 TESTADA 5
CALADA 5,5 EDIFICAO 6 EDIFICAO 5
SITUAO 4 LUZ 6 LUZ 5
TESTADA 4 GUA 5 ESGOTO 4
EDIFICAO 3,5 TOPOGRAFIA 5 SITUAO 3,7
TOPOGRAFIA 3,5 SITUAO 4 TOPOGRAFIA 3,7
ASFALTO, 3 ASFALTO 3,6 FORMA 2,5
FORMA
3 TESTADA 3,6 ASFALTO 1,5
Os dados observados na Tabela 5.17 revelam que, para a cidade de
So Carlos, a varivel mc aparece em primeiro lugar em dois dos conjuntos de
dados, seguida pela categoria a que o lote pertence. No primeiro conjunto, contudo,
a distncia ao centro aparece em segundo lugar, mas tambm com uma contribuio
significativa para o valor final, igual a 15%. Observa-se que a existncia de muro
representa uma varivel importante na valorizao de lotes, uma vez que aparece
em terceiro lugar para todos os conjuntos de dados. A varivel rea em nenhum dos
casos apresentou contribuio superior a 11%. Da mesma forma que para o modelo
de regresso, a existncia de asfalto no causa influncia significativa no preo de
terrenos, fato este que pode ser explicado pelo alto nvel de pavimentao da cidade.
Devido ao tipo de relevo acidentado comum na cidade, lotes com topografia
irregular tambm no so desvalorizados. A varivel testada tambm no aparece
como fator relevante.
Conforme proposto na Metodologia, as variveis cuja influncia fosse
igual ou inferior a 5% seriam retiradas do conjunto de dados e a rede, novamente
testada. Desta forma, as variveis topografia, situao, testada e asfalto foram
retiradas do conjunto de dados e a rede novamente treinada. Esta nova situao,
porm, no gerou resultados estatisticamente significativos para um nvel crtico
Nair Cristina Margarido Brondino - 115
igual a 95%, uma vez que o erro mdio observado ficou igual a 7,71 e os R
2
obtidos
foram 0,69, 0,68 e 0,73 para os conjuntos 1, 2 e 3, respectivamente.
5.2.3. COMPARAO DOS RESULTADOS OBTIDOS
PELOS DOIS MTODOS PARA A CIDADE DE SO
CARLOS
Os mesmos conjuntos de dados utilizados para a fase de teste das
Redes Neurais foram utilizados para estimar os erros e R
2
obtidos pelo modelo de
regresso. Estes resultados so mostrados na Tabela 5.18.
Tabela 5.18 - Erros e R
2
obtidos para os dois modelos e os trs conjuntos de dados
para So Carlos.
REGRESSO RN
ERRO R
2
ERRO R
2
conjunto 1 6,38 0,70 6,72 0,69
conjunto 2 7,93 0,67 7,80 0,68
conjunto 3 8,55 0,70 8,62 0,73
MDIA 7,62 - 7,71 -
Os resultados mostrados na Tabela 5.18 indicam que o erro relativo
total obtido pelas RN ficou em torno de 1,2% maior que aquele fornecido pela
regresso. Quanto ao valor do R
2
, pode-se observar que o segundo mtodo mostrou
uma ligeira superioridade para os conjuntos 2 e 3. Desta forma, os resultados
obtidos at aqui indicam uma certa coerncia em termos de erros de estimao e R
2
para os dois mtodos, no se podendo notar mudanas significativas quando um ou
outro foi utilizado.
O prximo passo constou em comparar os erros relativos para os dois
mtodos, atravs dos grficos mostrados nas Figuras 5.10, 5.11 e 5.12, mostrando
estes valores para ambos os mtodos e os conjuntos de dados 1, 2 e 3,
respectivamente.
Nair Cristina Margarido Brondino - 116
GRUPO 1
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
1 13 25 37 49 61 73 85 97 109
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO REG ERRO ANN
Figura 5.10 - Erros relativos obtidos para os dois mtodos e o primeiro conjunto de
dados para a cidade de So Carlos.
GRUPO 2
0
0,1
0,2
0,3
0,4
0,5
0,6
1 12 23 34 45 56 67 78 89 100 111
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO REG ERRO ANN
Figura 5.11 - Erros relativos obtidos para os dois mtodos e o segundo conjunto de
dados para a cidade de So Carlos.
Nair Cristina Margarido Brondino - 117
GRUPO 3
0
0,1
0,2
0,3
0,4
0,5
0,6
1 12 23 34 45 56 67 78 89 100 111
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO REG ERRO ANN
Figura 5.12 - Erros relativos obtidos para os dois mtodos e o terceiro conjunto de
dados para a cidade de So Carlos.
As Figuras 5.10, 5.11 e 5.12 revelam um comportamento bastante
parecido, em termos de erro de estimao. Pode-se notar tambm que, para os trs
casos, quando o valor do erro relativo atingiu seu pico para um dado modelo, o
mesmo ocorreu para o outro, o que pode ser indicativo da existncia de um ponto
cujo valor observado era muito discrepante do restante do conjunto de dados.
O prximo passo constou do agrupamento dos valores dos erros em
clusters, visando a construo de mapas temticos e posterior identificao de um
possvel padro espacial nos valores dos erros. A diviso em clusters, foi obtida
atravs do emprego do mesmo mtodo utilizado para Araariguama e mostrada na
Tabela 5.19.
Nair Cristina Margarido Brondino - 118
Tabela 5.19 - Proporo de erros relativos nos clusters encontrados com os dois
modelos para os trs conjuntos de dados para So Carlos.
Conjunto/Cluster Limites de
classe
REGRESSO RN
Conjunto 1 - Cluster1 <= 0,0267 35,0% 36,0%
Conjunto 1 - Cluster 2 0,0268 a 0,0638 35,0% 31,0%
Conjunto 1 - Cluster 3 0,0639 a 0,1327 22,5% 24,0%
Conjunto 1 - Cluster 4 >= 0,1328 8,5% 7,5%
Conjunto 2 - Cluster 1 <= 0,0381 53,0% 52,0%
Conjunto 2 - Cluster 2 0,0382 a 0,0880 27,5% 30,0%
Conjunto 2 - Cluster 3 0,0881 a 0,1989 10,0% 7,5%
Conjunto 2 - Cluster 4 >= 0,1990 9,5% 10,5%
Conjunto 3 - Cluster 1 <= 0,0355 33,0% 42,5%
Conjunto 3 - Cluster 2 0,0355 a 0,0891 44,0% 34,0%
Conjunto 3 - Cluster 3 0,0892 a 0,1725 12,5% 12,5%
Conjunto 3 - Cluster 4 >= 0,1726 11,0% 11,0%
Diferentemente do que aconteceu para Araariguama, no se percebe
uma grande diferena na concentrao de pontos situados dentro dos intervalos que
apresentaram valores de erros menores (clusters 1 e 2) para os dois mtodos.
Portanto, parece no haver diferena entre regresso e Redes Neurais quando a
anlise de clusters foi utilizada.
Uma anlise dos mapas temticos mostrados nas Figuras 5.13, 5.14,
5.15, 5.16, 5.17 e 5.18 mostra que para os elementos do grupo 1 parece no haver
padro espacial definido para a distribuio dos erros tanto para um mtodo quanto
para outro. Para os grupos 2 e 3, no entanto, nota-se uma concentrao de erros
maiores no bairro situado no canto inferior esquerdo para ambos os modelos. As
Figuras 5.15, 5.16, 5.17 e 5.18 revelam uma grande semelhana no padro de
distribuio espacial para os erros obtidos para os mtodos de regresso e Redes
Neurais.
Nair Cristina Margarido Brondino - 119
Figura 5.13 - Distribuio espacial dos erros para o modelo de regresso e o
primeiro grupo de dados de So Carlos.
Figura 5.14 - Distribuio espacial dos erros para as RN e o primeiro grupo de
dados de So Carlos.
Nair Cristina Margarido Brondino - 120
Figura 5.15 - Distribuio espacial dos erros para o modelo de regresso e o
segundo grupo de dados de So Carlos.
Figura 5.16 - Distribuio espacial dos erros para as RN e o segundo grupo de
dados de So Carlos.
Nair Cristina Margarido Brondino - 121
Figura 5.17 - Distribuio espacial dos erros para o modelo de regresso e o terceiro
grupo de dados de So Carlos.
Figura 5.18 - Distribuio espacial dos erros para as RN e o terceiro grupo de dados
de So Carlos.
Nair Cristina Margarido Brondino - 122
5.3. AVALIAO DO DESEMPENHO DAS REDES
NEURAIS
Uma das principais caractersticas de uma Rede Neural a de que ela
capaz de fornecer boas estimativas mesmo quando as variveis independentes
possuam algum tipo de relao desconhecida entre si. Esta uma das vantagens do
mtodo com relao aos modelos de estimao convencionais, uma vez que nem
sempre possvel saber com exatido que tipo de relao envolve duas ou mais
variveis de entrada. O mesmo se aplica com respeito s variveis de sada e de
entrada, uma vez que o esperado que a rede seja capaz de captar o tipo de relao
existente entre elas e fornecer estimativas adequadas.
Para os estudos de caso mostrados aqui, a rede foi treinada utilizando
o valor m
2
ou uma funo deste como varivel resposta. Porm, tornou-se
interessante verificar como as RN reagiriam se uma nova situao fosse
apresentada, onde o valor total do terreno fosse utilizado como entrada.
A Tabela 5.20 mostra os resultados obtidos para a cidade de
Araariguama, quando o valor total do terreno foi utilizado na sada.
Nair Cristina Margarido Brondino - 123
Tabela 5.20 Resultados obtidos pelas Redes Neurais quando o valor total do
terreno foi utilizado como sada para a cidade de Araariguama.
Nmero de ns
nas camadas
intermedirias
Taxa de
aprendizado
Momentum Mdia dos erros
relativos
Erro de treinamento = 0,05
Dados brutos 4 0,5 0,8 24,96
Dados brutos 6 0,5 0,8 23,87
Dados brutos 4 0,3 0,4 24,08
Dados brutos 2 0,4 0,4 24,82
Dados brutos 6 0,4 0,4 25,16
Dados brutos 3 0,2 0,1 34,78
Dados brutos 3 0,2 0,1 24,36
Norm. 0 1 6 0,2 0,7 23,34
Norm. 0 1 4 0,3 0,4 23,64
Norm. 0 1 7 6 0,3 0,4 23,69
Norm. 0 1 5 3 2 0,5 0,8 23,40
Norm. 0 1 3 0,3 0,2 23,79
Norm. 0 1 6542 0,3 0,4 23,92
Erro de treinamento = 0,01
Dados brutos 4 0,5 0,8 27,90
Dados brutos 6 0,5 0,8 29,09
Dados brutos 4-3 0,5 0,8 50,65
Dados brutos 6-3 0,1 0,2 27,20
Dados brutos 7 0,5 0,6 23,57
Norm. 0 - 1 7 0,5 0,8 27,17
Norm. 0 - 1 4 0,5 0,8 36,73
Norm. 0 - 1 4 0,3 0,4 26,95
Os valores observados na Tabela 5.20 indicam que a rede com 4 ns
na camada intermediria, taxa de aprendizado igual a 0,3 e momentum igual a 0,4
apresentou erro relativo mdio situado entre os menores valores observados,
independentemente do erro de treinamento (0,05 ou 0,01). Vale observar que para o
caso onde se usou o m
2
como varivel resposta, a configurao de rede escolhida foi
a mesma. Portanto, estes resultados indicam que, independentemente da
transformao a que se sujeitou os dados, a configurao de rede citada forneceu
bons resultados. Uma anlise da salincia das variveis tambm foi executada para
este caso, cujos resultados so apresentados na Tabela 5.21.
Nair Cristina Margarido Brondino - 124
Tabela 5.21 - Relevncia de cada varivel para a cidade de Araariguama quando o
preo total do terreno foi utilizado .
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV. (%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
REA 16 REA 16 FORMA 17
FORMA 16 FORMA 16 REA 16
SITUAO 16 SITUAO 15 SITUAO 16
TESTADA 15 TESTADA 15 TESTADA 15
MC 13 MC 14 MC 13
CALADA 13 CALADA 12 MURO 11,5
MURO 11 MURO 11 CALADA 11,5
Os valores observados na Tabela 5.21 indicam que a varivel mc
aparece em quinto lugar na lista de importncias relativas, sempre precedido pelas
variveis rea, testada, forma e situao. Portanto, quando o preo total do lote est
sendo estimado pelas Redes Neurais, suas caractersticas fsicas so as mais
consideradas.
O mesmo tipo de anlise foi elaborado para a cidade de So Carlos, e
os resultados so mostrados na Tabela 5.22.
Tabela 5.22 - Resultados obtidos pelas Redes Neurais quando o valor total do
terreno foi utilizado como sada para a cidade de So Carlos.
NMERO
NS NA
ENTRADA
NS NA
CAMADA
INTERME-
DIRIA
TAXA
DE
APREN.
MOMENTUM MDIA
DOS
ERROS
ERRO ADMITIDO PARA A FASE DE TREINAMENTO = 0,05
14 6 0,5 0,8 139,103
14 8 - 5 0,5 0,8 156,997
14 3 0,5 0,8 140,333
14 6 0,3 0,4 156,767
14 8 - 5 0,3 0,4 162,793
14 3 0,3 0,3 152,293
13 6 0,5 0,8 138,327
13 11 0,5 0,8 134,327
13 5 - 3 0,5 0,8 163,123
13 5 - 3 0,3 0,3 163,777
13 11 0,3 0,3 161,517
ZONA 1: VAR 6 A 13
3 0,5 0,8 151,253
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
3 0,3 0,3 156,470
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
6 0,5 0,8 151,493
Nair Cristina Margarido Brondino - 125
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
6 0,3 0,3 164,657
13 6 - 5 - 4 0,3 0,3 166,330
13 4 - 3 0,2 0,1 173,063
13 7 - 6 - 4 0,2 0,2 189,657
13 12 - 11 0,3 0,3 165,383
ERRO ADMITIDO PARA A FASE DE TREINAMENTO = 0,01
13 5 - 3 0,3 0,3 145,413
14 6 0,3 0,4 53,453
14 8 - 5 0,5 0,8 89,357
14 3 0,5 0,8 57,520
14 5 - 3 0,5 0,8 102,563
13 6 0,5 0,8 68,610
13 11 0,5 0,8 65,147
ZONA 1: VAR 6 A 13
3 0,5 0,8 61,507
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
6 0,5 0,8 86,703
13 6 - 5 -4 0,5 0,8 134,477
13 4 - 3 0,5 0,8 128,153
13 7 - 6 - 4 0,5 0,8 131,873
13 12 - 11 0,5 0,8 95,240
14 5 0,3 0,3 104,737
14 6 - 5 0,3 0,3 118,893
14 6 0,5 0,8 53,993
14 4 0,5 0,8 54,600
14 5 - 4 0,5 0,8 107,970
A Tabela 5.22 mostra os resultados obtidos para as redes simuladas
para So Carlos com 13 e 14 ns na camada de entrada e erros de treinamento
iguais a 0,05 e 0,01, onde a rede com 14 ns incluiu a varivel categoria.
De acordo com os dados fornecidos, chegou-se concluso de que a
rede que apresentou os melhores resultados foi aquela com 14 ns na camada de
entrada, 6 na camada intermediria, taxa de aprendizado igual a 0,3 e momentum
igual a 0,4, considerando o erro de treinamento igual a 0,01. Novamente, observou-
se que esta configurao tambm conduziu a um dos menores erros mdios obtidos
para o modelo onde se usou o ln (m
2
), ou seja, independentemente da transformao
aplicada, esta configurao de rede conduziu a bons resultados. Uma anlise da
salincia das variveis mostrada na Tabela 5.23.
Nair Cristina Margarido Brondino - 126
Tabela 5.23 - Relevncia de cada varivel para a cidade de So Carlos, quando o
preo total do terreno foi considerando.
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV. (%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
REA 23 REA 24 REA 31
CATEGORIA 12 CATEGORIA 12 MC 10
MC 8,5 MC 8 CATEGORIA 7
EX. EDIF. 8,5 EX. EDIF. 8 EX. EDIF 7
TESTADA 6,5 TESTADA 6,5 FORMA 6
FORMA 6,5 FORMA 6,5 SITUAO 6
ASFALTO 6 ASFALTO 6 ASFALTO 6
SITUAO 6 SITUAO 6 ESGOTO 5
ESGOTO 4,5 ESGOTO 4,5 TESTADA 5
LUZ 4,5 LUZ 4,5 LUZ 5
MURO 4 MURO 4 MURO 5
CALADA 4 CALADA 4 CALADA 4
TOPOGRAFIA 3 TOPOGRAFIA 3 TOPOGRAFIA 4
GUA 3 GUA 3 GUA 3
Os dados mostrados na Tabela 5.23 indicam que a varivel rea
apresenta a maior importncia no valor estimado, como j era esperado, uma vez
que o preo total do lote est sendo considerado. Quanto varivel mc, nota-se que
esta aparece em terceiro lugar de importncia para dois dos conjuntos de dados,
sendo precedida pela varivel categoria. Para o terceiro conjunto, no entanto, a
acessibilidade aparece em segundo lugar na escala de relevncias.
Os resultados observados nas Tabelas 5.20 e 5.22 indicam que, em se
tratando de estimao de valor, as Redes Neurais apresentam uma certa coerncia
em termos de configurao, independentemente da transformao empregada nas
variveis. Assim, para Araariguama, uma rede com 4 ns na camada intermediria,
taxa de aprendizado igual a 0,4 e momentum igual a 0,3 seria adequada tanto para
estimar o valor total dos lotes quanto o valor do m
2
, dependendo do conjunto de
dados de treinamento. O mesmo foi observado para So Carlos, onde uma rede com
6 ns na camada intermediria, taxa de aprendizado igual a 0,3 e momentum igual a
0,4 seria adequada tanto para estimar o valor total quanto unitrio.
Porm, ao analisar a salincia de cada varivel na resposta fornecida
para Araariguama, percebe-se uma diferena em termos de importncia, uma vez
que a acessibilidade, que teve uma contribuio superior a 34% para a estimao do
Nair Cristina Margarido Brondino - 127
valor do m
2
, se apresenta em quinto lugar para a nova situao, sempre precedida
pela rea e outras caractersticas fsicas e com representao relativa variando de
13% a 15%.
Da mesma maneira que ocorreu para Araariguama, os dados
apresentados na Tabela 5.23 indicam que, para So Carlos, a varivel mais relevante
a rea, fato j esperado quando se considera o valor total do lote. Por sua vez, a
acessibilidade aparece em terceiro lugar, precedida pela varivel categoria e no
ltimo conjunto estas posies se invertem. No caso onde se analisou o preo do
m
2
, contudo, verificou-se que a acessibilidade aparecia em primeiro lugar para dois
dos conjuntos.
Diante dos resultados mostrados nas Tabelas 5.21 e 5.23, resolveu-se
fazer uma comparao dos erros relativos obtidos para os dois casos (estimao do
valor total e do m
2
para as duas cidades e os trs conjuntos de dados). Os resultados
obtidos para Araariguama so mostrados nas Figuras 5.19 a 5.21 para os grupos 1,
2 e 3, respectivamente. Para So Carlos, a comparao grfica destes erros
mostrada nas Figuras 5.22 a 5.24.
GRUPO 1
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)
Figura 5.19 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o primeiro conjunto de dados e a cidade de Araariguama.
Nair Cristina Margarido Brondino - 128
GRUPO 2
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)
Figura 5.20 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o segundo conjunto de dados e a cidade de Araariguama.
GRUPO 3
0
1
2
3
4
1 4 7 10 13 16 19 22 25 28 31 34 37 40
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)
Figura 5.21 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o terceiro conjunto de dados e a cidade de Araariguama.
GRUPO 1
0,0000
1,0000
2,0000
3,0000
1 14 27 40 53 66 79 92 105 118
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO(TOTAL)
Figura 5.22 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o primeiro conjunto de dados e a cidade de So Carlos.
Nair Cristina Margarido Brondino - 129
GRUPO 2
0,0000
0,5000
1,0000
1,5000
2,0000
2,5000
3,0000
1 14 27 40 53 66 79 92 105 118
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO(TOTAL)
Figura 5.23 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o segundo conjunto de dados e a cidade de So Carlos.
GRUPO 3
0
1
2
3
4
1 12 23 34 45 56 67 78 89 100 111
OBSERVAES
E
R
R
O
S
R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)
Figura 5.24 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o terceiro conjunto de dados e a cidade de So Carlos.
Os resultados observados nas Figuras 5.19 a 5.24 indicam que quando
o valor do m
2
foi usado em lugar do valor total do terreno, no geral os erros
relativos foram menores. Para a cidade de Araariguama, observa-se que para os
conjuntos 1 e 3 h um pico no valor do erro quando o m
2
foi utilizado. Porm, para
os demais casos, verifica-se que o erro obtido para o preo total , na maioria das
vezes, maior. Para So Carlos verifica-se que apenas para o grupo 2 existe um pico
no erro relativo obtido para o modelo que utilizou o m
2
. Na maioria dos casos
restantes, os erros obtidos pela utilizao do valor total foram maiores.
Nair Cristina Margarido Brondino - 130
Embora alguns autores (DANTAS, 1999; MENDONA et al., 1998)
tambm utilizem o valor total do lote sem maiores prejuzos, optou-se aqui por
basear as anlises no valor do m
2
, uma vez que os erros fornecidos pela sua
utilizao foram menores que os obtidos pelo modelo que utilizou o valor total.
Os mapas temticos mostrados nas Figuras 5.25 a 5.27 mostram a
distribuio espacial dos erros fornecidos pelas RN quando o valor total do lote foi
utilizado para a cidade de So Carlos. Uma comparao entre estes mapas e aqueles
obtidos pela utilizao do m
2
indica que a concentrao de erros maiores apresenta
aproximadamente o mesmo padro, independentemente da transformao a que as
variveis foram sujeitas.
Figura 5.25 - Distribuio espacial dos erros obtidos para as RN e o primeiro grupo
de dados de So Carlos quando o valor total do lote foi utilizado.
Nair Cristina Margarido Brondino - 131
Figura 5.26 - Distribuio espacial dos erros obtidos para as RN e o segundo grupo
de dados de So Carlos quando o valor total do lote foi utilizado.
Figura 5.27 - Distribuio espacial dos erros obtidos para as RN e o terceiro grupo
de dados de So Carlos quando o valor total do lote foi utilizado.
Nair Cristina Margarido Brondino - 132
6. CONCLUSES
Este trabalho tinha trs objetivos, a saber: identificar as variveis que
interferem no valor das propriedades, avaliar o uso de Redes Neurais Artificiais
para fins de avaliao e estudar a influncia de uma medida de acessibilidade no
valor de terrenos urbanos. Os resultados obtidos sero comentados a seguir.
Embora no tenham sido observados muitos casos na literatura, a
adio de variveis de natureza espacial, como por exemplo a distncia a algum
plo de atrao, tem trazido uma melhora significativa em termos de avaliao e se
apresenta como um assunto em ascenso. Porm, se no tipo de avaliao expedita
utilizada por negociadores de imveis, este tipo de varivel , de alguma forma,
levado em considerao, uma modelagem matemtica de sua influncia ainda no
to fcil de ser obtida.
Como pde ser observado na reviso bibliogrfica apresentada, alguns
modelos de avaliao que utilizaram somente variveis de natureza espacial no
foram muito bem sucedidos. Por outro lado, observou-se alguns casos em que
somente caractersticas de natureza fsica foram consideradas e o resultado obtido
foi julgado satisfatrio. Porm, tambm observou-se casos em que a incluso apenas
de atributos fsicos no conduziu a estimativas adequadas. Diante de quadros deste
tipo, fartos na literatura, a utilizao de um banco de dados misto, onde tanto
variveis de natureza espacial quanto fsica possam ser includas, se torna bastante
atraente.
Porm, se a incluso de alguma medida de natureza espacial parece
ser interessante, o julgamento correto de sua influncia est vinculado a um mtodo
Nair Cristina Margarido Brondino - 133
de estimao eficiente, baseado em modelagem matemtica adequada. Desta forma,
alm da adio de uma varivel de natureza espacial, a distncia ao centro da
cidade, este trabalho comparou dois mtodos de avaliao. O primeiro, que alm de
ser muito utilizado na prtica, recomendado pela ABNT (Associao Brasileira de
Normas Tcnicas), foi o modelo de regresso mltipla, cujos resultados serviram
para comparao com o outro mtodo utilizado aqui: as Redes Neurais. Embora
casos que utilizaram este tipo de modelagem sejam escassos na literatura sobre
avaliao imobiliria, os bons resultados que vm sendo obtidos em vrios campos
de estudo motivaram sua utilizao neste trabalho.
Para estudar a adequabilidade de uma tcnica inovadora no ramo de
avaliao, como o caso das Redes Neurais, e, mais do que isso, verificar a
influncia da acessibilidade na valorizao de imveis urbanos, este trabalho
abordou dois estudos de caso, as cidades de Araariguama e So Carlos. A primeira
uma cidade dormitrio, de pequeno porte, localizada nas proximidades da capital
do estado, So Paulo. A segunda, por sua vez, uma cidade de porte mdio,
localizada no centro do estado e tem como principal caracterstica ser um plo
industrial e tecnolgico. A escolha destas cidades se deu, num primeiro momento,
pela facilidade de aquisio de dados, reforada pela oportunidade de estudar a
influncia de uma varivel como a acessibilidade em dois lugares com contextos
regionais diferentes.
Os resultados obtidos para Araariguama indicam que, mesmo sendo
uma cidade de pequeno porte, a medida de acessibilidade empregada, distncia ao
centro, uma das variveis mais importantes na formao do preo de propriedades.
Uma possvel explicao para isso que devido s pequenas dimenses da cidade,
os plos de atrao, como escolas, bancos e rea comercial se localizam no centro e
as limitaes do sistema de transporte pblico fazem com que propriedades
localizadas na regio central sejam mais valorizadas. Quanto aos resultados obtidos
pelos modelos empregados, pde-se observar que, ao utilizar regresso mltipla, o
efeito da varivel distncia ao centro no pode ser estudado sozinho, pois esta
varivel interage com a rea. Desta forma, utilizando a expresso obtida, verificou-
se que um aumento na rea aumenta o efeito marginal desta varivel, ou seja,
Nair Cristina Margarido Brondino - 134
propriedades grandes localizadas longe do centro so valorizadas. Uma explicao
para isso que um dos bairros mais luxuosos da cidade composto por chcaras e
se situa distante da regio central.
A utilizao de Redes Neurais, por sua vez, tambm forneceu
estimativas adequadas de valor. A importncia relativa de cada varivel pde ser
medida atravs de um mtodo proposto por Garson e forneceu um panorama da
valorizao de imveis na cidade. Para os trs conjuntos de dados utilizados na
anlise, verificou-se que a acessibilidade apresenta um peso superior a 34% no valor
final, seguida pela rea, com importncia relativa entre 10% e 18%.
Uma comparao dos dois mtodos para Araariguama mostrou que,
em termos do coeficiente de determinao (R
2
), no se pode concluir muita coisa,
uma vez que estes valores oscilaram muito de um conjunto para outro de dados. Ao
considerar o valor da erro relativo total, no entanto, pode-se observar que as Redes
Neurais (RN) demonstraram um desempenho superior, gerando uma diminuio de
43% com relao ao modelo de regresso. Uma comparao ponto a ponto para os
erros obtidos pelos dois mtodos e os trs conjuntos de dados analisados indicou
que, no geral, os erros relativos fornecidos pelas RN foram menores.
Com o objetivo de analisar a distribuio espacial dos erros fornecidos
pelo modelo de regresso, estes foram agrupados em cinco clusters. Os mesmos
limites de classe foram utilizados para agrupar os erros fornecidos pelas RN.
Observou-se da que, no geral, a maior proporo de erros observados pelo emprego
das Redes Neurais se concentrou nos clusters com valores menores. Ao observar os
mapas temticos gerados, pode-se constatar que os maiores erros fornecidos pelas
RN se concentram em um nico bairro. Para a regresso, no entanto, no se
consegue distinguir uma concentrao espacial dos erros maiores.
A anlise para So Carlos seguiu o mesmo critrio utilizado para a
outra cidade. Assim como para Araariguama, pde-se constatar que a distncia ao
centro um dos fatores preponderantes na avaliao imobiliria local, o que pde
ser observado pelos resultados obtidos por ambos os mtodos. Os resultados obtidos
indicaram que um aumento no valor da distncia ao centro da cidade provoca uma
diminuio do preo por metro quadrado.
Nair Cristina Margarido Brondino - 135
Uma anlise da importncia de cada varivel na resposta estimada
para as RN mostrou que, tambm para So Carlos, a acessibilidade a varivel que
contribuiu com a maior representatividade na estimao de valor em dois dos
conjuntos de dados, seguida pela categoria de bairro a que pertence o lote.
Diferentemente do que aconteceu para Araariguama, no se percebeu uma
diferena significativa entre os valores estimados por este mtodo e os fornecidos
pela regresso, tanto em termos de coeficiente de determinao quanto de erro
relativo total.
Atravs dos mapas temticos construdos para verificar a distribuio
espacial dos erros, notou-se uma concentrao de erros maiores em um dos bairros
analisados, o que pde ser observado para os dois mtodos empregados e dois dos
conjuntos de dados. Uma possvel explicao para este problema que o bairro em
questo possui uma grande quantidade de lotes vazios sendo oferecidos a preos de
mercado bastante baixos quando comparados aos outros bairros da cidade. Uma
soluo para este problema poderia ser a diviso da dcima quarta varivel
(categoria do bairro) em mais um subgrupo, indicando se o terreno se localiza neste
bairro. Alm dessa, outra opo seria isolar estes lotes do conjunto de dados e
construir modelos diferentes para eles. Tais sugestes, que merecem uma ateno
especial, sugerem um estudo mais aprofundado das caractersticas do bairro em
questo.
Alm da comparao dos resultados fornecidos por ambos os
mtodos, uma anlise do desempenho das Redes Neurais tambm foi realizada. Para
tal, redes utilizando o valor total do lote em lugar do preo por m
2
, foram simuladas
para as duas cidades. Os resultados indicaram que, se o objetivo for apenas o valor
estimado e no a influncia de cada varivel, uma configurao de rede que conduz
aos menores erros relativos para uma situao, tambm pode ser utilizada para a
outra. Porm, os erros relativos obtidos quando o preo total do lote foi utilizado
apresentaram, no geral, valores maiores que os obtidos para o modelo que utilizou o
m
2
.
Alm da diferena observada nos valores dos erros, notou-se que a
rea do lote passou a ter a maior representatividade nos valores estimados para o
Nair Cristina Margarido Brondino - 136
preo total, fato observado para os dois estudos de caso e que j era esperado devido
ao tipo de varivel utilizada. Alm disso, os mapas temticos construdos para a
verificao da distribuio espacial dos erros fornecidos para o caso em que o valor
total do lote foi utilizado para a cidade de So Carlos, apresenta uma certa coerncia
com aqueles obtidos para os erros observados para os valores estimados do m
2
,
sugerindo, mais uma vez que, em termos de valor estimado e para este estudo, as
redes forneceram boas estimativas, independentemente da transformao a que as
variveis foram previamente submetidas.
Quanto acessibilidade, um fato que chamou a ateno foi o de que
para Araariguama, que uma cidade de porte menor, a importncia relativa desta
varivel foi maior que para a outra cidade. Uma possvel explicao para isso que,
alm da existncia de um sistema de transporte pblico com boa cobertura, So
Carlos apresenta alguns plos de atrao em outros bairros, o que faz com que
moradores destes lugares no precisem se deslocar at a regio central da cidade
para executar vrias tarefas e, portanto, a varivel distncia ao centro parece no ser
to decisiva na aquisio de uma propriedade. Este fato sugere que outros tipos de
medida de acessibilidade, que levem em considerao situaes deste tipo, tambm
devem ser analisados. A comparao de cidades com portes e caractersticas
semelhantes tambm um assunto que deve ser futuramente considerado, com o
objetivo de verificar se a influncia da acessibilidade ocorre de maneira similar.
A utilizao de uma ferramenta mais poderosa de estatstica espacial
tambm mostrou-se de grande importncia para a anlise de resultados, uma vez
que poderia executar o trabalho de visualizao da distribuio dos erros de maneira
mais adequada. Apesar da simplicidade do mtodo aqui utilizado, que uniu
ferramentas estatsticas a um Sistema de Informaes Geogrficas, pde-se observar
fatos que haviam passado despercebidos, como por exemplo, a concentrao de
erros maiores em determinados bairros. Problemas como este poderiam ser
facilmente identificados e quantificados se fossem empregadas ferramentas
especficas para este tipo de anlise.
De maneira geral, os resultados obtidos aqui sugerem que, em termos
de facilidade de aplicao, os programas que fazem uso de Redes Neurais se
Nair Cristina Margarido Brondino - 137
apresentam como um mtodo mais acessvel, em termos de interface com o usurio.
Por sua vez, a verificao de algumas suposies bsicas com relao aos modelos
de regresso, embora raramente executada pelos usurios deste tipo de mtodo,
restringe seu uso a pessoas que tenham noes de lgebra de matrizes e nem sempre
esto disponveis em pacotes computacionais especficos, o que dificulta sua
utilizao de forma teoricamente correta.
O inconveniente das RN, por outro lado, a obscuridade da lgica
interna de processamento, em geral no visvel para os usurios. Isto , de certa
forma, desmistificado pelo mtodo de Garson aqui empregado.
Diante dos resultados comentados aqui, sugere-se a seguinte relao
de trabalhos para futuro desenvolvimento:
Avaliao do emprego de outras medidas de acessibilidade;
Comparao da influncia da acessibilidade para cidade de portes e
caractersticas parecidas;
Incluso de uma nova categoria de bairro no banco de dados de So
Carlos e novo treinamento da rede;
Utilizao de ferramentas especficas de anlise espacial para a
verificao da distribuio dos erros.
Nair Cristina Margarido Brondino - 138
7. BIBLIOGRAFIA
ABELSON, P. (1997). House and Land Prices in Sydney from 1931 to 1989. In: Urban
Studies, v. 34, n. 9. pp. 1381-1400.
ABNT - ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 5676/90.
(1989). Avaliao de Imveis Urbanos. Rio de Janeiro, ABNT.
ALMOND, N.; JENKINS, D.; GRONOW, S. (1997). Development of a Prototype
Residential Valuation System. In: Proceedings of the 5
th
Conference on Computers in
Urban Planning and Urban Management, Mumbai. Anais... Mumbai, 1997, v. 1. pp.
204-215.
ANTON, H. (1991). Elementary Linear Algebra. Segunda edio. John Wiley & Sons.
526 p.
AOKI, Y.; OSARAGI, T.; ISHIZAKA, K. (1994). An Interpolating Model for Land-price
Data with Transportation Costs and Urban Activities. In: Environment and Planning,
v. 21. pp. 53-65.
AZAR, K. T.; FERREIRA JR, J.; ABED J.; KAZZAZ, T. (1994). Using GIS for
Estimating the Spatial Distribution of Land Value in Metropolitan Beirut. Urban and
Regional Information Association - URISA.
BALARINE, O. F. O. (1995). Contribuies Macroeconmicas ao Entendimento da
Formao de Preos Habitacionais Locais. In: VIII COBREAP - Congresso
Brasileiro de Engenharia de Avaliaes e Percias, Florianpolis. Anais...
Florianpolis, 1995. pp. 361-265.
BEALE, R.; JACKSON, T. (1990). Neural Computing: An Introduction. Institute of
Physics Publishing.
BENTICK, B. L. (1996). The Differencial Incidence of an Urban Land Tax Depends on
the Travel Intensities of Substitutes for Land. In: Urban Studies, v. 33, n. 9. pp. 1729-
1732.
BIELLI, M.; REVERBERI, P. (1996). New Operations Research and Artificial
Intelligence Approaches to Traffic Engineering Problems. In: European Journal of
Operational Research, n. 92, pp. 550-572.
BORGES, J. M. M. (1975). Custo de Transporte e Valor dos Terrenos Urbanos.
Dissertao de Mestrado. Faculdade de Economia e Administrao - Universidade de
So Paulo.
Nair Cristina Margarido Brondino - 139
BRANDO, D. Q.; GUCH, D. U.; NEUMANN, C. (1995). Avaliao de Unidades de
Edifcios Residenciais Utilizando Estatstica Inferencial: Aplicao em Bairros da
Regio Continental de Florianpolis. In: VIII COBREAP - Congresso Brasileiro de
Engenharia de Avaliaes e Percias, Florianpolis. Anais... Florianpolis, 1995. pp.
229-236.
BRONDINO, N. C. M.; SILVA, A. N. R. (1997). Comparando Estratgias de Avaliao
de Imveis Para Fins de Tributao Com o Auxlio de um SIG. GIS Brasil 1997
Curitiba. Anais... Curitiba, 1997. (CD-ROM).
BRONDINO, N. C. M.; SILVA, A. N. R. (1998a). Atualizao de Plantas Genricas de
Valores: Novo Levantamento Cadastral ou Amostra de Valores de Mercado? GIS
Brasil 1998. Curitiba. Anais... GIS Brasil 98. (CD-ROM).
BRONDINO, N. C. M.; SILVA, A. N. R. (1998b). A Comparison of Land Valuation
Methods Supported by GIS. In: 4
th
Conference on Design and Decision Support
Systems in Architeture and Urban Planning. Maastricht. Anais... Maastricht, 1998
(CD-ROM).
BULLEN, N. (1997). Linking GIS and Multilevel Modelling in the Spatial Analysis of
House Prices. In: CRAGLIA, M. & COUCLELIS, H. Geographical Information
Research. pp. 412-426.
BUZAI, G. D.; DURAN, D. (1997). Ensear e Investigar com Sistemas de Informacin
Geogrfica (S.I.G.). Editora Troquel. 191 p.
CMARA, G.; CASANOVA M. A.; HEMERLY, A. S.; MAGALHES, G. C.;
MEDEIROS, C. M. B. (1996). Anatomia de Sistemas de Informao Geogrfica.
Instituto de Computao, UNICAMP. Campinas. 1996. 193p.
CARVALHO, A. P. L. F.; BRAGA, A.; LUDERMIR, T. (1998). Fundamentos de Redes
Neurais. Publicao da COPPE/UFRJ para a XI Escola de Computao Brasileria. Rio
de Janeiro.
CASSIDY, H. J. (1981). Using Econometrics: A Begginers Guide. Reston Publishing
Company. Virgnia. 304p.
CHESHIRE, P.; SHEPPARD, S. (1995). On the Price of Land and the Value of
Amenities. In: Economica. v. 62. pp. 247-267.
COCHRAN, W. G. (1953). Sampling Techniques. John Wiley & Sons.pp. 65-90.
DANTAS, R. A. (1999). Engenharia de Avaliaes Uma Introduo Metodologia
Cientfica. Editora Pini. So Paulo. 251p.
DAVIDSON, K. B. (1995). Accessibility and Isolation in Transport Network Evaluation.
In: WCTR The Seventh World Conference on Transport Research. Sydney. pp. 10-8.
DIA, H.; ROSE, G. (1995). Development of Artificial Neural Network Models for
Automated Detection of Freeway Incidents. In: WCTR The Seventh World
Conference on Transport Research. Sydney. pp. 1-21.
DRAPER, N. R.; SMITH, H. (1980). Applied Regression Analysis. John Wiley & Sons.
709 p.
DUNN, O. J.; CLARK, V. A. (1987). Applied Statistics: Analysis of Variance and
Regression. Second Edition. John Wiley & Sons. 445 p.
Nair Cristina Margarido Brondino - 140
DUARTE, A. M.; GABBAY, A. (1995). Avaliao em Massa: Modelos Genricos de
Valores Integrados a um Sistema de Informaes Geogrficas - SIG. In: VIII
COBREAP - Congresso Brasileiro de Engenharia de Avaliaes e Percias,
Florianpolis. Anais... Florianpolis, 1995. pp. 237-240.
FALAS, T. (1995). Neural Networks in Empirical Accounting Research: An Alternative
to Statistical Models. In: Neural Network World, v. 5, n. 4. pp. 419-432.
FERRAZ, A. C. P. (1990). Por um Imposto Sobre os Terrenos Urbanos Ociosos. Folha de
So Paulo. So Paulo, 26 de jan. cad. B, p.2.
FERRAZ, A. C. P.; SILVA, A. N. R. (1990). Reforma Urbana J. Folha de So Paulo.
So Paulo, 01 de mai. cad. C, p.5.
FERRAZ, A. C. P.; SILVA, A. N. R. (1992). Tributao Justa de Propriedade. Folha de
So Paulo. So Paulo, 24 de set. cad. 3, p.5.
FERRARI, R. (1996). Cenrios Alternativos para o Uso de GIS em Municpios. GIS
BRASIL 96. Curitiba. Anais ... Curitiba, 1996. Mdulo Municipal. pp.17-23.
FIKER, J. (1989). Manual de Redao de Laudos. Editora Pini. So Paulo. 119 p.
FIKER, J. (1993). Avaliao de Imveis Urbanos. Quinta Edio. Editora Pini. So Paulo.
104 p.
FLITMAN, A. M. (1997). Towards Analyzing Student Failures: Neural Networks
Compared with Regression Analysis and Multiple Discriminant Analysis. In:
Computers & Operations Research, v. 24, n. 4. pp. 367-377.
FORREST, D.; GLEN, J.; WARD, R. (1996). The Impact of a Ligth Rail System on the
Structure of House Prices A Hedonic Longitudinal Study. In: Journal of Transport
Economics & Policy, v. 30, n.1. pp. 15-29.
GIBB, K. (1994). Before and After Deregulation: Market Renting in Glasgow and
Edinburgh. In: Urban Studies, v. 31, n. 9 pp. 1481-1495.
GONALVES, M. F. R.. (1988). O Imposto Predial e Territorial Urbano e a
Progressividade. In: Revista de Administrao Municipal. Rio de Janeiro, v. 35, n.189.
pp. 6-14, out./dez.
GONALVES, M. F. dos R. (1990). IPTU: Alcance dos Princpios da Legalidade e da
Anualidade. In: Revista de Administrao Municipal. Rio de Janeiro, v. 37, n. 197. pp.
54-61, out./dez.
GONZLEZ, M. A. S. (1995) Plantas de Valores Inferenciais: A Espacialidade
Considerada Atravs de Trend Surfaces. In: VIII COBREAP - Congresso Brasileiro
de Engenharia de Avaliaes e Percias, Florianpolis. Anais... Florianpolis, 1995.
pp. 390-397.
GONZLEZ, M. A. S. (1996a). Aspectos Legais e Conceituais da Fixao de Valores do
IPTU. In: II COBRAC - Congresso Brasileiro de Cadastro Tcnico Multifinalitrio.
Florianpolis. Anais... Florianpolis 1996. pp. 123-130.
GONZLEZ, M. A. S. (1996b) Desenvolvimento de Planta de Valores com Sistemas de
Informaes Geogrficas e ITBI. In: II COBRAC - Cadastro Brasileiro de Cadastro
Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo II. pp.
225-231.
Nair Cristina Margarido Brondino - 141
GONZLEZ, M. A. S.; FORMOSO, C. T. (1994) O Emprego de Dados do ITBI Para
Atualizao de Cadastros de Valores Venais: Um Estudo de Viabilidade. In: I
COBRAC - Congresso Brasileiro de Cadastro Tcnico Multifinalitrio - Florianpolis,
1994. Anais... Florianpolis. Mdulo CTMU. pp. 154-162.
GONZLEZ, M. A. S.; FORMOSO, C. T. (1995). Integrao dos Tributos Imobilirios
Urbanos: Uma Planta de Valores Inferencial nica, Determinada com Dados do
ITBI. In: VIII COBREAP - Congresso Brasileiro de Engenharia de Avaliaes e
Percias, Florianpolis, 1995. Anais... Florianpolis, 1995, p. 326-335.
GONZLEZ, M. A. S. (1993). A Formao do Valor de Aluguis de Apartamentos
Residenciais na Cidade de Porto Alegre. Dissertao de Mestrado. Porto Alegre.
CPGEC/UFRGS.
GREENE, W. H. (1997). Econometric Analysis. Third Edition. Prentice Hall. New Jersey.
1075 p.
GUEDES, J. C. (1995). O Emprego de Inteligncia Artificial na Avaliao de Bens. In:
VIII COBREAP - Congresso Brasileiro de Engenharia de Avaliaes e Percias,
Florianpolis. Anais... Florianpolis, 1995. pp. 368-374.
GUNST, R. F.; MASON, R. L. (1980). Regression Analysis and its Application A Data
Oriented Approach. Marcel Dekker. New York. 402 p.
HADDAD, E. (1995). Using GIS to Monitor Housing Markets in So Paulo, Brazil. In:
4
th
International Conference on computers in Urban Planning and Urban Management.
Melbourne. Anais...Melbourne 1995, v.2. pp. 481-494.
HADDAD, E. (1997). Using GIS to Monitor Housing Markets in So Paulo, Brazil: Part
II. In: Proceedings of the 5
th
Conference on Computers in Urban Planning and Urban
Management, Mumbai. Anais... Mumbai, 1997, v. 1 pp. 193-203.
HAINING, R. (1995). Designing Spatial Data Analysis Modules for Geographical
Information Systems. In: FOTHERRINGHAN, S. and ROGERSON, P. Spatial
Analysis and GIS. pp. 45-63.
HARDGRAVE, B. C.; WILSON, R. L.; WALSTROM, K. A. (1994). Predicting Graduate
Students Success: A Comparison of Neural Networks and Traditional Techniques.
In: Computers & Operations Research, v. 21, n. 3. pp. 249-263.
HAYKIN, S. (1994). Neural Networks: A Comprehensive Foundation. Macmillan
College Publishing Company. pp. 1-88.
HOCHHEIM, N.; PETRY, G.; SCHERER, S. R.; SIMON, L. M.; WOLSKI, M. S. (1996)
Avaliao de Imveis Urbanos por Estatstica Inferencial e Regresso Mltipla:
Aplicao para o Centro de Florianpolis. In: II COBRAC - Cadastro Brasileiro de
Cadastro Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo
II pp. 61-69.
HSIAO, S.; STERLING, J. (1992). Use of Geographic Information System for
Transportation Data Analysis. In: Chow, J.; Litvin, D. M.; Opiela, K. S. (eds).
Microcomputers in Transportation. American Society of Civil Engineers. New York.
pp 94-102.
HUXHOLD W. E. (1991). An Introduction to Urban Geographic Information Systems.
Oxford University Press. Wisconsin. 337p.
Nair Cristina Margarido Brondino - 142
JOHNSON, R. A.; WICHERN, D. W. (1998). Applied Multivariate Statistical Analysis.
Fourth Edition. Prentice Hall. 816 p.
KIRCHNER, F. F. (1994). O Sistema Geogrfico de Informaes e o Cadastro Tcnico
Multifinalitrio. In: I COBRAC - Congresso Brasileiro de Cadastro Tcnico
Multifinalitrio. Florianpolis. Anais... Florianpolis, 1994.
KWON, O.; GOLDEN, B.; WASIL, E. (1995). Estimating the Length of the Optimal TSP
Tour: An Empirical Study Using Regression and Neural Networks. Computers &
Operations Research, v. 22, n. 10. pp. 1047-1056.
LAPOLLI, A. R. S.; DE CESARE, C. M.; LUNARDI, M. L. F.; OLIVEIRA, O. S. de;
GRANDO, P. A. (1994). Metodologia para a Determinao de Regies Homogneas
de Valorizao Imobiliria, Tendo em Vista a Gerao de Informaes Cadastrais:
O Caso do Municpio de Porto Alegre. In: I COBRAC - Congresso Brasileiro de
Cadastro Tcnico Multifinalitrio. Florianpolis. Anais... Florianpolis, 1994, Mdulo
CTMU.
LEVY, P. S.; LEMESHOW, S. (1991). Sampling of Populations-Methods and
Applications. John Wiley & Sons.
LEVIN, E. J.; WRIGHT, R. E. (1997). Speculation in the Housing Market? In: Urban
Studies, v. 34, n.9. pp. 1419-1437.
LEVINE, N. (1996). Spatial Statistics and GIS Software Tools to Quantify Spatial
Patterns. In: Journal of The American Planning Association, v. 62, n. 3. pp. 381-391.
LIM. D. (1992). The Nonneutrality of the Land Value Tax: Impacts on Urban Structure.
In: Journal of Urban Economics, v. 32. pp. 186-194.
LIPSCHULTZ, S. (1968). Linear Algebra. Schaum Publish Co. 413 p.
LONGLEY, P.; BATTY, M. (1996). Spatial Analysis: Modelling in a GIS Environment.
John Wiley & Sons. 392 p.
LONGO, C. A. (s.d.). Finanas Municipais e Ociosidade dos Terrenos na rea Urbana.
In: LONGO, C. A. & RIZZIERI, J. A. B. org. Economia urbana: custos de
urbanizao e finanas pblicas. Fundao Instituto de Pesquisas Econmicas - Srie
Relatrios de Pesquisa RP-10. So Paulo. pp. 197-232.
LONGO, C. A.; LIMA, J. C. S. (s.d.). O IPTU como Fonte de Recursos a Nvel
Municipal: Aspectos de Eficincia e Eqidade. In: LONGO, C. A. & RIZZIERI, J.
A. B., org. Economia urbana: custos de urbanizao e finanas pblicas. Fundao
Instituto de Pesquisas Econmicas - Srie Relatrios de Pesquisa RP-10. So Paulo.
pp. 233-256.
LUGER, G. F.; STUBBLEFIELD, W. A. (1989). Artificial Intelligence and the Design of
Expert Systems. The Benjamin/Cummings Publishing Company. pp. 581-584.
MEDEIROS JR., J. R.; FIKER, J. (1996). A Percia Judicial Como Redigir Laudos e
Argumentar Dialeticamente. Editora Pini. So Paulo. 138 p.
MENDONA, M. C.; SOLLERO FILHO, M. ; CURI, E.; AGUIAR, J. B.; QUEIROGA,
H. S.; MAIA, E. A.; AQUINO, R.; RESENDE, O.; CANADO, J. M. M. (1998).
Fundamentos de Avaliaes Patrimoniais e Percias de Engenharia. Editora Pini.
So Paulo. 316 p.
MLLER, L. F. C. (1995). Planta de Valores Genricos Avaliao de Imveis Para
Fins Tributrios. Sagra DC Luzzatto Editores. Porto Alegre. 79 p.
Nair Cristina Margarido Brondino - 143
MOREIRA, A. L. (1997). Princpios de Engenharia de Avaliaes. Quarta Edio.
Editora Pini. So Paulo. 504 p.
MUSSONI, L.; RINELLI, S. REITANI, G. (1996). Estimating the Accident Probability of
a Vehicular Flow by Means of an Artificial Neural Network. In: Environment and
Planning B: Planning and Design, v 23, n. 6. pp. 667-676.
NATH, R.; RAJAGOLAPALAN, B.; RYKER, R. (1997). Determining the saliency of
input variables in Neural Network Classifiers. In: Computers & Operational
Research, v. 24, n. 8. pp. 767-773.
OTTENSMANN, J. R. (1977). Urban Sprawl, Land Values and the Density of
Development. In: Land Economics, v. 53, n. 4. pp. 389-400.
PAULINO, A. A. D. D.; FREITAS, A. F; HEINECK, L. F. M. (1995) Atributos
Valorativos dos Imveis e Pesquisas Mercadolgicas: Uma Anlise de Mercado de
Florianpolis - SC. In: VIII COBREAP - Congresso Brasileiro de Engenharia de
Avaliaes e Percias. Florianpolis. Anais... Florianpolis, 1995. pp. 176-184.
PERUZZO, C. A.; LIMA JR., C. O.; RECH, J. V.; MARISCO, N. (1996) Avaliao de
Apartamentos por Inferncia Estatstica - Estudo de Caso: Balnerio de
Canasvieiras, Florianpolis - SC. In: II COBRAC - Cadastro Brasileiro de Cadastro
Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo II pp. 152-
158.
PHANG, S.; WONG, W. (1997). Government Policies and Private Housing prices in
Singapore. In: Urban Studies, v. 34, n. 11. pp. 1819-1829.
PASHA, H. A.; BUTT, M. S. (1996) Demand for Housing Attributes in Developing
Countries: A Study of Pakistan. In: Urban Studies, v. 33, n. 7. pp. 1141-1154.
PATKAR, V. N. (1997) On Integration of Analytical Techniques and GIS for Urban
Management. In: Proceedings of the 5
th
Conference on Computers in Urban Planning
and Urban Management, Mumbai. Anais... Mumbai, 1997, v. 1. pp.257-268.
PRATT, A. C. (1996). Coordinating Employment, Transport and Housing in Cities: An
Institucional Perspective. In: Urban Studies, v. 33, n. 8. pp. 1357-1375.
RAIA JR, A. A. (1995). Uma Avaliao do Modelo META para Clculo de Custos de
Transportes e Seu Uso na Tributao de Terrenos Urbanos Ociosos.. Dissertao de
Mestrado - Escola de Engenharia de So Carlos, Universidade de So Paulo. So
Carlos. 144 p.
RAIA JR, A. A.; SILVA, A. N.R.; LIMA, R. S. (1996a). Acessibilidade e Valor de
Terrenos Urbanos - O Caso da Cidade de Araraquara. In: VIII CLATPU - Congresso
Latino Americano de Transporte Pblico e Urbano. Curitiba. Anais... Curitiba 1996.
pp. VI-1 - VI-11.
RAIA JR., A. A.; SILVA, A. N. R.; LIMA, R. S. (1996b). Utilizando um SIG Para
Avaliar Nveis de Acessibilidade em Uma Cidade Mdia. In: II COBRAC - Cadastro
Brasileiro de Cadastro Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis,
1996, Tomo III. pp. 193-204.
RAIA JR., A. A.; SILVA, A. N. R. (1996). Relao Acessibilidade-Preo de Terrenos
Com o Uso de um SIG. In: CONGRESSO TCNICO-CIENTFICO DE
ENGENHARIA CIVIL. Florianpolis. Anais... Florianpolis, 1996. v. III. pp.338-348.
Nair Cristina Margarido Brondino - 144
RAIA JR. A. A. (1997). Acessibilidade e Preo do Terrenos em Cidades Mdias de um
Pas em Desenvolvimento. Exame de qualificao ao doutorado apresentado ao
Departamento de Transportes da EESC USP.
RIPLEY, B. D. (1981). Spatial Statistics. John Wiley & Sons. New York. 252 p.
ROAKES, S. L. (1996). Reconsidering Land Value Taxation The Golden Key? In:
Land Use Policy, v. 13, n. 4. pp. 261-272.
RODGHER, S. F.; FABBRI, G. T. P.; CARVALHO, A. C. P. L. F. (1997). A Utilizao de
Redes Neurais Artificiais para Classificao de Solos Tropicais. In: XI Congresso de
Pesquisa e Ensino em Transportes. Rio de Janeiro.
SALCHENBERGER, L.; VENTA, E. R.; VENTA, L. A. (1997). Using Neural Networks
to Aid the Diagnosis of Best Implant Rupture. In: Computers & Operations Research,
v. 24, n. 5. pp. 435-444.
SAMPAIO, A. C. F. (1996) Mapeamento Cadastral - Exemplos e Alternativas de
Execuo. In: II COBRAC - Congresso Brasileiro de Cadastro Tcnico
Multifinalitrio. Florianpolis. Anais... Florianpolis, Tomo III. pp. 386-392.
SCHNEIDER, V. P. (1994). Cadastro Tcnico Multifinalitrio e o Sistema Tributrio. In:
I COBRAC - Congresso Brasileiro de Cadastro Tcnico Multifinalitrio -
Florianpolis. Anais... Florianpolis 1994.
SILVA, A. N. R. (1993). O Custo do Solo Urbano Ocioso e uma Nova Sistemtica de
Tributao da Propriedade. Tese de Doutorado em Transportes, Universidade de So
Paulo. So Carlos. 137 p.
SILVA, A. N. R. (1998). Sistemas de Informao Geogrfica em Transportes. Texto
apresentado Escola de Engenharia de So Carlos para obteno do ttulo de Livre-
Docente. So Carlos. 112 p.
SILVA, A. N. R.; FERRAZ, A. C. P. (1993). Uma Nova Sistemtica de Tributao da
Propriedade Urbana. In: Revista de Administrao Municipal. IBAM - Instituto
Brasileiro de Administrao Municipal, v. 40, n. 208. pp. 51-61, jul/set.
SILVA, A. N. R; VARGAS, E. N. Z.; ITO, L. E.; CUBAS, S. I. B. (1994). O Cadastro dos
Terrenos Ociosos e a sua Importncia para uma Tributao Mais Justa da
Propriedade Urbana. In: I CONGRESSO BRASILEIRO DE CADASTRO TCNICO
MULTIFINALITRIO. Florianpolis. Anais... Florianpolis, 1994, Tomo III pp.118-
126.
SILVA, A. N. R.; MELO, J. J. O.; BRONDINO, N. C. M. (1997). Uma Introduo ao
Planejamento de Transportes com Sistemas de Informao Geogrfica. Editora da
Escola de Engenharia de So Carlos. So Carlos. 74p.
SILVA, A. N. R.; WAERDEN, P. v. (1997) Combining Simplified Models and GIS to
Estimate Urban Costs in Developing Countries. In: Proceedings of the 5
th
Conference
on Computers in Urban Planning and Urban Management, Mumbai. Anais... Mumbai,
1997, v. 1. pp. 85-96.
SILVA, A. N. R.; FERRAZ, A. C. P.; RAIA JR., A. A. (1999). Towards a Strategy to
Minimize the Negative Effects of Urban Sprawl in Brazil. In: Jenks, M. & Burgess,
R. The Compact City in Developing Countries. Routledge. Londres. (no prelo).
Nair Cristina Margarido Brondino - 145
SUBRAMANIAN, V.; HUNG, M. S.; HU, M. Y. (1993). An Experimental Evaluation of
Neural Networks for Classification. In: Computers & Operations Research, v. 20, n.
7. pp. 769-782.
TEIXEIRA, A. L. A.; MORETTI, E.; CHRISTOFOLETTI, A. (1992). Introduo aos
Sistemas de Informao Geogrfica. Edio do autor. Rio Claro.
TOLEDO, M. C. S.; DOMINGUES, R. M. (1995). Valores Unitrios Bsicos para Glebas
e Lotes no Estado de So Paulo, VII COBREAP - Congresso Brasileiro de
Engenharia de Avaliaes e Percias. Florianpolis. Anais... Florianpolis, 1995. pp.
448-456.
TRIPPI, R. R.; TURBAN, E. (1992). Neural Networks in Finance and Investing. Probus
Publishing Company. pp. 3-72.
TRIVELLONI, C. A.; LIMA JUNIOR, C. O.; RECH, J. V.; MARISCO, N. (1996).
Avaliao de apartamentos por inferncia estatstica - estudo de caso: Balnerio de
Canasvieiras, Florianpolis - SC. In: II COBRAC - Cadastro Brasileiro de Cadastro
Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo II. pp.
152-160.
TUBB, N. R. (1993). A Development Path to Success in Neural Computing. In: Expert
Systems Applications, v. 9, n. 5. pp. 5-9.
ULUACHA, N. O. (1997). The Development and Application of a Geographical
Information system (GIS) for Property Tax Administration: Experiences from
Nigeria In: Proceedings of the 5
th
Conference on Computers in Urban Planning and
Urban Management, Mumbai. Anais... Mumbai, 1997, v. 2. pp. 560-571.
VERTELO, J. B. (1996). Planta Genrica de Valores da Cidade de Governador
Valadares. In: II COBRAC - Cadastro Brasileiro de Cadastro Tcnico Multifinalitrio.
Florianpolis. Anais.... Florianpolis, 1996, Tomo II. pp. 232-243.
WONG, D. W. S.; WU, V. C. (1995). Quality of Aggregated Spatial Data A Guidance
for Decision. In: 4
th
International Conference on Computers in Urban Planning and
Urban Management. Melbourne. Anais...Melbourne 1995, v.2. pp. 559-570.
WYATT, M. D. (1994). A Critical View of Land Value Taxation as a Progressive
Strategy for Urban Revitalization, Rational Land use, and Tax Relief. In: Review of
Radical Political Economics, v. 26, n. 1. pp. 1-25.
WYATT, R. (1995). Strategy Evaluation Using Neural Networks. In: Proceedings of the
4
th
International Conference in Urban Planning and Urban Management. Melbourne,
pp. 367-378.
WYATT, R. (1996). Evaluating Strategies by Means of an Artificial Neural Network. In:
Environment and Planning B: Planning and Design, v. 23, n. 6. pp. 685-696.
WYATT, R. (1997). Consistency of Planning Style. In: Proceedings of the 5
th
Conference
on Computers in Urban Planning and Urban Management, Mumbai. Anais... Mumbai,
1997, v. 1, pp.181-192.
XU, F.; MITTELHAMMER, R. C.; BARKLEY, P. W. (1993). Measuring the
Contribuitions of Site Characteristics to the Value of Agricultural Land. In: Land
Economics, v. 69, n. 4. pp. 356-369.
YUAA, F. (1996). Estimador de Valor do Lote Urbano. GIS BRASIL 96. Curitiba.
Anais ... Curitiba, 1996. Mdulo Municipal. pp.25-39.
Nair Cristina Margarido Brondino - 146
ZANCAN, E. C.; HEINECK, L. F. (1994). Metodologia Para Execuo de Planta de
Valores Genricos: Caso de Cricima-SC. In: I COBRAC - Congresso Brasileiro de
Cadastro Tcnico Multifinalitrio. Florianpolis. Anais... Florianpolis, 1994. Mdulo
CTMU. pp. 52-59
ZANCAN, E. C. (1996). Avaliaes de Imveis em Massa Para Efeitos de Tributos
Municipais. Rocha Grfica e Editora Ltda. Florianpolis. 121p.