You are on page 1of 158

ESTUDO DA INFLUNCIA DA

ACESSIBILIDADE NO VALOR DE LOTES


URBANOS ATRAVS DO USO DE REDES
NEURAIS









NAIR CRISTINA MARGARIDO BRONDINO




Tese apresentada Escola de Engenharia de
So Carlos, da Universidade de So Paulo,
como parte dos requisitos para obteno do
ttulo de Doutor em Engenharia Civil -
Transportes.



ORIENTADOR: Prof. Assoc. Antnio Nlson
Rodrigues da Silva



So Carlos
1999





















DEDICATRIA




Ao meu marido, Odney, e aos meus filhos, Brbara e
Brunno, pela compreenso e solidariedade, pelo amor
sem cobranas e principalmente por sempre terem
entendido os meus momentos de ausncia.
Aos meus pais, Nlson e Zuleica, que nunca mediram
sacrifcios para me dar uma boa educao.
Aos meus irmos e a aqueles familiares e amigos, que sempre
torceram por mim.


AGRADECIMENTOS



FAPESP - Fundao de Amparo Pesquisa do Estado de So
Paulo, pela bolsa de estudos e todo o apoio financeiro concedido.
Ao meu orientador, Prof. Associado Antnio Nlson Rodrigues da
Silva, no s pela orientao mas tambm pela ateno, compreenso e
solidariedade dispensadas nos momentos mais difceis da realizao deste
trabalho.
Ao Departamento de Transportes, pelo financiamento e interveno
junto Prefeitura de So Carlos, por ocasio da aquisio das cpias das fichas
do cadastro da cidade.
Ao Prof. Dr. Andr C. Ponce de Leon Ferreira Camargo e ao
assessor externo da FAPESP, cujas sugestes serviram, em muito, para o
aprimoramento deste trabalho.
Ao meu marido, Odney Carlos Brondino, pela ajuda, especialmente
nas etapas de levantamento bibliogrfico e correo.
minha prima, colega de departamento e amiga, Sandra A.
Margarido Bertollo, por estar sempre disposta a ajudar no que for preciso e pelo
apoio moral.
Aos demais colegas do Departamento de Transportes e em especial:
Adelaide Figueiredo, Sandra Rodgher, Renato Lima, Archimedes A. Raia Jr.,
Eliane Viviani, Vnia Pampolha, Jnatas Melo e Elias Matsuo.
Aos funcionrios do Departamento de Transportes e em especial:
Lilian, Helosa, Anglica, Magali, Sueli, Carlos e Fio.
Enfim, agradeo a todos aqueles que, de uma forma ou de outra,
contriburam para a realizao deste trabalho.
SUMRIO

1. INTRODUO.......................................................................................................... 1
1.1. OBJETIVOS .................................................................................................. 3
1.2. MTODO....................................................................................................... 4
1.2. ESTRUTURA DO TRABALHO................................................................... 5
2. AVALIAO DE IMVEIS .................................................................................... 5
2.1. ALGUMAS CONSIDERAES SOBRE ACESSIBILIDADE E O VALOR
DO SOLO ...................................................................................................... 6
2.2. SITUAO ATUAL DA AVALIAO DE IMVEIS.............................. 9
2.3. AVALIAO COLETIVA DE IMVEIS................................................... 12
2.3.1. COLETA DE DADOS......................................................................... 14
2.3.2. METODOLOGIA APLICADA NA CONSTRUO DE UMA
PGV.................................................................................................... 15
2.3.2.1. MODELOS PREDETERMINADOS...................................... 16
2.3.2.2. MODELOS PROBABILSTICOS OU INFERENCIAIS....... 18
2.4. ALGUNS MODELOS DE AVALIAO NACIONAIS ............................. 19
2.5. EXEMPLOS DE MODELOS DE AVALIAO DE IMVEIS
ENCONTRADOS NA LITERATURA INTERNACIONAL ....................... 23
2.6. PRS E CONTRAS DOS IMPOSTOS SOBRE A PROPRIEDADE........... 28
3. REDES NEURAIS, REGRESSO LINEAR MLTIPLA E SIG............................ 30
3.1 ASPECTOS DA INTELIGNCIA ARTIFICIAL.......................................... 30
3.1.1 ANALOGIA BIOLGICA................................................................... 31
3.1.2. HISTRICO REDES NEURAIS ..................................................... 32
3.1.3. REDES NEURAIS ARTIFICIAIS ...................................................... 33
3.1.3.1. O NEURNIO ARTIFICIAL............................................... 35
3.1.3.2. TIPOS DE FUNO DE ATIVAO................................ 36
3.1.3.3. TOPOLOGIA DA REDE...................................................... 37
3.1.3.4. ALGORITMOS DE APRENDIZADO................................. 37
3.1.3.5. A REDE Multlayer Perceptron............................................. 38
3.1.3.5.1. ALGORITMO DE APRENDIZADO PARA UMA
REDE MLP.............................................................. 40
3.2. ANLISE DE REGRESSO........................................................................ 44
3.2.1. O MODELO LINEAR......................................................................... 44
3.2.1.1. SUPOSIES DO MODELO DE REGRESSO LINEAR
CLSSICO.......................................................................... 45
3.2.1.1.1. LINEARIDADE DO MODELO DE
REGRESSO........................................ 45
3.2.1.1.2. POSTO COMPLETO............................................... 46
3.2.1.1.3 VALOR ESPERADO DO DISTRBIO................... 46
3.2.1.1.4. DISTRBIOS ESFRICOS..................................... 47
3.2.1.1.5. REGRESSORES NO-ESTOCSTICOS .............. 48
3.2.1.1.6. NORMALIDADE..................................................... 48
3.2.1.2. O MTODO DOS MNIMOS QUADRADOS.................... 48
3.2.1.2.1. O VETOR DOS COEFICIENTES OBTIDO POR
MNIMOS QUADRADOS...................................... 50
3.2.1.2.1.1. TESTES DE HIPTESE E INTERVALOS DE
CONFIANA PARA O COEFICIENTE
K
.. 50
3.2.1.3. VERIFICAO DA ADEQUABILIDADE DA REGRESSO
AJUSTADA......................................................................... 52
3.2.1.4. MULTICOLINEARIDADE.................................................. 54
3.2.1.4.1. POSSVEIS SINTOMAS E ALGUMAS MEDIDAS DE
MULTICOLINEARIDADE....................................... 54
3.2.1.4.2. POSSVEIS SOLUES PARA O PROBLEMA DA
MULTICOLINEARIDADE....................................... 57
3.2.1.5. HETEROCEDASTICIDADE............................................... 58
3.2.1.6. OS EFEITOS DE INTERAO.......................................... 59
3.3. OS SISTEMAS DE INFORMAO GEOGRFICA (SIG) ....................... 60
3.3.1. HISTRICO...................................................................................... 62
3.3.2. TRATAMENTO DA INFORMAO............................................. 64
3.3.2.1. TRATAMENTO DE DADOS ALFANUMRICOS ........... 64
3.3.2.2. TRATAMENTO DOS DADOS GRFICOS....................... 65
3.3.3. ESTRUTURAS DE REPRESENTAO DO ESPAO
GEOGRFICO................................................................................ 66
3.3.4. DIFERENAS ENTRE OS SIGs E O CAD.................................... 68
3.3.5. SITUAO ATUAL DO USO DE SIG NA AVALIAO
IMOBILIRIA................................................................................ 69
3. 3. 6. ESTUDOS PRELIMINARES SOBRE ESTATSTICA
ESPACIAL.................................................................................... 70
4. METODOLOGIA....................................................................................................... 73
4.1. A CIDADE DE ARAARIGUAMA............................................................ 76
4.1.1 COLETA DE DADOS ...................................................................... 77
4.2 A CIDADE DE SO CARLOS...................................................................... 79
4.2.1 COLETA DE DADOS ...................................................................... 79
4.2.1.1. DIMENSIONAMENTO DA AMOSTRA............................ 82
5. RESULTADOS .......................................................................................................... 88
5.1. ESTUDO DE CASO: ARAARIGUAMA................................................... 88
5.1.1. MODELO DE REGRESSO PARA A CIDADE DE
ARAARIGUAMA............................................................................. 88
5.1.2. REDES NEURAIS PARA A CIDADE DEARAARIGUAMA........ 95
5.1.3. COMPARAO DOS RESULTADOS OBTIDOS PELOS DOIS
MTODOS PARA A CIDADE DE ARAARIGUAMA................. 97
5.2. ESTUDO DE CASO: SO CARLOS........................................................... 104
5.2.1. MODELO DE REGRESSO PARA A CIDADE
DE SO CARLOS............................................................................... 104
5.2.2. APLICAO DAS REDES NEURAIS ARTIFICIAIS PARA SO
CARLOS .............................................................................................. 112
5.2.3. COMPARAO DOS RESULTADOS OBTIDOS PELOS DOIS
MTODOS PARA A CIDADE DE SO CARLOS ........................... 115
5.3. AVALIAO DO DESEMPENHO DAS REDES NEURAIS .................... 122
6. CONCLUSES.......................................................................................................... 132
7. BIBLIOGRAFIA........................................................................................................ 138

LISTA DE FIGURAS


Figura 2.1 - Queda nos preos de residncias e terrenos obtida pelo estudo de
ABELSON (1997)..................................................................................... 25
Figura 3.1 - Modelo no linear de um neurnio............................................................. 35
Figura 3.2 - Comportamento de classificao de dois padres de uma rede com uma
camada intermediria ................................................................................ 39
Figura 3.3 - Topologia de uma rede multlayer perceptron com uma camada
intermediria.............................................................................................. 40
Figura 3.4 - Diagrama esquemtico do treinamento de uma rede MLP........................ 43
Figura 3.5 - Diagrama esquemtico da fase de teste de uma rede MLP ....................... 44
Figura 3.6 Regresses amostral e populacional ......................................................... 49
Figura 3.7 Diagrama esquemtico de um SIG............................................................ 66
Figura 3.8 Modelo matricial ou raster ....................................................................... 67
Figura 3.9 Modelo vetorial ......................................................................................... 68
Figura 4.1 - Distribuio espacial dos lotes pesquisados na cidade de Araariguama . 78
Figura 4.2 - Distribuio espacial dos lotes pesquisados na cidade de So Carlos....... 87
Figura 5.1 -Erros relativos obtidos para os dois mtodos e o primeiro conjunto
de dados para a cidade de Araariguama .................................................. 98
Figura 5.2 - Erros relativos obtidos para os dois mtodos e o segundo conjunto
de dados para a cidade de Araariguama. ................................................. 98
Figura 5.3 - Erros relativos obtidos para os dois mtodos e o terceiro conjunto
de dados para a cidade de Araariguama .................................................. 99
Figura 5.4 Distribuio espacial dos erros para o modelo de regresso e o
primeiro grupo de dados de Araariguama ............................................... 101
Figura 5.5 Distribuio espacial dos erros para as RN e o primeiro grupo de
dados de Araariguama. ............................................................................ 101
Figura 5.6 Distribuio espacial dos erros para o modelo de regresso e o
segundo grupo de dados de Araariguama................................................ 102
Figura 5.7 Distribuio espacial dos erros para as RN e o segundo grupo de
dados de Araariguama ............................................................................. 102
Figura 5.8 Distribuio espacial dos erros para o modelo de regresso e o
terceiro grupo de dados de Araariguama................................................. 103
Figura 5.9 Distribuio espacial dos erros para as RN e o terceiro grupo de
dados de Araariguama ............................................................................. 103
Figura 5.10 - Erros relativos obtidos para os dois mtodos e o primeiro conjunto
de dados para a cidade de So Carlos ....................................................... 116
Figura 5.11 - Erros relativos obtidos para os dois mtodos e o segundo conjunto
de dados para a cidade de So Carlos ....................................................... 116
Figura 5.12 - Erros relativos obtidos para os dois mtodos e o terceiro conjunto
de dados para a cidade de So Carlos ....................................................... 117
Figura 5.13 - Distribuio espacial dos erros para o modelo de regresso e o
primeiro grupo de dados de So Carlos .................................................... 119
Figura 5.14 - Distribuio espacial dos erros para as RN e o primeiro grupo de
dados de So Carlos .................................................................................. 119
Figura 5.15 - Distribuio espacial dos erros para o modelo de regresso e o
segundo grupo de dados de So Carlos..................................................... 120
Figura 5.16 - Distribuio espacial dos erros para as RN e o segundo grupo de
dados de So Carlos .................................................................................. 120
Figura 5.17 - Distribuio espacial dos erros para o modelo de regresso e o
terceiro grupo de dados de So Carlos...................................................... 121
Figura 5.18 - Distribuio espacial dos erros para as RN e o terceiro grupo de
dados de So Carlos .................................................................................. 121
Figura 5.19 - Erros relativos obtidos pelas RN para o m
2
e o preo total do lote
para o primeiro conjunto de dados e a cidade de Araariguama............... 127
Figura 5.20 - Erros relativos obtidos pelas RN para o m
2
e o preo total do lote
para o segundo conjunto de dados e a cidade de Araariguama ............... 128
Figura 5.21 - Erros relativos obtidos pelas RN para o m
2
e o preo total do lote
para o terceiro conjunto de dados e a cidade de Araariguama ................ 128
Figura 5.22 - Erros relativos obtidos pelas RN para o m
2
e o preo total do lote
para o primeiro conjunto de dados e a cidade de So Carlos.................... 128
Figura 5.23 - Erros relativos obtidos pelas RN para o m
2
e o preo total do lote
para o segundo conjunto de dados e a cidade de So Carlos .................... 129
Figura 5.24 - Erros relativos obtidos pelas RN para o m
2
e o preo total do lote
para o terceiro conjunto de dados e a cidade de So Carlos ..................... 129
Figura 5.25 - Distribuio espacial dos erros obtidos para as RN e o primeiro
grupo de dados de So Carlos quando o valor total do lote foi
utilizado..................................................................................................... 130
Figura 5.26 - Distribuio espacial dos erros obtidos para as RN e o segundo
grupo de dados de So Carlos quando o valor total do lote foi
utilizado..................................................................................................... 131
Figura 5.27 - Distribuio espacial dos erros obtidos para as RN e o terceiro
grupo de dados de So Carlos quando o valor total do lote foi
utilizado..................................................................................................... 131
LISTA DE TABELAS

Tabela 3.1 - Tabela de Anlise de Varincia ...................................................................53
Tabela 4.1 - Classificao dos bairros da cidade de So Carlos pela classe de
preo A.........................................................................................................83
Tabela 4.2 - Classificao dos bairros da cidade de So Carlos pela classe de
preo B.........................................................................................................83
Tabela 4.3 - Classificao dos bairros da cidade de So Carlos pela classe de
preo C.........................................................................................................84
Tabela 4.4 - Caractersticas das categorias ......................................................................86
Tabela 5.1 - Melhores modelos de regresso ajustados, considerando o preo
por m
2
para a cidade de Araariguama ........................................................90
Tabela 5.2 - Valores de ij obtidos para as colunas da matriz X'X para
Araariguama...............................................................................................91
Tabela 5.3 - Valores dos
R
obtidos para cada par de variveis para a cidade de
Araariguama...............................................................................................91
2
ij
Tabela 5.4 - Modelo de Regresso Ridge obtido para Araariguama utilizando o
valor do m
2
como varivel dependente........................................................92
Tabela 5.5 - Modelo de Regresso obtido para Araariguama utilizando o valor
do m
2
como varivel dependente aps a retirada da varivel
ln(testada).....................................................................................................93
Tabela 5.6 - Resultados das melhores simulaes, usando todas as variveis
para a cidade de Araariguama....................................................................96
Tabela 5.7 - Relevncia de cada varivel para a cidade de Araariguama ......................96
Tabela 5.8 - Erros e R
2
obtidos para os dois modelos e os trs conjuntos de
dados para Araariguama.............................................................................97
Tabela 5.9 - Proporo de erros relativos nos clusters encontrados com os dois
modelos para os trs conjuntos de dados para Araariguama .....................100
Tabela 5.10 - Melhores modelos de regresso ajustados, considerando o preo/m
2

para So Carlos ............................................................................................107
Tabela 5.11 - Valores de ij obtidos para as colunas da matriz X'X para So
Carlos ...........................................................................................................108
Tabela 5.12 - Valores dos obtidos para cada par de variveis para a cidade de
So Carlos ....................................................................................................109
2
ij
R
Tabela 5.13 - Modelo de Regresso Ridge obtido para So Carlos utilizando o
valor do m
2
como varivel dependente........................................................110
Tabela 5.14 - Modelo de Regresso obtido para So Carlos utilizando o valor do
m
2
como varivel dependente aps a retirada das variveis testada,
calada, edificao e gua............................................................................110
Tabela 5.15 - Resultados das melhores simulaes, usando todas as variveis e o
preo do m
2
para So Carlos........................................................................112
Tabela 5.16 - Resultados das melhores simulaes, usando todas as variveis e o
ln do preo do m
2
para So Carlos...............................................................113
Tabela 5.17 - Relevncia de cada varivel para a cidade de So Carlos ...........................114
Tabela 5.18 - Erros e R
2
obtidos para os dois modelos e os trs conjuntos de
dados para So Carlos..................................................................................115
Tabela 5.19 - Proporo de erros relativos nos clusters encontrados com os dois
modelos para os trs conjuntos de dados para So Carlos...........................118
Tabela 5.20 - Resultados obtidos pelas Redes Neurais quando o valor total do
terreno foi utilizado como sada para a cidade de Araariguama................123
Tabela 5.21 - Relevncia de cada varivel para a cidade de Araariguama quando
o preo total do terreno foi utilizado............................................................124
Tabela 5.22 - Resultados obtidos pelas Redes Neurais quando o valor total do
terreno foi utilizado como sada para a cidade de So Carlos .....................124
Tabela 5.23 - Relevncia de cada varivel para a cidade de So Carlos, quando o
preo total do terreno foi considerando .......................................................126


RESUMO

Um dos problemas freqentes em modelos de avaliao de imveis identificar quais
de suas caractersticas devem ser levadas em considerao e o quanto cada uma destas
influencia no valor final das propriedades. Alm disso, necessrio um critrio de
avaliao bem estruturado, baseado em modelagem matemtica adequada. A partir das
constataes acima, foram estabelecidos os objetivos deste trabalho: aps identificar as
principais variveis que interferem no valor das propriedades, avaliar o uso de Redes
Neurais Artificiais para fins de avaliao e estudar a influncia de uma medida de
acessibilidade no valor de terrenos urbanos.
Quanto s variveis a serem empregadas nos modelos de avaliao, chegou-se a
concluso que um banco de dados misto, onde tanto variveis de natureza espacial
quanto fsica pudessem ser includas, parecia ser uma opo interessante. Desta forma,
aps a incluso no banco de dados de uma varivel de natureza espacial, a distncia ao
centro da cidade, este trabalho comparou dois mtodos de avaliao: as Redes Neurais
Artificiais e o modelo de regresso mltipla, este ltimo muito usado na prtica. Foram
abordados dois estudos de caso, as cidades de Araariguama e So Carlos. A primeira
uma cidade dormitrio, de pequeno porte (cerca de 6000 habitantes), localizada nas
proximidades da capital do estado, So Paulo. A segunda, por sua vez, uma cidade de
porte mdio (cerca de 160000 habitantes), localizada no centro do estado e plo
industrial e tecnolgico. A escolha destas cidades ofereceu a oportunidade de estudar a
influncia de uma varivel como a acessibilidade em contextos diferentes.
Os resultados obtidos para Araariguama indicaram que a medida de acessibilidade
empregada, distncia ao centro, era uma das variveis mais importantes na formao do
preo de propriedades. Quanto aos resultados obtidos pelos modelos empregados, pde-
se observar que, ao utilizar regresso mltipla, o efeito da varivel distncia ao centro
no pode ser estudado sozinho, pois esta varivel interage com a rea. A utilizao de
Redes Neurais, por sua vez, tambm forneceu estimativas adequadas de valor,
verificando-se atravs dela que a acessibilidade apresentou um peso superior a 34% no
valor final. Ao se comparar os dois mtodos pode-se observar que as Redes Neurais
(RN) demonstraram um desempenho superior, quando este foi avaliado pelo valor do
erro relativo total. Com o objetivo de analisar a distribuio espacial dos erros, estes
foram agrupados em cinco clusters, podendo-se constatar que os maiores erros
fornecidos pelas RN se concentraram em um nico bairro.
Na anlise para So Carlos pde-se verificar tambm, atravs dos resultados obtidos por
ambos os mtodos, que a distncia ao centro foi um dos fatores preponderantes na
avaliao dos imveis. A anlise da distribuio espacial dos erros apontou uma
concentrao de erros maiores em um dos bairros, o que pde ser observado para os
dois mtodos empregados e dois dos trs conjuntos de dados. Um fato que chamou a
ateno foi o de que para Araariguama, que uma cidade de porte menor, a
importncia relativa da varivel acessibilidade foi maior que para a outra cidade.



ABSTRACT

A common problem in the use of land valuation models is the identification of the real
estate features that should be incorporated in the models and how they influence the
final property price. In addition, a well structured approach based in consistent
mathematical models is also required. Based on the aforementioned assertions, the
following objectives have been drawn for this work: after identifying the main variables
that have a strong influence on land values, the use of Artificial Neural Networks
(ANN) for land valuation have be tested and the influence of an accessibility measure
on urban land values have been studied.
Regarding the variables that should been part of the valuation models, we reached the
conclusion that a mixed database containing physical and spatial attributes seemed to be
an interesting option for this sort of problem. Therefore, after the addition of a spatial
variable, the distance to the city center, to our database, two valuation methods have
been compared: the ANN approach and a multiple regression model, the latter quite
common in practice. Two case studies have been then analyzed: the cities of
Araariguama and So Carlos. The first one is a small bedroom town (around 6,000
inhabitants) not far from the state capital, the city of So Paulo. The second one is a
medium-sized city (around 160,000 inhabitants) located in the middle of the state and a
technological and industrial center. The particularities of these two cities made possible
a comparison of the influence that such a variable as accessibility could have on the
land values under two different conditions.
The results obtained for the city of Araariguama indicated that the accessibility
measure used, the distance from the city center, was one of the main variables
influencing land prices. Although both models gave good estimates, their results were
not exactly the same. While the influence of the variable distance to the city center
could not be individually taken in the multiple regression model, because of its
interaction with the variable area, the same variable has a strong weight on the ANN
model, in which it appears as responsible for over 34% of the land value. The ANN
performed better in a direct comparison of the two approaches, specially when looking
to the total relative error. With the purpose of analyzing the spatial distribution of the
estimation errors, they have been grouped into clusters, which have stressed that the
worst cases are concentrated in a specific area of the city.
Both methods showed that the distance to the city center has a strong influence on land
values also in the city of So Carlos. The highest estimation errors were also
concentrated in a specific neighborhood for two out of three data sets in both valuation
methods. Another interesting outcome is the fact that the relative weight of the
accessibility variable used was higher in Araariguama than in So Carlos, although the
former city is smaller than the latter.

Nair Cristina Margarido Brondino - 1





1. INTRODUO


Atualmente, a forma pela qual os impostos sobre a propriedade imvel
urbana devem ser cobrados uma matria de grande discusso (FERRAZ &
SILVA, 1990; GONALVES,1988; GONALVES, 1990; LONGO, s. d.; LONGO
& LIMA, s.d.).
Em certa medida, o processo de avaliao de um imvel para fins de
tributao semelhante ao processo de avaliao para fins de negociao (compra e
venda). No primeiro caso, no entanto, em muitas cidades brasileiras o imposto
quantificado pela medida da rea e localizao da propriedade urbana, ignorando-se
outros fatores tais como: acesso aos meios de transporte, condies da construo,
infra-estrutura urbana, renda familiar etc. Com o objetivo de suprir esta lacuna, tm
sido elaboradas propostas (FERRAZ, 1990; FERRAZ & SILVA, 1992; RAIA JR.,
1995; SILVA, 1993; SILVA, 1998) de cobrana de impostos com o intuito de criar
uma sistemtica de tributao mais justa da propriedade urbana, onde a valorizao
de terras ociosas devido acessibilidade aos meios de transporte e infra-estrutura
levada a terras mais distantes deve ser levada em conta.
O tipo de varivel a ser empregada nos modelos um dos problemas
em modelos de avaliao. Quais caractersticas devem ser levadas em considerao
e o quanto cada uma destas influencia o valor final das propriedades so problemas
freqentes.
Desta forma, alm de variveis fsicas, selecionadas de acordo com
modelos encontrados na bibliografia revisada, uma varivel de natureza espacial, a
acessibilidade, tambm ser includa nos modelos de avaliao com o objetivo de
Nair Cristina Margarido Brondino - 2
medir o impacto que esta pode causar nos preos de terrenos localizados em duas
cidades com diferentes contextos regionais. Alm de medir a influncia da
acessibilidade na valorizao de imveis urbanos, este trabalho pode servir como
um auxiliar no processo de avaliao de propriedades urbanas, o que poderia ser de
grande valia tanto para os rgos pblicos (no que diz respeito cobrana de
impostos) quanto para o setor privado.
Porm, a escolha adequada de variveis no o nico problema na
avaliao de imveis, pois tambm necessrio um critrio de avaliao bem
estruturado, baseado em modelagem matemtica adequada. Embora vrios modelos
de avaliao tenham sido propostos, a maioria das prefeituras brasileiras ainda
baseia seus mtodos de avaliao para cobrana de tributos em Plantas Genricas de
Valores (PGV), o que pode acarretar distores e impostos cobrados injustamente
quando sua construo e/ou atualizao no so feitas de maneira adequada. Pelo
sistema de cobrana vigente em muitas cidades, duas propriedades situadas no
mesmo setor da planta, uma prxima do centro comercial do bairro, por exemplo, e
a outra localizada mais distante, podem pagar o mesmo valor de imposto territorial.
Entre estes casos, inclui-se a cidade de So Carlos, um dos objetos de estudo deste
trabalho, cuja PGV no sofreu reformulao durante muitos anos, perodo em que a
avaliao de terrenos com fins de tributao se dava apenas por atualizaes
monetrias.
Dentre os critrios de modelagem matemtica utilizados para
avaliao imobiliria, pode-se citar alguns mtodos estatsticos. Embora eficientes,
desde que utilizados por pessoal capacitado, em geral, eles podem estar
comprometidos por vrios fatores, como por exemplo: complexidade dos modelos,
dificuldade de implementao, excesso de variveis envolvidas e desconhecimento
da relao entre estas variveis. Incluem-se aqui, os modelos de Regresso Linear
Mltipla, onde descontinuidades e no linearidades podem destruir a eficcia de
toda uma anlise.
Por outro lado, a escolha de Redes Neurais para o estudo destas
estimativas, apresenta, dentre outras vantagens: a prpria rede desenvolve as
relaes entre as variveis, h tolerncia no que diz respeito a erros ou distrbios de
Nair Cristina Margarido Brondino - 3
entrada (pela sua arquitetura, a prpria rede capaz de proporcionar uma sada
correta para uma entrada deste tipo), alm da no necessidade de determinadas
condies impostas pelos mtodos estatsticos.
Uma Rede Neural baseada na estrutura biolgica do crebro humano
atravs de uma analogia com os neurnios e tem como objetivo fornecer subsdios
para que o computador "pense" sozinho e, a partir de um conjunto de situaes
conhecidas, tome determinadas decises. Baseados nesses conhecimentos, cientistas
procuraram desenvolver esquemas que possibilitassem a "construo" de neurnios
artificiais, a fim de que estes pudessem efetuar diversas tarefas, tais como
reconhecer imagens, aprender e memorizar associaes. Para que o aprendizado
ocorra preciso que a rede seja treinada com situaes conhecidas. A partir da, ela
"cruzar" estas informaes que recebeu e ser capaz de fornecer determinadas
respostas.
Dentre as propriedades de um sistema neural, pode-se citar ainda a
convergncia, que diz respeito capacidade da rede de aprender um determinado
conjunto de dados definido no procedimento de treinamento e a generalizao, que
diz respeito habilidade da rede de reconhecer certos padres.
Atualmente, as Redes Neurais Artificiais (ANN) vm sendo aplicadas
nos mais diversos campos e em grande parte dos casos estudados tm apresentado
resultados bastante favorveis. Entre os campos de aplicao desta tcnica, pode-se
citar a medicina (SALCHENBERGER et al, 1997), a engenharia de transportes
(DIA & ROSE, 1995; BIELLI & REVERBERI, 1996 e MUSSONI et al., 1996,
RODGHER et al., 1997), a pesquisa operacional (KWON et al., 1995) e a educao
(HARDGRAVE et al., 1994; FLITMAN, 1997), planejamento (WYATT, 1995,
1996 e 1997).

1.1. OBJETIVOS

Diante do que se exps, o presente trabalho visa:

Nair Cristina Margarido Brondino - 4
Identificar as variveis que interferem na formao de valor das
propriedades;
Avaliar o uso de Redes Neurais Artificiais para fins de avaliao e
Estudar a influncia de uma medida de acessibilidade no valor de
terrenos urbanos.

1.2. MTODO

Para atingir os objetivos deste trabalho, os seguintes
procedimentos sero adotados:

i. Reviso bibliogrfica relativa atual situao da avaliao
imobiliria nacional e internacional, no que tange a variveis mais
empregadas e mtodos;
ii. Reviso bibliogrfica sobre Redes Neurais, Regresso e Sistemas
de Informao Geogrfica, ferramentas que sero utilizadas para
este estudo;
iii. Com base nas variveis mais utilizadas na literatura (item i.),
executar a coleta de dados;
iv. Estimar os valores imobilirios e os erros obtidos, utilizando
Regresso Mltipla e Redes Neurais;
v. Verificar o peso de cada varivel, em especial da acessibilidade, no
valor estimado final para a Regresso;
vi. Verificar a possibilidade de utilizar Redes Neurais para avaliar o
impacto de cada varivel, em especial da acessibilidade, no valor
estimado final;
vii. Comparar os resultados fornecidos por ambos os mtodos, numrica
e espacialmente.
Nair Cristina Margarido Brondino - 5
1.3. ESTRUTURA DO TRABALHO

Para alcanar os objetivos almejados, este trabalho se divide em cinco
captulos, alm desta introduo, o primeiro dos quais se inicia com um
levantamento bibliogrfico. Nele, a atual situao da avaliao de imveis no Brasil
comentada. Na seqncia, alguns aspectos da avaliao coletiva de imveis sero
apresentados, assim como alguns modelos de avaliao nacionais e internacionais,
acompanhados das respectivas variveis envolvidas. O captulo finaliza comentando
aspectos relativos cobrana de impostos sobre a propriedade imobiliria sob o
ponto de vista de diferentes autores.
No terceiro captulo ser feita uma introduo evoluo da
Inteligncia Artificial, relativa, principalmente, rea de Redes Neurais. A nfase
ser no modelo empregado neste trabalho, ou seja, a Rede Multlayer Perceptron. O
captulo continua apresentando um resumo sobre Regresso Mltipla, que foi a
tcnica utilizada para a comparao dos resultados. Finalizando este captulo,
alguns comentrios sobre os Sistemas de Informao Geogrfica, cuja ferramentas
foram utilizadas neste trabalho para tratar cada propriedade de forma diferenciada,
sero traados.
O quarto captulo refere-se metodologia aplicada. Neste item, sero
explicados os procedimentos adotados no decorrer desta pesquisa. Haver tambm
uma descrio dos objetos de estudo e da forma de coleta de dados empregada.
Na seqncia, o quinto captulo consta de dois estudos de caso, onde
os resultados obtidos do emprego das duas tcnicas sero apresentados. Finalmente,
o sexto captulo apresenta algumas concluses, seguido pelas referncias
bibliogrficas utilizadas na pesquisa.
Nair Cristina Margarido Brondino - 6





2. AVALIAO DE IMVEIS


Este captulo inicia com uma considerao sobre a acessibilidade e
o valor do solo, do ponto de vista da teoria econmica. A segunda
parte destinada a um breve levantamento da situao da avaliao
de imveis atualmente em vigor no Brasil. Numa prxima etapa,
alguns aspectos da avaliao coletiva de imveis sero discutidos.
As duas sees posteriores mostram alguns modelos utilizados por
autores nacionais e internacionais, que incluem tanto variveis de
carter fsico quanto espacial. Finalizando o captulo, aspectos da
taxao sobre o valor das propriedades sob o ponto de vista de
diferentes autores sero brevemente discutidos.

2.1. ALGUMAS CONSIDERAES SOBRE
ACESSIBILIDADE E O VALOR DO SOLO

Antes de comentar a relao entre a acessibilidade e o preo do solo,
algumas consideraes tericas com respeito evoluo histrica do valor da terra
devem ser feitas. RAIA JR. (1997), com base no texto de NIGRIELLO (1977)
1
,
aborda a histria da teoria do valor, classificando-a segundo o ponto de vista das
escolas clssica, marginalista e marxista.
A teoria clssica considera que o valor do solo resultante, de forma
indireta, do rendimento que o solo pode propiciar por meio de seu cultivo. Este

1
NIGRIELLO, A. 1977. O valor do solo e sua relao com a acessibilidade. So Paulo. 238p. Dissertao
(mestrado) COPPE, Universidade Federal do Rio de Janeiro.
Nair Cristina Margarido Brondino - 7
rendimento dado, de maneira indireta, pela diferena entre o montante percebido
com a venda dos produtos agrcolas e o investimento realizado na produo dos
mesmos. Devido ao quadro social e econmico da poca em questo, os pensadores
desta teoria deram maior nfase renda do solo rural pois a renda do solo urbano
era, at ento, pouco significativa. Porm, nesta fase, j se admitia que a localizao
da propriedade tinha influncia sobre sua renda.
A fase de transio entre as escolas clssica e marginalista iniciou-se
com pensadores que defendiam as idias de que o solo empregado em vrias
funes urbanas tambm gerava rendas.
Assim, segundo a teoria marginalista, o valor de um bem baseado
na utilidade que uma quantidade marginal deste bem possa propiciar, que no
coincide, necessariamente, com seu custo de produo. Por esta teoria, o solo o
prprio bem a ser comercializado e seu valor depende do total da renda futura que
este pode propiciar.
Numa posio intermediria entre estas duas escolas, encontram-se as
idias de pensadores como Von Thunen e Hurd. O primeiro apregoava que a renda
do solo agrcola era a diferena entre o preo final do produto no mercado e a
somatria do seu custo de produo e de transporte. O segundo, desenvolveu um
modelo onde se conclua que medida em que a rea urbana se amplia, o nvel de
renda do solo localizado nas proximidades da zona central cresce, assim como as
diferenas entre o centro e a periferia.
Uma relao entre o valor do solo e os custos de transporte vem das
idias de Haig, para o qual o custo de frico, representado pelo custo de aluguel
mais o custo de transporte, no constante e varia de lugar para lugar, permitindo
afirmar que os aluguis de imveis prximos zona central so mais baixos porque
os custos de transporte tambm o so.
Do ponto de vista de Ratcliff, trs fatores influenciam o valor do solo,
a saber:
Fsicos: a imobilidade do solo no permite o deslocamento do bem de
um lugar para outro para atender demanda e sua indestrutibilidade
sempre garante a ele um valor;
Nair Cristina Margarido Brondino - 8
Localizao: so aqueles onde a localizao de diversos usos do solo
produto da concorrncia do mercado melhor emprego do solo, maior
valor. Exemplos destes fatores so o sistema de transporte, cuja
melhoria pode levar a um aumento do valor em regies onde h
melhor acessibilidade, o prestgio e as caractersticas sociais.
Regulamentao: considera as restries legais, as normas e leis de
zoneamento etc.
Wendt, embora reconhecendo que os valores dos imveis so
incrementados com a melhoria do sistema de transporte, contesta a importncia da
acessibilidade ao centro como fator principal de localizao das funes urbanas e
alega que esta deve ser considerada com relao toda regio urbana e no s com
relao rea central.
A terceira teoria, a marxista, afirma que os principais fatores
vinculados aos preos de mercado de imveis urbanos, em determinado instante,
so a acessibilidade aos centros urbanos, o nvel de renda da demanda por
determinado tipo de imvel, o coeficiente de ocupao do solo, o entorno fsico e os
servios e equipamentos locais. Assim, de acordo com estes mecanismos, se
configuram as alteraes no meio urbano, inclusive as melhorias no sistema de
transporte.
Vieille afirma que o valor do solo resultante da atividade coletiva,
ou seja, do agrupamento dinmico dos indivduos e classifica a mais valia do solo
em dois componentes: a mais valia comercial e a mais valia geral. A primeira se
concentra no centro principal, nos secundrios e onde comum a reunio de
populao e o intercmbio, afetando o valor de terrenos juntos s avenidas e ruas
que cruzam estes centros e desfrutada pelos proprietrios de terrenos e
comerciantes. A segunda refere-se rea mais perifrica e nela os valores de
terrenos representam a capitalizao das rendas relativas de localizao, que seus
proprietrios requerem em funo das condies de acesso ao centro. Desta forma,
os terrenos prximos ao centro so os mais disputados em virtude de sua localizao
e conseqentemente alcanam os valores mais elevados.
Nair Cristina Margarido Brondino - 9
Como se observa nas teorias clssicas comentadas acima, apesar da
contribuio de outros fatores econmicos e sociais, no se pode negar a
importncia da acessibilidade no valor do solo. Este fato pode ser verificado em
alguns estudos sobre avaliao realizados no s no Brasil mas tambm em outros
pases e que sero discutidos mais adiante.

2.2. SITUAO ATUAL DA AVALIAO DE IMVEIS

Uma forma precisa de estimar o valor da propriedade urbana tem sido
almejada no s pelo setor pblico, com o intuito de quantificar devidamente o
valor de seus impostos (IPTU Imposto Predial e Territorial Urbano e ITBI
Imposto Sobre Transaes de Bens Imobilirios), mas tambm pelo setor privado,
que no quer nem pagar e nem cobrar mais pelas terras que adquire ou vende.
Numa tentativa de estabelecer certas regras e critrios para avaliao,
a Associao Brasileira de Normas Tcnicas (ABNT - 1989), prope uma Norma
Brasileira para Avaliao de Imveis Urbanos, a NBR 5676. Tal norma estabelece
trs nveis distintos de rigor para a realizao de uma avaliao, com graus
crescentes de refinamento matemtico e fundamentao, resumidos a seguir:
expedito: baseado na subjetividade, no utiliza qualquer instrumento
matemtico para a estimao de valor.
de preciso: utilizao de, no mnimo, cinco dados da propriedade
para a formao do valor. O tratamento dispensado aos elementos da
amostra ... deve ser feito atravs de estatstica descritiva,
homogeneizando-se os elementos observados, quando no
perfeitamente comparveis e ... so admitidas as homogeneizaes
feitas atravs de fatores ou ponderaes empricas, porm,
consagradas, que consideram as diferenas entre os elementos de
seus atributos.
de preciso rigorosa: a avaliao deve ser feita ... atravs de
metodologia adequada, com grande iseno de subjetividade... e ...
o tratamento para alcanar a convico de valor deve ser baseado em
Nair Cristina Margarido Brondino - 10
processos de inferncia estatstica que permitam calcular estimativas
no tendenciosas de valor, estabelecendo intervalos de confiana
para elas, alm de submet-las a testes de hipteses....

A maioria dos trabalhos tcnicos publicados sobre avaliao tm
sugerido a utilizao da avaliao de preciso rigorosa (FIKER, 1993 e 1989;
MEDEIROS JR. & FIKER, 1996; MOREIRA, 1997). Em grande parte destes, a
Anlise de Regresso Mltipla utilizada como ferramenta para a estimao de
valor. Porm, embora eficientes, os modelos deste tipo esbarram em algumas
limitaes, como por exemplo, existncia de descontinuidades, desconhecimento de
relaes entre as variveis envolvidas e obedincia de suposies quanto
distribuio dos erros. Por outro lado, est crescendo o uso de modelos de
Inteligncia Artificial, em particular, Redes Neurais, em substituio a modelos
estatsticos. Dentre as reas que esto utilizando ferramentas deste tipo, pode-se
citar, por exemplo, psicologia, fonoaudiologia, pedagogia, medicina e engenharia,
inclusive na rea de transportes. Dada sua capacidade de reconhecimento e
generalizao, estes modelos reagem bem e fornecem estimativas adequadas na
existncia de rudos ou quando falta algum tipo de dado, classificando aquele
conjunto de entrada na classe em que ele melhor se enquadre. Como outra
vantagem, a rede capaz de aprender e, assim, fornecer sadas satisfatrias para
novas entradas.
Alm do nvel de rigor, a Norma NBR 5676 tambm indica variveis
formadoras de valor para a avaliao de terrenos, que so: caracterizao fsica
(relevo, solo, subsolo e ocupao); acessos, servios e melhoramentos pblicos;
utilizao atual e potencial, legal e econmica; classificao do imvel. Para
terrenos loteados, tambm devem ser consideradas as seguintes influncias: 1) rea
e profundidade e 2) frente.
Atualmente, na maioria das prefeituras brasileiras os sistemas de
avaliao so baseados em plantas de valores, que nem sempre so elaboradas de
acordo com os mtodos recomendados por especialistas no assunto. Nos casos mais
extremos, onde as plantas no foram elaboradas ou mesmo atualizadas com o
Nair Cristina Margarido Brondino - 11
devido rigor, pode acontecer de lotes situados no mesmo setor apresentarem o
mesmo valor por metro quadrado, obtido geralmente atravs de avaliao expedita,
independentemente de suas caractersticas individuais. Esta generalizao pode
provocar grandes distores de valor. Somente para exemplificar, algumas
observaes, dentre muitas, podem ser citadas com relao a situaes deste tipo:

Lotes situados a menos de 100 m um do outro e com as mesmas
caractersticas fsicas e espaciais, podem apresentar valores bastante
diferentes por estarem localizados em setores vizinhos.
Dois lotes situados no mesmo bairro, um localizado numa regio
plana e outro em um lugar cuja topografia seja irregular e, portanto,
apresentando menor valor de mercado, sero avaliados pelo mesmo
valor por metro quadrado.
O valor do metro quadrado de um bairro que recebeu um centro de
recreaes aumentou. Conseqentemente, propriedades situadas no
mesmo bairro, mas distantes de tal centro, sofrero uma
valorizao. Porm, propriedades localizadas num setor vizinho e
que estejam a uma distncia menor do mesmo centro de recreaes,
tero seus valores inalterados, embora sofram mais a influncia
deste.

Como se no bastassem os fatores j mencionados, a reavaliao
cadastral no realizada anualmente. Em lugar desta, so usados ndices genricos
de correo monetria, que no seguem o mercado imobilirio. Assim, imveis
localizados em reas que sofreram uma grande valorizao continuam pagando
menos pelos tributos incidentes sobre a propriedade. Um fator agravante para esta
situao quando a valorizao se d por conta de melhorias financiadas pelo
prprio setor pblico (pavimentao, por exemplo).
Apesar de todos os problemas mencionados, poucas pessoas tm se
dedicado a estudar a valorizao de cada propriedade de forma diferenciada. Alm
disso, em grande parte dos estudos propostos, a influncia da acessibilidade tem
Nair Cristina Margarido Brondino - 12
sido relegada a segundo plano, embora muitos autores tenham comprovado sua
importncia quando se considera a valorizao de imveis. Os poucos autores que
tem considerado alguma medida deste tipo, usam, em geral, a distncia at o centro,
o que, para cidades de porte pequeno pode ser suficiente. Por outro lado, cidades
grandes possuem bairros completamente auto-suficientes em termos de comrcio,
escolas, hospitais e at mesmo de lazer, fazendo com que a principal preocupao
dos compradores que desejem morar em determinado lugar seja a facilidade de
acesso ao local de trabalho, caso este se situe em uma regio distante. Nestes casos,
talvez seja interessante estudar tambm a acessibilidade aos meios de transporte
(por exemplo, linhas de transporte coletivo) como fator de valorizao.
Finalmente, vale observar que, neste trabalho, optou-se por trabalhar
apenas com a avaliao de terrenos, pois, alm do menor nmero de variveis
envolvidas, a coleta de dados mais rpida e fcil, principalmente quando feita in
loco. Alm disso, o que diferencia o valor de propriedades localizadas em bairros
diferentes o preo do terreno, uma vez que os gastos com a construo s
dependem do padro e so os mesmos, independentemente do lugar onde se deseja
edificar. GONZLEZ & FORMOSO (1994) concluram em um trabalho realizado
para a cidade de Porto Alegre, que o preo dos imveis modifica-se
substancialmente de acordo com sua localizao, enquanto que o custo de
construo praticamente o mesmo em todas as regies da cidade. Portanto, as
caractersticas da regio onde a propriedade se situa so uma influncia bastante
significativa no valor destas.

2.3. AVALIAO COLETIVA DE IMVEIS

As avaliaes coletivas ou em massa buscam a determinao de
valores que servem como base de clculo para fixao de impostos ou
contribuies. Antes da aplicao da metodologia para avaliao coletiva de
imveis, o cdigo tributrio do municpio deve ser estudado com ateno. Alm
disso, as regras do cdigo tributrio municipal tm que estar em conformidade com
a Constituio Federal. Este o primeiro obstculo a ser enfrentado na implantao
Nair Cristina Margarido Brondino - 13
de uma nova Planta Genrica de Valores (PGV), pois o imposto s pode ser
majorado atravs de lei, ressalvado o princpio da anterioridade (qualquer mudana
na base de clculo ou valor do tributo deve ser apresentada at o final do ano
anterior), salvo quando o valor for corrigido monetariamente atravs de decreto
(GONZLEZ, 1996a). A utilizao de correo monetria tem sido aceita
pacificamente pela Justia. Porm, o aumento do imposto acima da inflao do
perodo, o que pode ocorrer em alguns casos depois da aplicao de uma nova PGV,
tem sido considerado como uma majorao de tributos. Diante disso, antes de mais
nada, a Planta Genrica de Valores tem que ser elaborada no ano anterior ao que se
deseja aplic-la.
Dentre as vantagens da elaborao, atualizao e divulgao peridica
de uma Planta Genrica de Valores (PGV), por parte do Poder Pblico Municipal,
pode-se citar as seguintes (MLLER, 1995):

A planta serve de base para clculo dos impostos, que incidem sobre
a propriedade urbana e que so de responsabilidade das prefeituras
Municipais (IPTU e ITBI);
A redistribuio da carga fiscal permitida atravs da reduo da
diferena entre o valor fiscal e o de mercado, promovendo, desta
forma, justia social;
Auxlio no planejamento urbano, permitindo a previso de custos de
desapropriao nas obras pblicas, bem como o retorno provvel de
tais investimentos (contribuio de melhoria);
Retrata a realidade do mercado local poca da sua elaborao,
fornecendo justas bases para as transaes, reduzindo os riscos e
com eles as margens de manipulao dos consumidores pelos
agentes imobilirios.

Alm disso, a utilizao de Planta de Valores Genricos de Terrenos
permite comparar a evoluo de valores nas zonas beneficiadas pelos
melhoramentos pblicos, bem como numa faixa de segurana ao redor da referida
Nair Cristina Margarido Brondino - 14
zona, durante um perodo de observao. A anlise das avaliaes em situaes
distintas (antes e depois) das melhorias possibilita a verificao das variaes de
valor ou eventual estagnao de mercado.
Apesar de todas as vantagens apresentadas, colocar em prtica uma
nova PGV no to simples. Como j mencionado, o primeiro obstculo a Justia,
que no tem permitido reajustes acima da inflao do perodo. Porm, a correo
monetria plena, aplicada em imvel que sofreu desvalorizao ou que no se
valorizou na mesma proporo da inflao eqivale, de certa forma, a uma
majorao de tributos.

2.3.1. COLETA DE DADOS

Para a boa elaborao de uma Planta Genrica de Valores, a coleta de
dados um ponto importante a ser observado. Dentre as fontes de informao
disponveis, o ITBI (Imposto Sobre Transao de Bens Imobilirios) uma das
mais acessveis para as prefeituras. Segundo MLLER (1995), se a escolha da
fonte de dados for o valor deste imposto, alguns tipos de transao devem ser
rejeitadas: transaes entre pessoas jurdicas ou scios, doaes especialmente
entre parentes e hipotecas ou emprstimos com garantia de bens imveis e
desapropriaes.
Assim, em boa parte dos casos, considerar como verdadeiro valor da
propriedade aquele registrado em cartrio pode no ser uma deciso acertada, uma
vez que as pessoas que negociam propriedades podem, de comum acordo, registr-
las abaixo do preo da negociao, justamente para fugir do imposto. Alm disso,
nem sempre h registro de escrituras e, s vezes, h um longo perodo de tempo
entre a venda e o registro, fazendo com que o valor registrado esteja defasado em
termos financeiros.
Por outro lado, os elementos obtidos atravs da anlise de ofertas
fornecem boas bases para aferio dos preos praticados pelo mercado. As ofertas
podem ser coletadas de vrias formas, a saber: em jornais, na forma de anncios
Nair Cristina Margarido Brondino - 15
classificados; em imobilirias e/ou com corretores autnomos ou atravs de placas
afixadas nos imveis.
Quanto s variveis, MLLER (1995) sugere que para a construo
adequada de uma Planta Genrica, sejam levantadas as seguintes caractersticas dos
terrenos: localizao, dimenses e forma, aspectos fsicos (topografia, pedologia,
vrias frentes, recuos), equipamentos urbanos (gua, luz, esgotos, pavimentao,
transporte coletivo, etc.), data do negcio e fonte de informao (nmero do
registro, origem, informante, preos e condies de pagamento).
Quanto ao dimensionamento da amostra, ZANCAN (1996) sugere que
este tamanho seja determinado em funo de estudos similares. Em seu livro, ela
cita alguns tamanhos amostrais que foram utilizados para avaliao de casas e
apartamentos, segundo trabalho de GONZLEZ (1993), que utilizou 500 dados de
apartamentos para aluguel na sua dissertao de mestrado e relata o nmero de
imveis que constituem a amostra em trabalhos semelhantes:

- Kain & Quieley do ano 1970 605 imveis residenciais / aluguel
- Witte et al. do ano 1974 500 imveis/ aluguel
- Berry & Bednarz do ano 1975 275 imveis residenciais / venda
- Sunca do ano 1977 270 imveis
- Franchi do ano 1991 85 imveis residenciais / venda
- Dantas do ano 1987 50 dados sobre terrenos em Recife na dissertao
Avaliao de Glebas Inseridas na Malha Urbana

Idealmente, o tamanho da amostra deve estar relacionado com as
dimenses da cidade a ser utilizada no trabalho.

2.3.2. METODOLOGIA APLICADA NA CONSTRUO DE
UMA PGV

Para entender a construo de uma PGV, algumas definies devem
ser feitas a priori:
Nair Cristina Margarido Brondino - 16

Zonas homogneas: so as zonas urbanas que apresentam a mesma
evoluo durante um determinado perodo de tempo, manifestada no
porte e padro construtivo das edificaes, bem como pelo poder
aquisitivo de seus habitantes. Existe uma tendncia (no obrigatria)
das zonas homogneas acompanharem o zoneamento de uso e ocupao
do solo;
Curvas istimas: lugar geomtrico dos pontos de igual valor, curvas
de nveis, permitindo a visualizao de relevo de valores;
Plos de valorizao: pontos ou linhas, a partir dos quais a distribuio
de valor dentro do permetro urbano de uma cidade se faz de forma
decrescente. Quanto importncia de sua influncia nas reas vizinhas,
classificam-se em plos principais ou secundrios. Normalmente os
centros comerciais de uma cidade constituem-se em plos principais
pontuais. Nas cidades balnerias, em geral, a orla martima um plo
principal linear.

Quanto ao tipo de modelagem empregada, tem-se duas situaes: os
modelos predeterminados e os modelos inferenciais.

2.3.2.1. MODELOS PREDETERMINADOS

Por este mtodo, a homogeneizao se processa atravs de fatores de
ponderao previamente determinados que corrigem as distores entre terrenos no
que tange profundidade, topografia, pedologia, vrias frentes (esquina ou
encravamento), entre outros. O mesmo procedimento feito em relao
existncia, ou no, de equipamentos urbanos (gua, energia eltrica, pavimentao,
transporte coletivo, esgoto, entre outros), atravs de percentuais de valorizao
agregados ao terreno em cada tipo de servio pblico.
Nair Cristina Margarido Brondino - 17
O roteiro para elaborao da Planta Genrica de Valores de terrenos
aps a homogeneizao da pesquisa de mercado, tem as seguintes etapas:

1. Plotagem dos valores unitrios e plos de atrao: os valores
unitrios so plotados preliminarmente na face de quadra
correspondente sua localizao. Na mesma planta so inseridos os
plos de valorizao principais e secundrios (pontuais e lineares).
Os plos comerciais constituem-se, em geral, nos principais plos
de valorizao de uma cidade;
2. Curvas e reas istimas: pela anlise grfica das curvas istimas,
pode-se verificar a formao de reas istimas lineares ou setoriais,
que so zonas delimitadas por linhas do mesmo valor, como
acontece em alguns bairros residenciais;
3. Complementao da pesquisa: reas no atingidas e dados
discrepantes devem ser objetos de novas investigaes de mercado;
4. Discusso de valores: valores obtidos devem ser debatidos com
entidades representativas dos vrios segmentos da comunidade
imobiliria;
5. Valores unitrios finais: aps as etapas preparatrias, chega-se
Planta Genrica de Valores de terrenos, da qual so transcritos os
valores de cada testada, quadra por quadra, atravs de cdigos que
identifiquem a zona ou setor, quadra e logradouro. Estes valores
alimentam a memria do computador, quando for o caso, que os
utiliza nos clculos de valor dos terrenos.

Este tipo de modelo de construo de PGVs tem contra si o uso de
parmetros sem a estimao das suas relevncias relativas na formao de valor. Ou
seja, todos os fatores tm a mesma importncia nesta composio de valor, quando
se sabe que alguns so mais influentes que outros.
Nair Cristina Margarido Brondino - 18

2.3.2.2. MODELOS PROBABILSTICOS OU INFERENCIAIS

Nos modelos inferenciais, a determinao do valor unitrio bsico de
terrenos feita atravs do Mtodo Comparativo de Dados de Mercado, com base
em Regresses Mltiplas. O mtodo comparativo de dados de mercado , segundo a
NBR 5676:

Aquele que define o valor pela comparao com dados de mercado
assemelhados quanto s caractersticas intrnsecas e extrnsecas. As
caractersticas e os atributos dos dados pesquisados que exercem
influncia na formao dos preos e consequentemente (sic), no valor,
devem ser ponderados por homogeneizao ou por inferncia estatstica,
respeitados os nveis de rigor definidos neste norma. condio
fundamental para aplicao desse mtodo a existncia de um conjunto
de dados que possa ser tomado, estatisticamente, como amostra do
mercado imobilirio.

Sendo assim, com base nas evidncias oferecidas pelo mercado,
detectadas pela pesquisa, os valores unitrios de terreno em cada face de quadra so
inferidos por um modelo estatstico.
Na elaborao de PGV, a varivel dependente ou explicada sempre o
valor bsico unitrio do metro quadrado da face de quadra. As variveis
independentes podem ser qualitativas ou quantitativas.
Entre as quantitativas, destacam-se:
rea, testada, profundidade;
Distncia s vias principais ou plos de valorizao.
Nair Cristina Margarido Brondino - 19

Uma outra alternativa, que tambm pode ser adicionada como varivel
explicativa o ndice de aproveitamento do terreno. Um exemplo deste tipo de
ndice a cota-terreno (CT), definida como o quociente do valor do terreno pela
rea construtvel ideal.
Como variveis qualitativas mais usuais, destacam-se:
Topografia, pedologia;
Vrias frentes, esquina;
Vizinhana, utilizao;
Localizao, zoneamento (setor);
Equipamentos pblicos, urbanizao;
Data e elasticidade (oferta/transao).

A varivel data da oferta ou da transao permite calcular a
valorizao imobiliria efetiva de terrenos setorialmente ou de toda a malha urbana,
constituindo-se em um importante indicador para decises tcnicas ou polticas de
investimento no municpio.

2.4. ALGUNS MODELOS DE AVALIAO NACIONAIS

Diante de um quadro de critrios de avaliao muito pobres que no
exclusivamente brasileiro, muitos pesquisadores tm se empenhado em desenvolver
melhores mtodos de estimao do valor de imveis. Eles visam obter estimativas
cujos valores se aproximem o mximo possvel do valor real destas propriedades,
sendo que cada modelo proposto utiliza os mais diversos tipos de variveis. A
seguir so resumidos alguns destes modelos.
BORGES (1975) fez um estudo a respeito da valorizao de terrenos
e levantou alguns fatores condicionantes para o diferencial de valor dos terrenos
urbanos. Entre os principais fatores determinantes deste diferencial, ele destaca os
Nair Cristina Margarido Brondino - 20
seguintes: distribuio espacial dos centros de emprego, a organizao e tecnologia
dos sistemas de transporte, as caractersticas scio-econmicas da vizinhana, a
complementaridade de uso do solo, a densidade demogrfica, as caractersticas
topogrficas dos terrenos, as caractersticas dos lotes e a qualidade de infra-estrutura
urbana. Ele fez uma anlise econmica bastante completa da valorizao de
propriedades e props um modelo que usa acessibilidade (no caso, distncia ao
principal centro de empregos) para estudar a influncia dos custos de transportes
nesta avaliao.
GONZLEZ & FORMOSO (1994) propem o uso do ITBI (Imposto
Sobre Transaes de Bens Imobilirios) para a estimao de valores de imveis em
Porto Alegre. Neste estudo, eles utilizam as seguintes variveis independentes: ano
de transao, ms de referncia, rea construda, idade, material de construo
(madeira, alvenaria etc.), rea do terreno, testada (frente), posio do terreno na
quadra, renda da populao no bairro, distncia, presena de financiamento e ITBI.
Para o modelo de estimao do valor de casas, em funo destas variveis, foi
obtido um coeficiente de determinao igual a 0,73 e para os terrenos, um valor
igual a 0,55.
Em GONZLEZ & FORMOSO (1995) e GONZLEZ (1995), alm
do ITBI, so consideradas como variveis independentes para a avaliao de
apartamentos: rea, bairro, existncia de garagem, distncia ao centro, idade, luxo
e ms de referncia. O segundo trabalho, alm de todas as variveis mencionadas,
considera as coordenadas (longitude e latitude) do imvel. Alm destes, outros
autores trataram da avaliao de apartamentos, dentre os quais pode-se citar:
HOCHHEIM et al. (1996), PERUZZO et al. (1996), GONZLEZ (1996b),
PAULINO et al. (1995), BRANDO et al. (1995), BALARINE (1995) e ZANCAN
& HEINECK (1994).
LAPOLLI et al. (1994) propuseram modelos para estimar o valor das
propriedades para a cidade de Porto Alegre. Para tal trabalho, eles consideram uma
srie de variveis para estimar os valores de casas, apartamentos, terrenos, salas
comerciais, lojas e boxes de estacionamento. O modelo para avaliao de terrenos
considera as seguintes variveis: gua, pavimentao, topografia, plo de comrcio
Nair Cristina Margarido Brondino - 21
e de servios, zona residencial, livre (sem construo), testada, rea, data de
comercializao (ou oferta) e fonte de informao. O valor do coeficiente de
determinao obtido pelo modelo de regresso entre o preo de terrenos e as
variveis independentes mencionadas foi de 0,88.
VERTELO (1996) fez um estudo para avaliar bens imveis da cidade
de Governador Valadares. Ele desenvolveu modelos que servem para avaliar vrios
tipos de imveis: casas, barraces, condomnios horizontais e verticais, terrenos,
chcaras, galpes e garagens de edifcios. Para terrenos, as variveis independentes
consideradas foram: infra-estrutura urbana, topografia, rea, testada e setor.
YUAA (1996) fez a proposta de utilizao de um Estimador de
Valor do Lote Urbano que toma como base o valor da Planta de Valores (PV) de
Goinia, com alguns ajustes. Inicialmente, foi feita uma suavizao da transio
entre uma PV e, logo aps, vrios ndices foram determinados: SLOPE (verifica o
grau de inclinao do lote), VIZINHOS ADJACENTES (identifica o padro das
casas dos vizinhos de muro), VIZINHOS PRXIMOS (identifica o padro das
casas das redondezas do lote em questo), OCORRNCIAS POSITIVAS E
NEGATIVAS (determina a influncia de cada ocorrncia, como por exemplo,
shoppings, escolas, esgotos abertos etc., sobre o lote) e LOGRADOUROS
ESPECIAIS (verifica se o logradouro em questo tratado de forma especial em
termos de valor). Como resultado, alguns lotes apresentaram valores diferenciados
dentro da mesma PV.
RAIA JR. et al. (1996a) propuseram um modelo que estima o preo de
terrenos para a cidade de Araraquara atravs da distncia ao centro. Porm, uma
regresso simples entre os valores dos lotes e esta medida de acessibilidade
forneceu um coeficiente de determinao muito pobre (0,37), indicando a
necessidade de incluso de outras variveis no modelo.
Com o intuito de melhorar o modelo previamente citado, RAIA JR &
SILVA (1996), propuseram um novo critrio para avaliar o valor dos imveis de
Araraquara, incluindo novas medidas de acessibilidade. As medidas de
acessibilidade usadas em tal estudo foram: distncia entre o bairro onde se localiza
o imvel e o centro da cidade, distncia do imvel at o transporte coletivo, relao
Nair Cristina Margarido Brondino - 22
entre as linhas de nibus que servem o bairro e o seu sistema virio e pavimentao
do sistema virio. Uma regresso feita entre os preos dos imveis e estas medidas
apresentou resultados piores que os anteriores (coeficiente de determinao igual a
0,26).
RAIA JR. et al. (1996b) incluram o isolamento (proposto por
DAVIDSON, 1995) como uma nova medida de acessibilidade ao seu modelo.
Como conseqncia, a regresso entre todas as medidas de acessibilidade citadas
anteriormente mais o isolamento produziu uma boa melhoria dos resultados,
chegando obteno de um coeficiente de determinao igual a 0,48.
O modelo proposto por SILVA (1998) inclui outras duas medidas de
acessibilidade para estimao do valor das propriedades em Araraquara: uma
medida de acessibilidade do tipo gravitacional e a distncia mdia entre zonas. A
regresso feita entre os valores dos imveis e todas as medidas de acessibilidade
citadas forneceu uma melhoria do coeficiente de correlao (que pulou de 0.48 para
0,53). Este resultado mostrou que a acessibilidade importante para a estimao
dos preos destes imveis, porm, no suficiente.
Um outro modelo proposto por BRONDINO & SILVA (1997) faz uso
de dados armazenados em um Sistema de Informaes Geogrficas (SIG) para
avaliar propriedades na cidade de Araariguama. A partir de certas caractersticas
conhecidas (rea, benfeitorias, localizao dentro da quadra, forma, testada
principal e distncia ao centro), o valor do metro quadrado dos terrenos obtido
atravs de acrscimos ou decrscimos percentuais sobre o valor do metro quadrado
de um lote padro. O lote padro definido como aquele localizado a 500 m ou
menos do centro da cidade, situado no meio da quadra, com muro e calada, de
forma regular e testada inferior a 20 m. Como resultado, grandes propriedades que
estavam sendo subavaliadas tiveram seus valores corrigidos.
TOLEDO & DOMINGUES (1995) vo alm da rea dos municpios e
propem um modelo que avalia glebas e lotes em todo o estado de So Paulo. Para a
formulao do modelo, foram levantadas 40 variveis, sendo que as seguintes
foram consideradas estatisticamente significantes, atravs dos testes pertinentes:
populao, distncia ao centro do estado, distncia ao plo de atrao, tendncia de
Nair Cristina Margarido Brondino - 23
uso de terreno - comercial, condio (gleba ou lote), regio administrativa e ms de
referncia. O coeficiente de determinao obtido para a regresso entre o preo e as
variveis independentes foi de 0,72.
Como pde ser notado pelas referncias citadas anteriormente, os
critrios de escolha de variveis so os mais variados possveis, de acordo com
caractersticas da regio de localizao e do imvel. Na grande maioria deles h o
emprego de Anlise de Regresso Mltipla, o que j era esperado, uma vez que este
o critrio de avaliao mais usual e recomendado pela NBR 5676. Como excees
a esta regra, pode-se citar os modelos de BRONDINO & SILVA (1997) e GUEDES
(1995). Neste ltimo faz-se uso de recursos de Inteligncia Artificial para estimar o
valor de prdios comerciais no Rio de Janeiro. Neste modelo, o valor das
propriedades foi estimado a partir das seguintes variveis: nota atribuda ao padro
construtivo, idade aparente do prdio, existncia de garagem, vizinhana do bairro
de Botafogo ou no, localizao no centro ou no e valor original. Como resultado,
ele concluiu que os recursos de Inteligncia Artificial se mostraram como uma
ferramenta bastante poderosa para avaliaes.

2.5. EXEMPLOS DE MODELOS DE AVALIAO DE
IMVEIS ENCONTRADOS NA LITERATURA
INTERNACIONAL

A maior parte dos trabalhos mencionados nesta seo fez uso de
Anlise de Regresso Mltipla. Pode-se verificar tambm que, em alguns pases, a
existncia de bancos de dados antigos pde promover um estudo detalhado da
evoluo dos preos ao longo do tempo. Outro fator que deve ser mencionado que
muitos dos autores aqui citados fazem uso de modelos hednicos de preos. Este
tipo de modelo trabalha com vrias qualidades agregadas em uma nica varivel.
XU et al. (1993), que desenvolveram um estudo para avaliar propriedades rurais
utilizando modelos hednicos, atriburam este tipo de inovao aos avanos da
Anlise Multivariada e da Teoria Econmica. Segundo eles, ... Quando aplicadas
ao mercado de terra, as tcnicas hednicas assumem que uma dada parcela pode
ser identificada por uma nica classe de nveis de atributos, e o valor da parcela de
Nair Cristina Margarido Brondino - 24
terra uma agregao dos valores de seus atributos individuais. Vale ressaltar
que a influncia de cada atributo tambm pode ser identificada individualmente,
conforme pde ser observado em PASHA & BUTT (1996) em modelo de avaliao
residencial desenvolvido para o Paquisto. No trabalho citado, os nmeros de
banheiros, quartos etc. foram agregados na varivel nmero de cmodos e, aps
ajuste do modelo, a influncia de cada atributo, separadamente, pode ser estimada.
Em 1977, um estudo elaborado por OTTENSMANN verificou que a
taxa de crescimento da populao nos Estados Unidos poderia ser uma boa varivel
explicativa para a valorizao da terra. Em seu modelo, ele props que, alm da taxa
de crescimento populacional, a populao e a renda mdia tambm fossem
includas. Os resultados da regresso entre o preo e as trs variveis citadas foram
bastante satisfatrios.
AZAR et al. (1994) propuseram um modelo para identificar as terras
mais valorizadas em Beirute, atravs do uso de SIG. Em seu estudo, eles utilizaram
quatro fatores de valorizao: declividade, vista para o mar, vista para a cidade e
distncia s rodovias principais. Na impossibilidade de determinar qual mais
importante que outra, todas as variveis foram consideradas como tendo pesos
iguais. Os valores da terra foram, ento, divididos em trs classes, de acordo com o
seu padro, sendo os da classe 1 (declividade < 15
o
, alta visibilidade para o mar e
para a cidade, e distncia de 200m ou menos at as rodovias), os mais valorizados.
ABELSON (1997) estudou um modelo terico sobre valorizao de
terrenos e casas e atravs de dedues matemticas, concluiu que a distncia zona
central de negcios (Central Business District CBD) explica uma grande
porcentagem da variao dos preos. Na parte prtica deste trabalho, ele estuda o
comportamento dos preos imobilirios entre 1931 e 1989. Dentre as concluses
obtidas, salienta-se a diminuio do valor do m
2
de terrenos e residncias, de acordo
com a acessibilidade em pocas diferentes e a verificao de que, ao longo de todo
este tempo, os preos caram, geralmente exponencialmente, com a distncia ao
CBD. De maneira geral, a distncia ao CBD explicou 50% das diferenas no valor
da terra em 1931 e 1948, sendo que em 1968 esta varivel explicou 28% das
diferenas em preos. A queda nos preos de terrenos e residncias, de acordo com
Nair Cristina Margarido Brondino - 25
a distncia ao CBD, entre os anos 1931 e 1968 mostrada na Figura 2.1. Para o
primeiro perodo da dcada de 70, o autor verificou que 80% das variaes em
preos de casas foram explicadas pela distncia ao CBD e custo de transporte,
tamanho e qualidade do ambiente local. Entre 1977 e 1989, preos de residncias
tiveram uma forte relao com o acesso ao CBD, no havendo evidncia de que
melhoramentos ambientais causaram alterao significativa em termos de valor.
Para a modelagem de preos de terrenos, as seguintes variveis foram consideradas:
distncia ao CBD, melhoramentos das estradas (varivel binria, sendo o valor 1
atribudo a melhoramentos significantes e 2 para grandes melhorias) e proporo de
propriedades recebendo servios de esgoto.
0%
2%
4%
6%
8%
10%
1931 1948 1968
ANO
Q
u
e
d
a

d
o

p
r
e

o
/
K
m

p
e
r
c
o
r
r
i
d
o

a
t


o

C
B
D
residncias
terrenos

Figura 2.1 Queda nos preos de residncias e terrenos obtida pelo estudo de
ABELSON (1997).

No estudo feito por CHESHIRE & SHEPPARD (1995) desenvolvido
para verificar a valorizao de imveis nos EUA, observou-se que o preo da
propriedade no varia apenas com a acessibilidade mas, tambm, com
caractersticas da vizinhana, servios pblicos locais e outras caractersticas no
fsicas das residncias. A avaliao de residncias desenvolvida pelos autores
mostrou que o modelo de avaliao melhora substancialmente quando
caractersticas espaciais, como por exemplo, existncia de escolas nas
proximidades, so adicionadas.
LEVIN & WRIGHT (1997) utilizam sries temporais para explicar a
flutuao de preos em Londres e no Reino Unido no perodo de 1965 a 1995.
Nair Cristina Margarido Brondino - 26
Dentre as relaes observadas por eles, salienta-se uma forte relao entre preos e
renda familiar, sendo que em pocas de financiamentos e de mais alta renda, as
pessoas se dispuseram a pagar mais pelo mesmo bem. Outro fato interessante
observado que existe uma relao positiva entre o crescimento dos preos
imobilirios no passado e no futuro, principalmente para Londres. De maneira geral,
a anlise desenvolvida apresentou indcios de que a especulao , possivelmente,
um fator determinante em preos de residncias. Alm destes autores, pode-se citar
o trabalho de GIBB (1994), no qual foram desenvolvidos modelos para estimar
preos de residncias em Glasgow e Edinburgh.
FORREST et al. (1996) tambm estudaram a influncia da
acessibilidade nos valores residenciais na grande Manchester, situada no norte da
Inglaterra. Em seu trabalho, foi estudada a influncia da construo de uma linha de
metr no valor das propriedades da regio. Ao contrrio do que imaginavam, foi
constatado que propriedades muito prximas nova linha desvalorizam,
principalmente devido perturbaes, barulhos etc. De forma geral, a nova linha
no trouxe grandes modificaes nos valores residenciais situados ao longo da
mesma.
O estudo de caso apresentado por PHANG & WONG (1997) para
Singapura mostra que as taxas de juros, crescimento de renda e oferta de habitaes
no tiveram influncia significativa no valor de propriedades privadas. No estudo
em questo, eles observaram que os preos de imveis privados estavam fortemente
correlacionados com os preos de imveis pblicos. Vale ressaltar que o setor
pblico exerce uma forte influncia sobre o sistema habitacional local. Somente
para exemplificar, em 1995, 86% do conjunto de imveis residenciais do pas era
composto por casas populares.
As Redes Neurais se mostraram bastante eficientes em estudo
realizado por ALMOND et al. (1997). Em seu trabalho, algumas aproximaes
foram consideradas, utilizando uma nova forma de aprendizado, onde, inicialmente
uma rede no supervisionada usada para estabelecer classes, que serviro como
entrada para as redes convencionais. Este critrio, segundo os autores, provocou
uma melhora de 10% em relao s previses fornecidas pelo mtodo convencional.
Nair Cristina Margarido Brondino - 27
Pode-se citar ainda um modelo proposto por AOKI et al. (1994), que
consideraram o conceito de custos de transportes, que foi definido no s como
carga monetria mas tambm como stress mental e fsico sofrido dentro dos meios
de transporte de uma cidade. Estes custos foram definidos em termos de
acessibilidade. O primeiro modelo proposto, que s levou em considerao a
acessibilidade, forneceu um coeficiente de determinao de 0,79, mas no obedeceu
outras suposies do modelo de regresso. O segundo modelo incluiu as atividades
urbanas do local: zona de uso da terra (distrito comercial, residencial etc., num total
de 9 categorias), densidade (num total de 14 categorias) e tipo de uso da terra atual
(floresta, rios, etc., num total de 16 categorias). Este ltimo proporcionou uma
melhora substancial do coeficiente de correlao (0,90) e varincia dos resduos
constante. Como resultado, chegou-se concluso de que somente os custos de
transportes no so suficientes para estimar os valores das propriedades.
De maneira geral, pode-se notar que o emprego de alguma medida de
acessibilidade (geralmente a distncia ao distrito central de negcios) uma
constante nos modelos citados. Ela pode servir como uma medida do espalhamento
urbano, que cada vez mais tem preocupado avaliadores e planejadores, no s pelos
custos adicionais que ele proporciona sociedade, como tambm pela m qualidade
de vida, segregao social e problemas ecolgicos que ele pode representar. Neste
contexto, o trabalho de PRATT (1996) faz uma crtica ao problema sob vrios
aspectos. Do ponto de vista ecolgico, tem-se que, cidades espalhadas tendem a
usar mais intensamente os meios de transporte, com conseqente aumento de
poluio. A piora na qualidade de vida se d em funo do maior tempo despendido
para viajar de um local a outro, tempo este que poderia ser gasto com descanso ou
lazer. Como se no bastasse, a estrutura dos meios de transporte permite que alguns
grupos sejam melhor atendidos, dificultando o acesso a outros grupos menos
privilegiados. Pior que isso, geralmente o transporte mais acessvel a pessoas de
mais alta renda. Se o problema no apresenta soluo to imediata, uma forma de
ameniz-lo seria o emprego de alguma ferramenta eficiente, que seja capaz de
extinguir, ou caso isso no seja possvel, reduzir bastante os vazios urbanos. O
primeiro passo para isso poderia ser a implantao de uma poltica de impostos, que
Nair Cristina Margarido Brondino - 28
desmotivasse os proprietrios deste tipo de imvel a possu-los. O autor afirma que,
para tal fim, um critrio de avaliao adequado torna-se imprescindvel, uma vez
que a taxa sobre a propriedade deve ser baseada em seu valor monetrio.

2.6. PRS E CONTRAS DOS IMPOSTOS SOBRE A
PROPRIEDADE

Assim como ocorre em vrias cidades brasileiras, existem cidades e
at mesmo pases, que, de certa forma, tm sua sobrevivncia econmica garantida
atravs dos impostos sobre a propriedade. Dentre estes pases, pode-se citar o Reino
Unido, onde a maior parte da receita do Estado provm deste tipo de imposto.
Portanto, uma forma correta de avaliao imobiliria torna-se imprescindvel, uma
vez que as taxas sobre a propriedade so calculadas a partir de seu valor.
O que diferencia os bens imveis sua fixao no espao, alto valor
unitrio e a longa vida til. Sendo assim, torna-se mais simples implantar e vigiar
impostos sobre a propriedade. Alm disso, o sistema de taxao sobre o valor da
terra, a priori, pode ser pensado como ferramenta potencial para resolver problemas
como espalhamento urbano, concentrao de renda, falta de investimentos,
especulao imobiliria etc. WYATT (1994) contesta esta teoria, assegurando que
mantendo o sistema atual, incentivos como abatimentos ou incrementos de taxas so
fatores pouco importantes para atingir os padres desejados de uso da terra e
desenvolvimento econmico. Ele justifica seu ponto de vista afirmando que o
incentivo dado atravs de reduo de taxas para construes, embora traga um
pequeno efeito, no garante que reas que no precisem de estmulo tambm
atraiam investimento, muitas vezes at maiores que reas carentes. Quanto
distribuio de renda, o autor afirma que, quanto maiores as taxas cobradas, maior a
desigualdade social. Diante destes fatores, ele defende a implantao de um sistema
de imposto progressivo como nica soluo vivel para os problemas mencionados
anteriormente.
Outro trabalho que coloca em questo a importncia do uso de taxas
para baratear o preo da terra urbana apresentado por ROAKES (1996). Em seu
Nair Cristina Margarido Brondino - 29
artigo, ela contesta o uso da taxa por si s, apregoando que as taxas sobre a
propriedade devem ser separadas das taxas de melhorias.
Se por um lado, autores contestam o uso de impostos sobre a
propriedade como ferramenta de planejamento urbano, por outro, alguns deles
conseguem mostrar que a influncia causada por tais taxas no to insignificante
assim. Este o caso de LIM (1992), que usou um modelo terico para verificar a
influncia destas taxas sobre a estrutura urbana. Ele constatou que terrenos vagos,
prximos a zonas residenciais, se sofrerem majorao de tributos, tendem a ser
utilizados para fins residenciais.
O trabalho de BENTICK (1996) se situa entre os dois extremos,
afirmando que ...as taxas sobre a propriedade urbana precisam ser suplementadas
por controles de planejamento para prevenir que consumidores na periferia urbana
se mudem para a rea rural para fugir das taxas. Em seu estudo, ele concluiu que
para uma rea no desenvolvida, uma taxa que no discrimine a terra urbana da
rural, no afeta a periferia urbana, uma vez que as pessoas no sentem necessidade
de se mudar para a rea rural a fim de fugir dos impostos (caso comum nos pases
com forte dependncia do meio de transporte automvel). Por outro lado, uma taxa
discriminatria ir contrair a periferia urbana, mas, tambm reduzir a populao
urbana, exceto se ela for reforada com regulamentos para zoneamento que
previnam a mudana de pessoas para o outro lado da fronteira.
Nair Cristina Margarido Brondino - 30





3. REDES NEURAIS, REGRESSO LINEAR
MLTIPLA E SIG


A primeira seo deste captulo consta de uma introduo sobre a
Inteligncia Artificial, onde um breve histrico sobre as Redes
Neurais, com os principais nomes envolvidos no seu
desenvolvimento, ser traado. Na seqncia, o modelo de Rede
Neural a ser utilizado para o desenvolvimento deste trabalho, ou
seja, a Rede Multlayer Perceptron, ser analisado em maiores
detalhes. A prxima etapa faz uma reviso sobre a Regresso
Mltipla, que o mtodo utilizado para avaliar o desempenho das
Redes Neurais. Finalizando o captulo, outra ferramenta
amplamente utilizada neste trabalho ser apresentada: o Sistema de
Informao Geogrfica (SIG).

3.1 ASPECTOS DA INTELIGNCIA ARTIFICIAL

O desenvolvimento de sistemas inteligentes partiu da sede do ser
humano por conhecimento e do desejo de construir mquinas que executem certas
tarefas to bem quanto ele.
A arquitetura utilizada pela maioria dos computadores convencionais
compreende uma simples unidade de processamento central conectada a uma rea
de memria. O processador ento executa, de forma seqencial, um programa
Nair Cristina Margarido Brondino - 31
armazenado na memria. Portanto, este tipo de computador apenas consegue
executar as tarefas para as quais ele foi programado.
Por outro lado, os neurocomputadores buscam modelar a estrutura do
crebro humano e a maneira pela qual ele consegue processar informao. Para tal
intuito, necessria uma nova arquitetura computacional, que, assim como o
crebro humano, seja composta de um grande nmero de elementos de
processamento altamente conectados, que operem de uma maneira paralela.
O crebro humano consegue executar certas atividades muito mais
rapidamente que o computador, enquanto que outras no. Por exemplo, o
computador executa clculos numricos a uma velocidade muito superior ao
crebro, enquanto que, para a mquina, o reconhecimento de uma imagem ou de um
som muito mais lento e difcil.
HAYKIN (1994) define o crebro humano como um computador com
estrutura altamente complexa, no linear e paralela que tem a capacidade de
organizar neurnios para executar certos tipos de tarefas. este paralelismo do
crebro que garante a ele a capacidade de armazenar e representar o conhecimento
adquirido e torn-lo bastante acessvel. O paralelismo tambm o torna capaz de
processar este conhecimento simultaneamente (BEALE e JACKSON, 1990). A
forma como o crebro consegue executar certas tarefas uma incgnita, tornado
dficil a sua sintetizao. Porm, sabe-se que ele formado de muitas unidades de
processamento altamente interconectadas, os neurnios. Cada neurnio ligado a
outros milhares. E atravs do conhecimento do funcionamento destas unidades
que possvel, hoje em dia, simular, ainda que precariamente, o comportamento
cerebral.

3.1.1 ANALOGIA BIOLGICA

O crebro (humano ou animal) composto de clulas chamadas
neurnios. Estima-se que um crebro humano possua mais de 100 bilhes de
neurnios, e mais de uma centena de tipos destes. Os neurnios funcionam em
grupos, denominados redes, sendo que cada rede pode ser formada por milhares de
Nair Cristina Margarido Brondino - 32
neurnios interconectados. Portanto, o crebro pode ser visto como uma coleo de
Redes Neurais. Tanto o pensamento quanto o comportamento inteligente so
controlados pelo sistema nervoso central e pelo crebro (TRIPPI e TURBAN,
1992).
Cada neurnio formado de dendritos, ncleo e axnio. Ele uma
estrutura simples, que permite trs funes bsicas: entrada, processamento e sada
de sinais. Os dendritos so conexes atravs das quais os sinais de entrada chegam
aos neurnios. O ncleo o processador do neurnio. Ele recebe os sinais de
entrada atravs dos dendritos e os adiciona de alguma forma. Se o valor resultante
estiver acima de um certo limite, o neurnio se excita e tende a propagar o estmulo.
Caso contrrio, ele fica inibido. Os axnios servem como o canal de sada do
neurnio. Eles esto ligados aos dendritos de outros neurnios atravs das sinapses.
As sinapses no so ligaes fsicas, mas sim qumicas e temporrias, e se do
atravs de neurotransmissores.

3.1.2. HISTRICO REDES NEURAIS

Em 1943, McCulloch e Pitts propuseram um modelo de neurnio
artificial, como uma unidade de processamento simples, cuja proposta no era
copiar o neurnio verdadeiro, mas, sim, model-lo (BEALE e JACKSON, 1990). A
rede empregada por eles empregava um modelo extremamente simples de neurnio,
cada um tendo tendo tanto entradas excitatrias quando inibitrias. Quando o
nmero de entradas excitatrias excedesse o nmero de entradas inibitrias, o
neurnio sofria uma ativao e produzia uma sada igual a 1 (LUGER e
STUBBLEFIELD, 1989). O neurnio proposto no apresentava threshold (limiar),
que corresponde a um valor que determina se o neurnio vai responder ou no a
determinada entrada. Se a entrada total for menor que este limiar, o neurnio
permanece inibido. Caso contrrio, ele se excita e tende a propagar o estmulo.
Alguns anos depois, Von Newmann mostrou que, quando
redundncias eram introduzidas nas redes McCulloch-Pitts, elas poderiam continuar
funcionando normalmente apesar do mal funcionamento de elementos individuais.
Nair Cristina Margarido Brondino - 33
Este foi um resultado importante porque faz uma sugesto de como o crebro
humano continua funcionando apesar da perda de clulas nervosas ao longo de
nossa vida (LUGER e STUBBLEFIELD, 1989).
Em 1949, Hebb props uma forma de aprendizado para as Redes
Neurais, qual ele denominou aprendizado hebbiano. Por esta lei de aprendizado,
se dois neurnios esto ativos simultaneamente, a conexo entre eles deve ser
reforada (HAYKIN, 1994).
Nos anos 50, Rosenblatt adicionou thresholds aos neurnios e props
um procedimento pelo qual a rede poderia aprender, ajustando sistematicamente
seus pesos sinpticos. Esta rede foi batizada de perceptron e podia aprender
problemas simples de classificao (LUGER e STUBBLEFIELD, 1989). Porm,
este modelo era bastante limitado. Em 1969, Minsky e Papert mostraram que a rede
perceptron no era capaz de resolver o problema do ou-exclusivo, ou seja, ela s
poderia classificar padres que eram linearmente separveis.
A partir destas descobertas, houve um desaquecimento no estudo
sobre Redes Neurais, que s voltaram tona nos anos 80, quando alguns problemas
apresentados pelo perceptron passaram a ser resolvidos atravs do uso de novos
modelos. Dentre os novos modelos, pode-se citar as redes de Hopfield (BEALE &
JACKSON, 1990), a mquina de Boltzmann (HAYKIN, 1994) e as redes com
vrias camadas.

3.1.3. REDES NEURAIS ARTIFICIAIS

As Redes Neurais artificiais so baseadas em modelos abstratos do
funcionamento do crebro humano e tentam reproduzir sistemas biologicamente
realsticos.
Dentre os benefcios da computao neural, pode-se citar (TUBB,
1993):
habilidade de aprender com exemplos: os computadores neurais
tm a capacidade de aprender com a experincia, objetivando
Nair Cristina Margarido Brondino - 34
melhorar seu desempenho e se adaptar a ambientes novos e
dinmicos, diferentemente dos computadores comuns;
robustez: as Redes Neurais tem habilidade em lidar com rudos. Elas
so tolerantes falhas e podem apresentar degradao gradual, ou
seja, apesar de alguma falha no sistema, elas continuam a fornecer
respostas adequadas por um bom tempo, o que as diferencia dos
computadores convencionais, onde uma falha pode causar prejuzo
do sistema como um todo;
velocidade de processamento: como as Redes Neurais consistem de
um grande nmero de unidades de processamento operando em
paralelo, elas podem operar em velocidades considerveis em relao
aos mtodos computacionais comuns.

Alm das vantagens j mencionadas, em muitos casos e dependendo
do problema para o qual so utilizadas, o desempenho das Redes Neurais tm se
mostrado bastante superior aos mtodos estatsticos usados para o mesmo fim
(FALAS, 1995). SUBRAMANIAN et al. (1993), fizeram um estudo onde
compararam as Redes Neurais com alguns mtodos estatsticos de classificao. A
concluso a que chegaram que, em todas as circunstncias, incluindo tamanhos de
amostras pequenos e funes mais complexas, as Redes Neurais apresentaram
solues bastante superiores.
Um outro estudo, feito por KWON et al. (1995), usou modelos de
regresso mltipla e Redes Neurais para encontrar solues para o problema do
caixeiro viajante. Numa comparao dos dois mtodos, verificou que as rotas
fornecidas pelas Redes Neurais apresentaram superioridade. Ainda comparando
regresso e Redes Neurais, pode-se citar o trabalho de GUEDES (1994), que usou
modelos de regresso e Redes Neurais para fazer estimativas dos valores de
apartamentos no Rio de Janeiro, tambm obtendo melhores resultados com a
aplicao deste ltimo.
Nair Cristina Margarido Brondino - 35
3.1.3.1. O NEURNIO ARTIFICIAL

O neurnio artificial uma unidade de processamento
matematicamente simples, que recebe uma ou mais entradas e as transforma em
sadas. Cada entrada tem um peso associado, que determina sua intensidade (TUBB,
1993). A Figura 3.1, a seguir, mostra um esquema de neurnio artificial.
.
.
.
.
.
.
x
1
x
2
x
n
w
k1
w
k2
w
kn

(.)
sinais
de
entrada
pesos
sinpticos
funo
soma
funo de
ativao

k
threshold
sada
y
k
u
k

Figura 3.1 - Modelo no linear de um neurnio (HAYKIN, 1994).


possvel distinguir alguns elementos importantes no neurnio
mostrado na Figura 1:

1. as sinapses, que so caracterizadas por um peso, w, que pode
representar a sua intensidade. O papel do peso w
kj
multiplicar o
sinal x
j
na entrada da sinapse j, conectada a um neurnio k. O peso
w
kj
positivo se a sinapse associada excitatria e negativo se a
sinapse associada inibitria;
2. um somatrio, que adiciona as entradas ponderadas pelos seus pesos
respectivos, ou seja,

=
=
n
1 j
j kj k
x w u
(1)
Nair Cristina Margarido Brondino - 36
3. um limiar (threshold),
k
, que tem um papel determinante na sada
do neurnio. Se o valor de u
k
for menor que este limiar, ento, a
sada do neurnio fica inibida. Caso contrrio, o neurnio fica ativo.
4. uma funo de ativao, que funciona como um limitante
amplitude da sada do neurnio, ou seja, a entrada normalizada
dentro de um intervalo fechado, comumente [0,1] ou [-1,1];
5. a sada do neurnio, y
k
, onde:


y u
k k
=
k
( )
(2)

onde a funo de ativao.

Em geral, o valor do threshold aplicado com a incluso de uma
entrada x
0
igual a -1 e um peso w
k0
igual ao valor de
k
. Portanto, a nova entrada
da funo de ativao, j incluindo o limiar, dada por:


v w x
k kj j
j
n
=
=

1
k

(3)

3.1.3.2. TIPOS DE FUNO DE ATIVAO

A funo de ativao define a sada do neurnio em termos do nvel
de atividade do mesmo (HAYKIN, 1994). Dentre as funes de ativao mais
comuns, se enquadram as seguintes:
funo linear:
i
(t+1) = v
i
(t)
funo threshold ou limiar:
i
(t+1) = 1, se v
i
(t)
0, se v
i
(t) <
funo sigmide logstica:
i
(t+1) = 1/(1+ e
-

vi(t)
)
funo tangente hiperblica:
i
(t+1) = (1 - e
-

vi(t)
) / (1+ e
-

vi(t)
)
Nair Cristina Margarido Brondino - 37
funo linear por partes:
i
(t+1) = +1, se v
i
(t) >
-1, se v
i
(t) <
v
i
(t), em outra parte

3.1.3.3. TOPOLOGIA DA REDE

A maneira como os neurnios so organizados chamada de
topologia da rede. A topologia ir afetar o desempenho da rede, assim como as
aplicaes para as quais ela desejada, e sua estrutura est intimamente ligada ao
algoritmo de aprendizado usado para a fase de treinamento. Algumas redes
permitem que as conexes caminhem tanto no sentido entrada-sada, quanto sada-
entrada. Outras permitem que os neurnios da mesma camada estejam conectados.
Ainda h as que permitem que o neurnio envie sinais de volta para ele mesmo
(TUBB, 1993).
Dentre as topologias, pode-se citar a Multlayer Perceptron, que
formada de uma camada de entrada, uma ou mais camadas intermedirias e uma
camada de sada e o tipo de arquitetura mais encontrado. H tambm a rede de
Kohonen, que formada por uma camada de entrada e uma nica camada de sada,
onde cada neurnio est conectado a todos os seus vizinhos. Na rede de Hopfield,
no h neurnios de entrada ou sada. A entrada de um neurnio a sada dos
demais neurnios e a sua sada vai ser a entrada do demais neurnios da rede. A
rede ART formada por camada de entrada e sada, alm de controladores de fluxo
de sinais. Para este estudo foi escolhida a rede Multlayer Perceptron devido ao fato
desta ser mais adequada para fazer classificaes deste tipo, alm de ser a mais
conhecida e utilizada, tendo, inclusive, softwares para sua implementao
disponveis na Internet.

3.1.3.4. ALGORITMOS DE APRENDIZADO

Segundo CARVALHO et al. (1998), denomina-se algoritmo de
aprendizado a um conjunto de regras bem definidas para a soluo de um problema
Nair Cristina Margarido Brondino - 38
de aprendizado. Existem vrios tipos de algoritmos de aprendizado, que so
especficos para determinados modelos de redes neurais e que diferem entre si,
principalmente, pela forma com que os pesos so atualizados.
Os paradigmas de aprendizado, por sua vez, definem a maneira como
a rede se relaciona com o ambiente e se dividem em trs grupos principais:
supervisionado, no supervisionado e hbrido.
Para o aprendizado supervisionado, apresenta-se rede, na fase de
treinamento, um conjunto de entradas acompanhadas de suas respectivas sadas. O
objetivo minimizar o sinal de erro, que uma funo da diferena entre a sada
desejada e aquela fornecida pela rede. Esta minimizao se d pelo ajuste dos pesos
da rede. Um exemplo deste paradigma de aprendizado o mtodo backpropagation,
que ser discutido mais adiante.
No aprendizado no supervisionado, a rede aprende sozinha, sem uma
mensagem de erro externa, ou seja, no h superviso externa. necessrio que
entradas parecidas sejam apresentadas rede, para que esta possa extrair
caractersticas estatisticamente relevantes e criar classes de maneira automtica.
O aprendizado hbrido, por sua vez, consiste de uma combinao dos
aprendizados supervisionado e no supervisionado. Um exemplo o aprendizado
por reforo, onde a rede aprende de seu prprio ambiente, a partir dos dados de
entrada. A nica informao externa que a rede recebe a indicao de que a
resposta fornecida est correta ou no.

3.1.3.5. A REDE Multlayer Perceptron

Como mencionado anteriormente, a rede perceptron, que
constituda de apenas duas camadas (uma de entrada e outra de sada) s consegue
classificar padres que sejam linearmente separveis. Diante deste problema, uma
possvel aproximao seria usar mais que um perceptron, cada um sendo
empregado para distinguir sees linearmente separveis da entrada e ento
combinando suas sadas em outro perceptron, que poderia produzir uma indicao
Nair Cristina Margarido Brondino - 39
final da classe a que aquela entrada pertence (BEALE e JACKSON, 1990). A
Figura 3.2 mostra esta idia graficamente.
entradas
*
+ +
+
*
1
*
*
*
*
+ +
+
+ +
+
2
3

Figura 3.2 - Comportamento de classificao de dois padres de uma rede com uma
camada intermediria.

A nova rede arranja as unidades perceptron em camadas e o novo
modelo passa a ser chamado multlayer perceptron. O novo modelo de rede passa a
contar com uma ou mais camadas de neurnios intermedirias. Cada unidade
pertencente camada intermediria funciona como o perceptron, exceto porque sua
funo de ativao no mais a funo degrau e sim, a funo sigmide ou a
funo threshold linear. Esta escolha pelo tipo de funo de ativao se d porque,
com a utilizao de uma das duas alternativas apresentadas, a atualizao dos pesos
se d de forma mais suavizada, ou seja, os pesos no vo sofrer alteraes bruscas.
A topologia de uma rede multlayer perceptron com trs camadas (uma
intermediria) mostrada na Figura 3.3.
Nair Cristina Margarido Brondino - 40

Figura 3.3 - Topologia de uma rede multlayer perceptron com uma camada
intermediria.

3.1.3.5.1. ALGORITMO DE APRENDIZADO PARA UMA
REDE MLP

A regra de aprendizado utilizada para treinar uma rede multlayer
perceptron denominada Regra Delta Generalizada ou, mais comumente,
backpropagation.
Quando um padro apresentado rede pela primeira vez, esta
produz uma sada aleatria. A diferena entre esta sada e a desejada constitui o
erro. A inteno do trabalho de treinamento buscar cada vez mais diminuir o
valor deste erro. Para tal intuito, o valor dos pesos deve ser ajustado a cada nova
iterao. A regra backpropagation proporciona que os pesos da camada de sada
sejam os primeiros a serem ajustados e, posteriormente, os pesos das demais
camadas, de trs para frente (da o nome da regra).
Seja E
p
, a funo erro para o padro p, d
pj
, o valor da sada desejado
(para o padro p e o n j), o
pj
, o valor da sada obtido e w
ij
, o peso do n i para o n
j. Ento, a funo E
p
pode ser dada por:


E d
p pj
j
pj
=

1
2
2
( o )
(4)

Portanto, o objetivo minimizar esta funo de erro. Se esta funo
for simples, a rede tem garantia de encontrar soluo. Caso contrrio, a rede pode
cair em um mnimo local e no produzir uma sada satisfatria.
Nair Cristina Margarido Brondino - 41
A atualizao dos pesos se d pela adio de um termo de variao a
eles (w
ij
), ou seja, para um peso w
ij
, o seu peso atualizado vai ser dado por:


ij ij ij
w ) t ( w ) 1 t ( w + = +
(5)

onde :
w x o o
ij i j j j
= ( ) 1
(6)
j = (d
j
-o
j
), para ltima camada (7)

j
= w
jk

k
, para camadas intermedirias (8)

A varivel denominada taxa de aprendizado. Seu valor vai
determinar o quo suavemente se dar a atualizao dos pesos. Se for grande, o
valor de w
ij
ser grande e, conseqentemente, os pesos sofrero uma alterao
mais brusca.
Uma outra varivel, que pode ser includa na atualizao de pesos, o
momentum (). Este novo termo pode aumentar a velocidade do aprendizado e tem
por caracterstica acelerar o treinamento em regies planas da superfcie de erro.
Com a adio do momentum, w
ij
passa a ser dado por:


w t x o o w t w t
ij i j j j ij ij
( ) ( ) ( ( ) ( ) + = ) + 1 1 1
(9)

A atualizao de pesos pode se dar de duas maneiras: por padro ou
por ciclo. Na primeira, os pesos so atualizados aps a apresentao de cada
padro. Na segunda, os pesos so atualizados aps a apresentao de todos os
padres. A maneira a ser utilizada depende da aplicao. Se o conjunto de dados
grande e redundante (poucos padres e muitas entradas, por exemplo), a primeira
melhor. Caso contrrio, quando o conjunto apresenta muitos padres a serem
classificados, melhor utilizar a atualizao por ciclo.
O algoritmo backpropagation apresenta alguns problemas, quanto
dificuldades de aprendizado. Em superfcies muito complexas, o treinamento
Nair Cristina Margarido Brondino - 42
muito lento e existe o risco da rede cair num mnimo local. Alm disso, pode
ocorrer overfitting, fenmeno que surge depois de um certo tempo de treinamento,
quando a rede memoriza os padres que j foram apresentados e o processo de
classificao piora sensivelmente. Possveis solues para estes problemas so:
diminuir a taxa de aprendizado, adicionar ns na camada intermediria, utilizar
momentum e adicionar rudos.
Finalmente, as Figuras 3.4 e 3.5 mostram diagramas esquemticos
dos algoritmos de treinamento e teste de uma rede Multlayer Perceptron (MLP).

Nair Cristina Margarido Brondino - 43
iniciar pesos com
valores aleatrios e
fazer erro = 0
apresentar as n entradas e
as m sadas associadas
calcular a sada
y wx
pj i i
i
n
=
=

( )
0
1
passar o valor de sada obtido
para a prxima camada e
computar, ao final de todas
as camadas, a sada o
pj.
atualizar os pesos da ltima
camada para a anterior e assim
por diante, at a primeira
camada.
se o
pj
d
pj
, ento calcular o valor
da funo de erro (eq. 4).
erro >
sim
FIM
no
INCIO
Figura 3.4 - Diagrama esquemtico do treinamento de uma rede MLP.
Nair Cristina Margarido Brondino - 44
apresentar o padro X para
teste
calcular a sada da rede o
pj
comparar o
pj
com d
pj
e classificar o
padro na classe que apresentar
menor erro (sada mais parecida com
a desejada).
FIM
INCIO

Figura 3.5 - Diagrama esquemtico da fase de teste de uma rede MLP.

3.2. ANLISE DE REGRESSO

3.2.1. O MODELO LINEAR

O modelo de Regresso Linear Mltipla usado para estudar a relao
entre uma varivel dependente e vrias variveis independentes. Sua frmula
genrica dada por:

,...,n , i x x x x x x f y
i iK K i i i iK i i i
2 1 , ... ) ,..., , (
2 2 1 1 2 1
= + + + + = + = (10)

onde:

y a varivel dependente ou explicada
x
i
, x
2
, ... , x
K
so as variveis independentes ou explicativas
Nair Cristina Margarido Brondino - 45
e o termo
i
representa o distrbio aleatrio, que pode se originar devido a diversas
circunstncias, tais como a ausncia de fatores influentes no modelo e distrbios
causados por erros de medida.

3.2.1.1. SUPOSIES DO MODELO DE REGRESSO
LINEAR CLSSICO

O Modelo de Regresso Linear Clssico consiste de uma srie de
suposies que descrevem as formas do modelo e tambm ditam os procedimentos
adequados de estimao e inferncia.

3.2.1.1.1. LINEARIDADE DO MODELO DE REGRESSO

Assuma que o vetor coluna x
k
representante as n observaes na
varivel x
k
, k=1, 2,...,K e que estes dados esto alocados em uma matriz X de
dimenso n K. Na maioria dos casos, a primeira coluna da matriz X composta
somente de 1's, de forma que
1
o termo constante no modelo. Assumindo tambm
que y represente as n observaes y
1
, y
2
, ..., y
n
e que um vetor coluna contendo
os n distrbios, o modelo dado em (10) pode ser rescrito como:

y= x
1

1
+ x
2

2
+ ...+ x
K

K
+ (11)

Ou, similarmente, na forma da Suposio 1 dada por:

Suposio 1: y = X + (12)

A suposio de linearidade do modelo de regresso inclui o distrbio
aditivo e deve ser da forma descrita pela equao (11) ou na forma das variveis
originais ou para alguma transformao adequada destas. Portanto, no contexto da
regresso, a linearidade se refere forma pela qual os parmetros e o distrbio
entram na equao e no necessariamente relao entre as variveis envolvidas.
Nair Cristina Margarido Brondino - 46
Neste contexto, uma relao no linear da forma pode ser linearizada
atravs do uso dos logaritmos de x e y: ln y = + ln x + .

e Ax y =

3.2.1.1.2. POSTO COMPLETO

Esta suposio diz respeito aos regressores do modelo, onde deve-se
assumir que no existe relao linear perfeita entre as variveis independentes. Para
que isto ocorra, necessrio que a matriz X tenha posto completo, ou seja, que as
colunas desta matriz sejam linearmente independentes e que haja pelo menos K
observaes. Desta forma, a suposio 2 pode ser escrita como:

Suposio 2: X uma matriz n K com posto K (13)

3.2.1.1.3 VALOR ESPERADO DO DISTRBIO

Deve-se assumir que o valor esperado do distrbio seja zero para cada
observao, ou seja:

E[
i
/X] = 0 (14)

Assim, para o grupo completo de observaes, a suposio 3 pode ser
escrita como:

Suposio 3: (15) 0
] X / [ E
] X / [ E
] X / [ E
) X / [ E
n
2
1
=
(
(
(
(


Em muitos casos, esta suposio no restritiva. Porm, se o modelo
original no contm o termo constante, supor E[
i
] = 0 poderia no ser uma deciso
correta. Por um lado, se E[
i
] puder ser expressa como uma funo linear dos x
i
,
Nair Cristina Margarido Brondino - 47
ento, uma transformao do modelo poderia produzir distrbios com mdia zero.
Por outro lado, uma mdia dos distrbios diferente de zero poderia constituir uma
parte substantiva da estrutura do modelo. Assim, como regra geral, modelos de
regresso no devem ser especificados sem o termo constante, a menos que isto seja
ditado pela teoria pertinente. Se houver razes para especificar que a mdia do
distrbio seja diferente de zero, isto deve ser construdo na parte sistemtica da
regresso, deixando no distrbio somente a parte desconhecida de .

3.2.1.1.4. DISTRBIOS ESFRICOS

A quarta suposio diz respeito varincia e covarincia dos
distrbios:

Var [
i
/X] =
2
, para todo i = 1, ..., n e

Cov [
i
,
j
/X] = 0, para todo i j

A varincia constante chamada homocedasticidade e a falta de
correlao entre os distrbios chamada no-autocorrelao. A no-autocorrelao
no implica que as observaes y
i
e y
j
so no correlacionadas, mas sim que os
desvios dos valores observados destas com relao aos valores esperados so no
correlacionados. Estas duas suposies implicam que:

(
(
(
(
(

=
(
(
(
(

=
2
2
2
2 1
2 2 2 1 2
1 2 1 1 1
0 0
0 0
0 0
] / [ ] / [ ] / [
] / [ ] / [ ] / [
] / [ ] / [ ] / [
] / ' [

X E X E X E
X E X E X E
X E X E X E
X E
n n n n
n
n
(16)

que pode ser resumida na seguinte suposio:

Suposio 4: E['/X] =
2
I (17)
Nair Cristina Margarido Brondino - 48

Os distrbios que encontram as suposies de homocedasticidade e
no-autocorrelao so chamados distrbios esfricos.

3.2.1.1.5. REGRESSORES NO-ESTOCSTICOS

Em geral, assume-se que x
i
no-estocstico, o que permite ao
analista escolher os valores dos regressores e ento observar os y
i
, ao contrrio do
que ocorreria em uma situao experimental. Assim, a suposio 5, que consiste da
especificao das variveis independentes, fica da seguinte maneira:

Suposio 5: X uma matriz de constantes conhecida, com dimenso n K (18)

3.2.1.1.6. NORMALIDADE

conveniente assumir que os distrbios so normalmente
distribudos, com mdia zero e varincia constante. Esta suposio, que til
principalmente na construo de testes estatsticos, implica que as observaes em

i
so estatisticamente independentes, apresentada a seguir:

Suposio 6: /X ~ N(0,
2
I) (19)

3.2.1.2. O MTODO DOS MNIMOS QUADRADOS

Sejam os parmetros desconhecidos da relao y
i
= x
i
' +
i
, os
objetos de estimao. Ento, se b e e
i
so as estimativas amostrais de e
i
, ento, a
regresso populacional dada por E[y
i
/x
i
] = x
i
', enquanto que sua estimativa
denotada por:

i
y = x
i
'b (20)
Nair Cristina Margarido Brondino - 49

Sendo assim, o distrbio associado com a i-sima observao dado
por:

i
= y
i
- x
i
' (21)

Para um dado valor de b,
i
pode ser estimado atravs da seguinte
expresso:

e
i
= y
i
- x
i
'b (22)

A partir das definies, obtm-se a relao dada por (23), que
mostrada graficamente na Figura 3.6.

y
i
= x
i
' +
i
=

x
i
'b + e
i
(23)



E(y) = + x
e
bx a Y + =

+ x
a + bx
y

Figura 3.6 - Regresses amostral e populacional (GREENE, 1997).

Nair Cristina Margarido Brondino - 50
3.2.1.2.1 O VETOR DOS COEFICIENTES OBTIDO POR
MNIMOS QUADRADOS

O vetor dos coeficientes obtido por Mnimos Quadrados (
0
) deve ser
escolhido de maneira a minimizar a Soma de Quadrados dos Resduos, dada por:

) X y ( )' X y (
0 0 0
'
0
= (24)

Desta forma, para encontrar o valor de
0
que minimiza a Soma de
Quadrados dos Resduos, deve-se diferenciar a expresso (24) com relao a
0
e
igualar o resultado a zero. Se a inversa de (X'X) existe, ento a soluo do sistema
obtido, denotada por b, dada por:

b = (X'X)
-1
X'y (25)

3.2.1.2.1.1. TESTES DE HIPTESE E INTERVALOS DE
CONFIANA PARA O COEFICIENTE
K


Se o distrbio aleatrio possui Distribuio Normal Multivariada,
ento pode-se provar que a distribuio de b/X dada por:

b/X ~ N(,
2
(X'X)
-1
) (26)

ou seja, b/X apresenta distribuio Normal Multivariada. Desta forma, cada
elemento de b/X tambm normalmente distribudo:

b
k
/X ~ N(
k
,
2
[(X'X)
kk
]
-1
) (27)

Usando estes resultados, pode-se elaborar testes de hipteses ou
construir intervalos de confiana para os elementos do vetor . Para tanto, torna-se
necessrio conhecer a matriz de covarincia
Nair Cristina Margarido Brondino - 51

Var[b] =
2
(X'X)
-1
. (28)

Se
2
conhecido, uma estimativa da varincia de b
k
dada pelo k-
simo elemento da matriz dada em (28). Ento, seguindo a suposio de
normalidade, uma estatstica de teste para
k
seria dada por:


kk 2
k k
k
S
b
z

= (29)

onde S
kk
o k-simo elemento da matriz (X'X)
-1
.

Por outro lado, se
2
desconhecido, ento um estimador no viciado
para a varincia da regresso dado por:


K n
e e
s

=
'
2
(30)

A matriz de covarincias estimada para b pode ento ser calculada
atravs da seguinte expresso:

Estimativa da Var[b] = s
2
(X'X)
-1
(31)

Conseqentemente, a varincia de b
k
dada pelo k-simo elemento da
matriz dada em (31). Se s
2
for utilizado em lugar de
2
e se b e s
2
so
independentes, pode-se mostrar que a razo:

kk
k k
k
S s
b
t
2

= (32)
Nair Cristina Margarido Brondino - 52

tem distribuio t-Student com (n-K) graus de liberdade. Utilizando este mesmo
resultado, pode-se construir intervalos de confiana para os
k
's com nvel (1-) de
confiana:



= + < < 1 ) s t b s t b ( Prob
bk 2 / k k bk 2 / k
(33)

3.2.1.3. VERIFICAO DA ADEQUABILIDADE DA
REGRESSO AJUSTADA

Uma medida de adequabilidade da regresso ajustada pode ser dada
pelo coeficiente de determinao, R
2
. Este coeficiente serve para verificar o
percentual da varincia de y que explicado pelo modelo ajustado e, para seu
clculo, alguns valores devem ser conhecidos a priori. O primeiro destes valores a
Variao Total em y (SST), cujo valor obtido pela expresso (34).

SST =

y (34)
=

n
i
i
) y (
1
2

Se SSE denota a Soma de Quadrados dos Resduos (e'e), ento pode-
se mostrar que:

SST = SSR + SSE (35)

onde SSR: Soma de Quadrados devido Regresso.

De posse destes valores, pode-se, ento, calcular o coeficiente de
determinao:


SST
SSR
=
2
R (36)

Nair Cristina Margarido Brondino - 53

O valor do R
2
pode variar de 0, o que ocorre quando todos os
elementos do vetor b, exceto o termo constante, so iguais a zero. Neste caso, os
valores preditos para y so sempre iguais a y e, portanto, diferentes valores para x
no conduzem a diferenas nos valores preditos para y, ou seja, x no possui poder
explicativo. Por outro lado, o valor mximo para o R
2
igual a 1, o que ocorre
quando os resduos do modelo so iguais a zero e, portanto, 100% da varincia de y
explicada pelo modelo (situao ideal). Portanto, quanto mais prximo de 1
estiver o valor do R
2
, mais adequado o modelo de regresso ajustado.
Os clculos necessrios para a obteno do R
2
podem ser resumidos
em uma nica tabela, denominada Tabela de Anlise de Varincia.

Tabela 3.1 - Tabela de Anlise de Varincia.
Fonte Graus de liberdade Quadrado Mdio
Regresso
b'X'y - n
2
y
K - 1
Resduo e'e n - K s
2
Total
y'y - n
2
y
n - 1 S
yy
/(n-1) = s
2
y
Coeficiente de determinao R
2
= 1 - e'e/(y'y - n
2
y )

Os resultados mostrados anteriormente tambm podem ser utilizados
para testar a significncia da regresso. Para tal, torna-se necessrio testar a hiptese
de que todos os coeficientes, exceto o termo constante, so iguais a zero. Conforme
j foi mencionado, se todos os coeficientes so iguais a zero, ento R
2
tambm
igual a zero e, portanto, o teste pode ser construdo com base neste valor. Assim, se

2
= 0 (onde
2
a parte do vetor que no inclui a constante) e os distrbios tm
Distribuio Normal, pode-se mostrar que a estatstica:

) )( (
) /(
K n R 1
1 K R
F
2
2

= (37)

Nair Cristina Margarido Brondino - 54
tem Distribuio F com (K-1) e (n-K) graus de liberdade. Grandes valores para F
so induzidos por altos valores do R
2
, o que contradiz a hiptese inicial.
Embora no se aplique a este estudo e, portanto, no ser assunto
includo neste captulo, pode-se generalizar o modelo clssico de regresso para
situaes onde o distrbio no apresenta Distribuio Normal ou a matriz X no
estocstica. Para maiores detalhes, ver GREENE (1997).

3.2.1.4. MULTICOLINEARIDADE

O problema da multicolinearidade existe quando as variveis
independentes so excessivamente autocorrelacionadas, dificultando uma anlise
precisa de seus efeitos individuais. Este tipo de problema fere uma das suposies
bsicas do modelo clssico de regresso que a de que a matriz X deve ter posto
completo, ou seja, no deve existir relao linear perfeita entre as variveis
independentes. Esta suposio feita para assegurar a existncia da inversa de X'X.
So dois os possveis casos de colinearidade: perfeita ou prximo da
multicolinearidade. No primeiro caso, h um nmero infinito de vetores de
parmetros que podem ser consistentes com o mesmo valor esperado. Assim,
independentemente de quantos dados pode-se obter, impossvel estimar os
parmetros do modelo. No segundo caso, o posto da matriz X L<K. Segue disso
que na matriz X h somente L<K fontes independentes de variao. Este um caso
comum quando as variveis so altamente correlacionadas mas esta correlao no
perfeita.

3.2.1.4.1. POSSVEIS SINTOMAS E ALGUMAS MEDIDAS
DE MULTICOLINEARIDADE:

Pequenas mudanas nos dados causam grandes mudanas nas estimativas
dos parmetros;
Nair Cristina Margarido Brondino - 55
Coeficientes podem ter desvio padro elevado e baixo nvel de
significncia embora sejam conjuntamente significantes e o R
2
da
regresso seja elevado;
Coeficientes apresentam o sinal errado ou uma magnitude implausvel.

A seguir so sugeridas algumas medidas de Multicolinearidade
(GREENE, 1997):

1. Seja a matriz X de dimenso K composta de uma coluna de 1's e as demais
colunas representando K-1 variveis medidas em desvios com relao suas
mdias amostrais. Ento, o primeiro elemento diagonal da matriz (X'X)
-1
igual
a 1/(S
11
(1-R
1
2
)), onde R
1
2
o coeficiente de determinao da regresso de x
1
em
uma constante e todas as demais variveis independentes. Conseqentemente, a
varincia de b
1
dada por:

Var (b
1
) =
11
2
1
2
S ) R 1 (

(38)

Ento, se uma varivel altamente correlacionada com x
1
for
adicionada Regresso, S
11
no sofrer mudana radical enquanto que o R
1
2

aumentar, assim como Var (b
1
). Porm, a regra de considerar as correlaes
simples entre as variveis pode no dar uma indicao adequada do problema.

2. Uma outra sugesto a medida proposta por LEAMER (1978)
2
.

2 / 1
1
kk
1
i
2
k ik
k 2
] ) X ' X [(
] ) x x ( [
) b ( c

(39)

2
Lemaer, E. Specification Searches: Ad Hoc Inferences with Nonexperimental Data. New York: John Wiley
and Sons, 1978.
Nair Cristina Margarido Brondino - 56

que eqivale raiz quadrada da razo das verdadeiras varincias de b
k
estimadas
sem e com as outras variveis. Se x
k
no correlacionado com as outras variveis, o
valor em (39) 1. Caso contrrio, este valor seria equivalente a (1 - R
1
2
)
1/2
, que
sugere novamente a utilizao dos coeficientes de determinao.

3. Uma terceira alternativa comparar o coeficiente de determinao da regresso
(R
2
) com os R
i
2
's. Se o valor do R
2
for menor que um dos R
i
2
, ento existe o
problema da multicolinearidade nos dados.

4. Uma quarta sugesto dada por BELSLEY et al. (1980)
3
, onde a grandeza do
nmero de condio (raiz quadrada entre a mxima e a mnima razes
caractersticas) da matriz X'X analisada. Para este clculo, ele sugere que a
matriz X'X deve ser normalizada, dividindo-se cada uma de suas colunas por
(x'
k
x
k
)
1/2
. Quanto maior o nmero de condio, maior a intercorrelao entre as
variveis. O autor sugere que valores acima de 20 so crticos.

5. BELSEY et al. (1980)
2
ainda sugerem uma outra medida de colinearidade. Para
obteno desta medida, parte-se do princpio de que a matriz de covarincia do
vetor obtido por Mnimos Quadrados pode ser escrita em termos de sua
decomposio espectral:

= =
K
1 k
'
k k k
2 2 1 2
c c ) / 1 ( ' C C ) X ' X ( (40)

onde
k
a k-sima raiz caracterstica de X'X, estando os auto-valores ordenados
em ordem decrescente, e c
k
o vetor caracterstico associado. Ento, a varincia do
parmetro b
k
pode ser escrita da seguinte forma:

3
Belsley, D., E. Kuh and R. Welsch. Regression diagnostics: Identifying Influential Data and Sources of
Collinearity. New York: John Wiley and Sons, 1980.
Nair Cristina Margarido Brondino - 57

2
kl l
k
1 l
2
k
C ) / 1 ( ) b ( Var

=
= (41)

Cada varincia pode, ento, ser quebrada na proporo associada com
cada raiz caracterstica, atravs da seguinte expresso:

1
kk
l
2
kl
kl
) X ' X (
/ C

(42)

tal que

=1. Os valores encontrados para os 's so arranjados em uma tabela


que revela dependncia linear entre os regressores associados com uma raiz
caracterstica particular. Assim, razes caractersticas pequenas sugerem altos
valores para
l
kl

kl
, tal que deve-se prestar ateno para grandes valores nas colunas da
tabela, especialmente os que excedem 0,5. Teoria adicional sobre a obteno dos
auto-valores e seus respectivos auto-vetores pode ser encontrada em livros de
lgebra Linear como, por exemplo, LIPSCHULTZ (1968) e ANTON (1991).

3.2.1.4.2. POSSVEIS SOLUES PARA O PROBLEMA DA
MULTICOLINEARIDADE

Duas solues tm sido propostas com o objetivo de lidar com o mais
bvio problema da multicolinearidade: o alto desvio-padro dos parmetros. A
primeira a utilizao do estimador de regresso Ridge, que dado por:

b
r
= [X'X + rD]
-1
X'y (43)

onde D uma matriz diagonal contendo os valores diagonais de (X'X) e r
escolhido arbitrariamente. Uma sugesto iniciar com um valor pequeno de r como,
por exemplo, 0,01 e ir aumentando-o gradativamente at que os coeficientes se
estabilizem. Porm, o estimador Ridge, alm de ser viciado, de difcil inferncia.
Nair Cristina Margarido Brondino - 58
A segunda soluo para o problema o uso de componentes
principais, cujo objetivo o de extrair da matriz X um pequeno nmero de variveis
que contribuem para a maior parte da variao em X. Porm, o estimador obtido por
este critrio tambm viciado e sua utilizao pode apresentar problemas.
Apesar dos problemas j mencionados, este trabalho far uso de
Regresso Ridge, devido s maiores facilidades computacionais deste mtodos.

3.2.1.5. HETEROCEDASTICIDADE

O problema de heterocedasticidade ocorre quando a varincia do
distrbio no constante. Quando isto ocorre, pode-se mostrar que o estimador do
vetor b obtido por Mnimos Quadrados ineficiente e, portanto, outro tipo de
estimador deve ser utilizado (GREENE, 1997). Alm da simples anlise visual,
alguns testes podem ser elaborados com o objetivo de verificar heterocedasticidade,
cujo objetivo testar uma hiptese do tipo H
0
:
i
2
= para todo i.
O primeiro teste o Teste Geral de White. Para obter a estatstica de
teste, basta calcular o valor de nR
2
na regresso de e
i
2
com todas as variveis nicas
da matriz X. Esta estatstica assintoticamente distribuda com uma Distribuio
Qui-Quadrado com P-1 graus de liberdade, onde P o nmero de regressores,
incluindo o termo constante. Este teste extremamente geral e, embora possa
revelar a existncia de heterocedasticidade, no consegue identificar outros erros de
especificao.
Outro teste sugerido o Teste de Goldfeld-Quandt. Para este teste,
assume-se que o grupo de dados possa ser dividido em dois grupos de maneira que,
sob a hiptese de homocedasticidade, as varincias dos distrbios seriam iguais para
os dois grupos. Para executar tal teste, CASSIDY (1981) sugere que as observaes
devem ser ordenadas pela varivel suspeita de heterocedasticidade, que pode ser
indicada atravs da anlise dos grficos de resduos. A partir da, o conjunto de
dados deve ser dividido em trs subconjuntos: o primeiro e o ltimo com m
observaes e o segundo com (n - 2m) observaes. A estatstica de teste , ento
dada por:
Nair Cristina Margarido Brondino - 59

2
1
SSE
SSE
F = (44)

onde SSE
1
e SSE
2
so as Somas dos Quadrados dos Resduos obtidas das regresses
do primeiro e do ltimo conjuntos de observaes, respectivamente. A estatstica F
apresenta distribuio F com (m-K) e (m-K) graus de liberdade, onde K o nmero
de parmetros estimados.

3.2.1.6. OS EFEITOS DE INTERAO

Segundo GUNST & MASON (1980), os termos de interao em um
modelo de regresso so produtos de duas ou mais variveis preditoras. Tais termos
so usuais quando se acredita que o efeito de uma varivel preditora na resposta
depende dos valores de outra(s) varivel(is) preditora(s).
Uma forma de analisar este tipo de efeito sugerida por GREENE
(1997). Seja o modelo dado por:

2 1 4 2 3 1 2 1
x x x x y + + + = (45)

Derivando- se y com relao a x
1
e x
2
, obter-se- as seguintes
relaes:

1 4 3
2
2 4 2
1
x
x
y) ( E
e x
x
) y ( E


+ =

+ =

(46)

As relaes mostradas em (46) implicam no fato de que, se
4

positivo, o efeito marginal de x
1
aumentando quando x
2
aumenta. O mesmo ocorre
quando se avalia o efeito marginal de x
2
. Para a construo de testes de hipteses
Nair Cristina Margarido Brondino - 60
e/ou intervalos de confiana para estes efeitos marginais, a varincia calculada
conforme mostrado na expresso (47) para o efeito marginal de x
1
. Neste caso, um
valor para x
2
deve ser escolhido. Uma escolha natural seria o valor amostral mdio,
embora em algumas circunstncias, seja melhor utilizar o valor mximo obtido.

)

( Cov x 2 )

( Var x )

( Var
x
) y ( E

Var
4 2 2 4
2
2 2
1
+ + =
|
|
.
|

\
|

(47)

3.3. OS SISTEMAS DE INFORMAO GEOGRFICA (SIG)

So vrias as definies para os Sistemas de Informao Geogrfica.
De certa forma, o que muda de uma para outra so apenas as palavras, pois todas
elas conduzem ao mesmo tipo de raciocnio. Somente para exemplificar, algumas
destas definies so listadas a seguir.
Segundo CMARA et al. (1996), os SIGs podem ser definidos da
seguinte maneira:

Sistemas de Informao Geogrfica SIGs so sistemas
automatizados usados para armazenar, analisar e manipular dados
geogrficos, ou seja, dados que representam objetos e fenmenos em que
a localizao geogrfica uma caracterstica inerente informao e
indispensvel para analis-la.

Segundo BUZAI & DURAN (1997), existem diferentes definies,
que foram sendo dadas ao longo do desenvolvimento deste tipo de sistema. A
primeira sugerida por Dacey
4
:

4
Dacey, M. F. Linguistics Aspects of maps and Geographic Information. In: Ontario Geography, n. 5, Ontario. 1970.

Nair Cristina Margarido Brondino - 61

Qualquer coisa que funcione como um mapa, ao comunicar
geograficamente a informao solicitada pelos usurios do sistema.

Porm, os autores consideram tal definio ultrapassada, pois, desde o
aparecimento da geoinformtica, possvel armazenar, processar e reportar dados
espaciais atravs da tecnologia computacional. Neste caso, ainda segundo BUZAI
& DURAN (1997), torna-se mais adequada a definio de Marble
5
:

um sistema baseado em computao para o manejo de dados
espaciais.

Segundo HUXHOLD (1991):
H tantas definies quantas so as disciplinas envolvidas na
utilizao de Sistemas de Informao Geogrfica, quais sejam:
geografia, planejamento urbano, engenharia, processamento de dados,
arquitetura, cincia ambiental e outras. Alm disso, os SIGs consistem
de uma classe de ferramentas que profissionais nestas disciplinas usam
para melhorar a maneira como trabalham. Assim como telefones,
calculadoras e processadores de palavras so ferramentas para tornar o
trabalho mais fcil, rpido e significativo, um SIG produz ferramentas
para o profissional melhorar sua eficincia e eficcia no trabalho com
informao em mapas e atributos de dados no grficos.

Diante do que se exps, as definies dos SIGs refletem a
multiplicidade de usos e vises possveis desta tecnologia e conduzem a um carter
interdisciplinar desta. Sendo assim, possvel indicar duas importantes

5
Marble, D. Geographic Information Systems: An overview. In: Peuquet, D. & Mable, D. (Eds.) Introductory
Readings in Geographic Information Systems. Taylor & Francis. London. 1990.
Nair Cristina Margarido Brondino - 62
caractersticas dos SIGs: a primeira que estes sistemas possibilitam a integrao,
numa nica base de dados, de informaes geogrficas provenientes de fontes
diversas (dados cartogrficos, dados de censo e cadastro urbano e rural, imagens de
satlite e modelos numricos de terreno) e a segunda que os SIGs oferecem
mecanismos para recuperar, manipular e atualizar estes dados, atravs de algoritmos
especficos para estes propsitos.

3.3.1. HISTRICO

As primeiras tentativas de automatizar o processamento de dados
georeferenciados ocorreram na Gr-Bretanha e nos USA, visando diminuir os
custos de produo e atualizao de mapas. No primeiro caso, o sistema foi
desenvolvido para pesquisas em botnica, enquanto que no segundo o objetivo
principal era a engenharia de trfego (CMARA et al., 1996).
Somente nos anos 60 surgiram os primeiros SIGs propriamente ditos.
Seu desenvolvimento teve origem no Canad atravs de um plano estratgico
governamental de longo prazo para criar um inventrio automatizado de recursos
naturais, com vistas ao planejamento destes recursos e ao uso do solo.
Durante os anos 70 desenvolveram-se fundamentos matemticos
voltados para a cartografia. Data desta dcada o surgimento da topologia aplicada,
que permitiu anlises espaciais entre elementos cartogrficos.
Porm, os SIGs, que somente eram utilizados por grandes
organizaes at a dcada de 80, passaram a se difundir, o que ocorreu devido
popularizao e barateamento das estaes de trabalho, dos computadores pessoais
e dos bancos de dados.
Este mesmo progresso tecnolgico permitiu aperfeioar os
mecanismos de aquisio de dados georeferenciados, o que aumentou a
complexidade de coleta, armazenamento, manipulao e visualizao dos dados, em
funo do seu volume, variedade e heterogeneidade.
Nair Cristina Margarido Brondino - 63
CMARA
6
considera trs geraes de Sistemas de Informao
Geogrfica.

A primeira, baseada em CAD cartogrfico, caracteriza-se por
sistemas herdeiros da tradio de Cartografia, com suporte de banco de
dados limitado e cujo paradigma tpico de trabalho o mapa. Esta
classe de sistemas utilizada principalmente em projetos isolados, sem a
preocupao de gerar arquivos digitais de dados. Esta gerao tambm
pode ser caracterizada como sistemas orientados a projeto.
A segunda gerao de SIGs, baseada em banco de dados
geogrficos, chegou ao mercado no incio da dcada de 90 e
caracteriza-se por ser concebida para uso em ambientes cliente-
servidor, acoplado a gerenciadores de bancos de dados relacionais e
com pacotes adicionais para processamento de imagens. Desenvolvida
em ambientes multiplataforma com interfaces em janelas, esta gerao
tambm pode ser vista como sistemas para suporte a instituies.
Para o final da dcada de 90, previsto o aparecimento de uma
terceira gerao de SIGs baseada em bibliotecas digitais geogrficas
ou centros de dados geogrficos, caracterizada pelo gerenciamento de
grandes bases de dados geogrficos, com acesso atravs de redes locais
e remotas, pblicas ou privadas. Para esta terceira gerao, o
crescimento de bancos de dados geogrficos e a necessidade de seu
compartilhamento com outras instituies requer o recurso de
tecnologias como bancos de dados distribudos e federativos. Estes
Sistemas devero seguir os requisitos de interoperabilidade, de maneira
a permitir o acesso de informaes espaciais por SIGs distintos. A
terceira gerao do SIG pode ainda ser vista como o desenvolvimento de
sistemas orientados troca de informaes entre uma instituio e os
demais componentes da sociedade.

6
Camara G, Modelos, Linguagens e Arquiteturas para Bancos de Dados Geogrficos. Tese de Doutorado, INPE,
1995.
Nair Cristina Margarido Brondino - 64
3.3.2. TRATAMENTO DA INFORMAO

Conforme mencionado nas definies de SIG apresentadas
anteriormente, o grande objetivo desta ferramenta, de forma bastante resumida,
associar um banco de dados alfanumricos a um banco de dados grficos. Porm,
para que esta associao ocorra com sucesso, deve obedecer certos pr-requisitos
com relao ao tratamento prvio dos respectivos dados de entrada.

3.3.2.1. TRATAMENTO DE DADOS ALFANUMRICOS

O tratamento de dados alfanumricos pode ser realizado atravs do
uso de editores de texto (que armazenam informaes em ASCII), administradores
de bancos de dados (que organizam os dados em forma matricial, onde as linhas
representam os registros e as colunas representam as caractersticas de cada
registro) e planilhas de clculo. Uma outra alternativa so os programas de anlise
estatstica, onde o tipo de tratamento de dados se baseia em dois grandes grupos:
anlise descritiva das distribuies e medio por agrupamentos (inclui diferentes
tipos de anlises numricas e suas conseqentes representaes grficas) e o da
associao de fenmenos (dominado por diferentes formas de anlises de
associao atravs do uso de coeficientes de correlao por exemplo, anlise de
clusters).
Outra opo o uso de dados provenientes de sensores localizados em
satlites artificiais, atravs do uso de GPS (sistema militar desenvolvido pelo
Departamento de Defesa dos Estados Unidos que permite obter, mediante utilizao
de sinais emitidos por satlites artificiais e de receptores na terra, as coordenadas
geogrficas de qualquer ponto sobre a superfcie terrestre), cujas medies podem,
em certas circunstncias, fornecer preciso inferior a um metro.
Nair Cristina Margarido Brondino - 65
3.3.2.2. TRATAMENTO DOS DADOS GRFICOS

O tratamento de dados grficos pode se dar atravs de Projeto
Assistido por Computador (CAD Computer Aided Design) ou Cartografia
Assistida por Computador (CAC). A utilizao deste tipo de ferramenta se realiza
mediante a utilizao de programas que servem para a digitalizao de entidades
grficas vetoriais, basicamente pontos, arcos e polgonos que, combinados, formam
um mapa denominado vetorial. Este tipo de programa possui grande capacidade e
preciso no manejo com dados em duas ou trs dimenses. Em geoinformtica se
aplica principalmente de maneira bidimensional para realizar cartografia assistida
por computador (CAC), incorporando ao formato digital os mapas analgicos em
papel mediante digitalizao em mesa.
Uma segunda alternativa o Processamento Digital de Imagens (PDI),
que realizado atravs da utilizao de software utilizado em geoinformtica
especificamente para o tratamento de imagens digitais provenientes do uso de
scanners ou satlites espaciais. O tipo de estrutura de imagens provenientes dos
scanners e dos sensores incorporados aos satlites se denomina raster (ou matricial)
e ser discutido em maiores detalhes no prximo item.
A Modelagem Numrica de Terreno consiste de um procedimento
computacional pelo qual se representa o espao geogrfico em trs dimenses.
O tratamento combinado dos arquivos correspondentes aos dois tipos
de bases de dados e sua georeferenciao pode ser executado atravs da tecnologia
dos SIGs, cuja estrutura pode ser representada atravs do diagrama mostrado na
Figura 3.7.
Nair Cristina Margarido Brondino - 66
BASES DE DADOS
ALFANUMRICA:
EDITORES DE TEXTO
ADMINISTRADORES DE BASES
DE DADOS
PLANILHAS DE CLCULO
PROGRAMAS DE ANLISE
ESTATSTICA
SISTEMAS DE POSICIONAMENTO
GLOBAL
GRFICA:
CAD (Desenho Assistido por Computador)
CAC (Cartografia Assistida por Computador)
PDI (Processamento Digital de Imagens)
MNT (Modelagem Numrica de Terrenos)
SISTEMAS DE INFORMAO
GEOGRFICA


Figura 3.7 Diagrama esquemtico de um SIG.

3.3.3. ESTRUTURAS DE REPRESENTAO DO ESPAO
GEOGRFICO

A forma como o software armazena e representa os dados na tela tem
um importante papel no tipo de anlise a ser conduzida. Dentre as estruturas de
representao do espao geogrfico pelo SIG, duas tm se destacado: o modelo
matricial e o modelo vetorial.
No modelo matricial, a representao grfica formada por uma
matriz quadriculada, onde cada clula representa uma unidade mnima de resoluo
espacial: o pixel. A informao sobre o espao geogrfico que cada pixel contm
numrica e o nmero contido no pixel constitui uma das caractersticas descritivas
em que se apresenta a composio cartogrfica atravs de um grafismo ou de uma
cor. A informao contida provm da associao de um nmero digital a cada pixel
como unidade mnima de representao. Este valor numrico e sua escala vai de
zero (branco total) a 255 (preto total) em sua mxima possibilidade grfica.
Desta forma, o tratamento matricial de cada mapa oferece vrios tipos
de representao para uma mesma rea de estudo. A anlise das informaes se
efetua por superposio de vrias camadas temticas. Um exemplo de modelo
matricial ou raster apresentado na Figura 3.8.
Nair Cristina Margarido Brondino - 67

1
1
1
2
2 2
2 3
2
2
3
3
2
2
3
3
REPRESENTAO EM CAMADAS:
CAMADA 1
CAMADA 2
CAMADA 3

Figura 3.8 Modelo matricial (ou raster).

O modelo quadtree uma variante do modelo raster. Neste modelo,
tem-se que em uma nica composio cartogrfica pode-se contar com diferentes
tipos de pixels. Em localizaes onde a homogeneidade espacial se mostra extensa,
os pixels so maiores, enquanto que em locais onde as variaes de categorias so
muito pronunciadas, se usa clulas menores. O quadtree uma estrutura de dados
baseada na decomposio regular da imagem em quadrantes e subquadrantes. Esta
estrutura divide hierarquicamente o espao em determinados nveis de quadtrees.
No nvel 1, o espao dividido em quatro quadrantes. Se no h homogeneidade,
cada um dos quadrantes do nvel 1 dividido em mais quatro quadrantes e assim
por diante (TEIXEIRA et al., 1992).
O modelo vetorial opera representando o espao geogrfico de
maneira contnua e se baseia nas entidades caractersticas de todo desenho
cartogrfico: o ponto, a linha e a rea. As bases de dados utilizadas por este modelo
so do tipo relacional, onde os campos contm a informao espacial e os registros
Nair Cristina Margarido Brondino - 68
representam a totalidade das unidades espaciais consideradas. Uma base de dados
geogrfica difere da base convencional, uma vez que contm a localizao espacial
de cada registro e uma tabela topolgica guarda suas relaes. De maneira geral, em
uma base de dados geogrfica pode-se associar a informao alfanumrica grfica.
Um modelo de uma base de dados vetorial mostrado na Figura 3.9.

3
1
2
1
2
3
3
1
2
BASE DE DADOS DE PONTOS
BASE DE DADOS DE LINHAS
BASE DE DADOS DE REAS

Figura 3.9 Modelo vetorial.

3.3.4. DIFERENAS ENTRE OS SIGs E O CAD

Segundo SILVA et al. (1997), a principal diferena entre um SIG e
um CAD reside no fato de que o primeiro capaz de identificar as relaes entre
objetos, ou seja, a topologia. Um exemplo de como a topologia em sistemas deste
tipo funciona, pode ser quanto interpretao do desenho. Enquanto que um CAD
interpreta um quadrado como a juno de quatro linhas, o SIG pode interpretar o
mesmo quadrado como uma rea, cujas caractersticas esto armazenadas em um
banco de dados associado, o que torna possvel realizar anlises com as
caractersticas espaciais dos objetos.
Nair Cristina Margarido Brondino - 69

3.3.5. SITUAO ATUAL DO USO DE SIG NA
AVALIAO IMOBILIRIA

Os SIGs vm sendo utilizados nas mais diversas reas de pesquisa,
com resultados bastante satisfatrios. Dentre estas reas, pode-se mencionar estudos
recentes de avaliao imobiliria, que tm utilizado esta ferramenta como banco de
dados para anlises e como um fator de visualizao espacial de caractersticas,
valores reais e valores estimados.
Entre estes estudos, pode-se mencionar o trabalho de HADDAD (1995
e 1997), que consta de um estudo sobre o mercado imobilirio para a cidade de So
Paulo feito a partir de dados de propriedades venda. Em seu trabalho foi feito um
estudo temporal-espacial da valorizao destas propriedades, assim como dos plos
de valorizao da cidade.
Em outro trabalho, levado a cabo por SILVA & WAERDEN (1997)
para fins de taxao, se estudou, atravs do uso de SIG, a aplicao de dois modelos
designados a calcular o custo adicional para levar redes de infra-estrutura e de
transporte urbano a bairros localizados na periferia e separados da cidade por
grandes vazios urbanos. Ainda com vistas taxao de propriedades, pode-se citar o
relato de ULUACHA (1997), desenvolvido para a Nigria.
BRONDINO & SILVA (1998a e 1998b) tambm utilizaram SIG em
aplicaes de seus modelos de avaliao para duas cidades brasileiras: So Carlos e
Araariguama, respectivamente.
Dentro da literatura brasileira, pode-se citar ainda outros casos de
utilizao de SIGs em trabalhos de avaliao de imveis, tais como DUARTE &
GABBAY (1995), YUAA (1996), RAIA JR et al. (1996a e 1996b) e SILVA
(1998). A utilizao da ferramenta para este fim se intensifica devido ao fato de que
em um SIG, as propriedades de grficos interativos permitem ao usurio gerar
sadas grficas rapidamente e resumir ou relacionar dados estatsticos num contexto
geogrfico. Esta tcnica grfica fornece um mtodo efetivo de avaliao dos
resultados de anlise, particularmente com grandes conjuntos de dados (HSIAO &
Nair Cristina Margarido Brondino - 70
STERLING, 1992). Esta propriedade do SIG pode ser ainda incrementada com o
uso de um conjunto de tcnicas especficas denominado estatstica espacial, como
se pode ver no prximo tpico.

3.3.6. ESTUDOS PRELIMINARES SOBRE ESTATSTICA
ESPACIAL

A estatstica espacial definida como uma coleo de tcnicas para
anlise geogrfica onde o resultado da anlise depende do arranjo espacial dos
eventos. Evento geogrfico entendido como uma coleo de pontos, linhas ou
objetos, localizados no espao, ligados com uma classe de atributos... (HAINING,
1995).
Baseado na coleo sistemtica de informao quantitativa, os
objetivos da estatstica espacial so:

1) Descrio cuidadosa e precisa de eventos no espao geogrfico
(incluindo a descrio de padres);
2) Explorao sistemtica do padro dos eventos e a associao entre
eventos no espao com o objetivo de ganhar um melhor
entendimento dos processos que podem ser responsveis pela
distribuio dos eventos observada, e
3) Melhorar a habilidade de predizer e controlar eventos que ocorrem
no espao geogrfico.

O interesse por ferramentas de estatstica espacial acopladas aos
Sistemas de Informao Geogrfica (SIG) tem crescido significativamente
(LONGLEY & BATTY, 1996). Alguns SIGs j tm ferramentas deste tipo
acopladas ao programa, como o caso do software ARC INFO. Alguns
pesquisadores, por sua vez, fazem ligaes entre pacotes estatsticos e SIGs.
Outros, ainda, desenvolvem macros especficas para este tipo de anlise dentro do
prprio SIG.
Nair Cristina Margarido Brondino - 71
Os resultados obtidos at o presente momento sugerem que os grupos
de mtodos para os quais a ligao com o SIG vm produzindo melhores resultados
seriam aqueles das estatsticas descritivas simples e os relacionados com a estrutura
de anlise de covarincia. Outras reas da estatstica tais como mtodos de
alisamento, funes-K e regresso espacial podem produzir benefcios equivalentes.
Porm, at o presente momento, um progresso moderado tem sido em direo
visualizao geogrfica. Algum progresso tambm tem sido observado com relao
a mtodos estatsticos descritivos, o que conduz impresso de que muita coisa
ainda pode ser feita com relao ao casamento estatstica espacial-SIG. Neste
sentido, esforos podem ser destinados no ao desenvolvimento de ferramentas
internas ao SIG mas sim na melhora da interface entre programas estatsticos e
SIGs.
Segundo LEVINE (1996), h algumas estatsticas espaciais que
podem descrever a distribuio espacial dos dados. As variveis que podem ser
descritas espacialmente podem tanto ocorrer em localizaes pontuais nicas
(acidentes, construes, pessoas) ou estar agregadas (zonas de trfego, limites da
cidade etc.). As estatsticas que podem descrever tanto pontos quanto reas
pertencem a trs categorias gerais:

1. Medidas de distribuio espacial: descrevem o centro, a disperso,
direo e forma da distribuio de uma varivel;
2. Medidas de auto-correlao espacial: descrevem a relao entre as
diferentes localizaes para uma varivel simples, indicando o grau
de concentrao ou disperso, por exemplo, anlise de clusters;
3. Medidas de associao espacial entre duas ou mais variveis:
descrevem a correlao ou associao entre variveis distribudas no
espao, por exemplo, correlacionar lojas de bebidas com lugares
onde ocorrem acidentes.
Nair Cristina Margarido Brondino - 72

O mesmo LEVINE (1996) recomenda alguns programas de
computador j disponveis para executar este tipo de anlise de acordo com o tipo
de problema a ser estudado.
Desta forma, utilizando estes conceitos, cada vez mais, pesquisadores
tm feito uso desta tcnica, que no entanto ainda bastante incipiente. Um exemplo
da utilizao de estatstica espacial em avaliao imobiliria vem do trabalho de
BULLEN (1997). Em seu trabalho, modelos de regresso foram usados para estimar
valores de propriedades no Reino Unido. A autora apresenta uma introduo
modelagem em mltiplos nveis (Multilevel), onde modelos diferentes de avaliao
so estimados para diversas regies. Os resduos so, ento, adicionados a um
Sistema de Informao Geogrfica, onde as regies com preos abaixo e acima da
mdia podem ser visualmente identificadas.
Ainda nesta direo, o trabalho de PATKAR (1997) sugere
combinaes possveis de ferramentas matemticas e SIG e o trabalho de WONG &
WU (1995) alerta para o perigo da agregao, sugerindo alguns mtodos para
calcular os erros e distores provocados por este procedimento.
Alm dos mtodos estatsticos convencionais para anlise espacial,
um estudo desenvolvido por WYATT (1997) faz uso de Redes Neurais (Kohonen)
para fazer anlise de agrupamentos.
Como pode ser observado por esta breve pesquisa bibliogrfica, a
estatstica espacial se apresenta como uma ferramenta poderosa de anlise em vrios
campos de estudo (RIPLEY, 1981). Porm, sua unio com os SIGs est ainda em
fase bastante inicial e se apresenta como uma ferramenta potencial de anlise.
Nair Cristina Margarido Brondino - 73





4. METODOLOGIA


Neste capitulo sero explicados os procedimentos adotados para o
desenvolvimento deste trabalho. Na seqncia, haver uma
explanao sobre as cidades que foram objeto deste estudo e do
processo de coleta de dados empregado para cada uma delas.

O mtodo empregado para o desenvolvimento desta pesquisa foi
desenvolvido com base nos principais objetivos deste trabalho que, de forma
resumida, so os seguintes:

Identificar variveis importantes para a formao do valor da propriedade
Utilizar Redes Neurais para estimar valores das propriedades
Avaliar a influncia da acessibilidade na valorizao da propriedade urbana

Estabelecidos os objetivos, houve a necessidade de se identificar as
fontes de dados necessrias. Para tal fim, as prefeituras de duas cidades foram
contatadas: Araariguama e So Carlos. A primeira, colocou disposio um
levantamento de caractersticas da maioria das propriedades locais, feito em 1995.
Quanto segunda, alm dos dados do Censo de 1991, fornecidos pelo IBGE, a
prefeitura colocou disposio alguns dados constantes no setor de cadastro.
Escolhidas as cidades, o prximo passo foi decidir quais variveis
fariam parte do modelo de avaliao, com base na bibliografia pesquisada. Para a
Nair Cristina Margarido Brondino - 74
cidade de Araariguama, as variveis escolhidas ficaram limitadas aos principais
aspectos constantes na ficha de cadastro. Para So Carlos, foi elaborada uma ficha
com diversas caractersticas das propriedades a serem pesquisadas.
O prximo passo foi o de coleta da amostra. Para Araariguama, a
amostra constou, praticamente, da totalidade de terrenos vazios situados em seis
bairros. Para So Carlos, a amostra foi dimensionada com base no valor por m
2
.
Os preos dos terrenos em Araariguama tambm foram fornecidos
por um cadastro da prefeitura. Para So Carlos, caractersticas e preos de terrenos
venda foram levantados junto s imobilirias.
Os terrenos amostrados foram, ento, digitalizados nos mapas de
ambas as cidades atravs de recursos do software TransCAD
7
, para que as
caractersticas espaciais, como a acessibilidade, pudessem ser levantadas.
Construdos os conjuntos de dados, estes foram divididos, de forma
aleatria, em trs grupos distintos, destinados para cada uma das trs fases do
modelo de Redes Neurais, ou seja, treinamento (50% dos dados), validao e teste
(25% dos dados em cada). Esta diviso foi feita trs vezes para cada uma das
cidades, gerando trs grupos distintos de dados. Como, em geral, a definio do
nmero de camadas escondidas e de neurnios em cada uma delas camadas se d
por experimentao, redes com vrias configuraes foram testadas, utilizando
como ferramenta o software Neural Planner, verso 4.2. Cada configurao de rede
foi testada para cada um dos trs grupos de dados e o erro relativo total, cuja
frmula dada pela equao (48), foi calculado em cada caso. Desta forma, gerou-
se trs valores de erro para cada topologia. O prximo passo constou do clculo da
mdia destes erros. Assim, o valor mnimo para esta mdia conduziu melhor
topologia, ou seja, configurao de rede que forneceria estimativas mais prximas
ao valor real observado.

=
o
e o
erros
(48)

7
TransCAD um programa criado e comercializado pela Caliper Corporation, 1172 Beacon Street, Newton,
MA 02161, USA.

Nair Cristina Margarido Brondino - 75

onde o representa o valor observado e e, o valor estimado pelo modelo.
Alm da mdia dos valores dos erros fornecidos pela equao (48), os
valores do R
2
, obtido pelo mesmo critrio utilizado na regresso, tambm foi
utilizado para verificar a adequabilidade do modelo escolhido.
Para verificar a influncia das variveis no valor dos lotes, aps
escolhida a melhor configurao de rede, NATH et al. (1997) sugerem que a
relevncia de cada varivel no modelo pode ser analisada segundo o mtodo
proposto por Garson
8
. Este mtodo particiona os pesos sinpticos entre a camada
intermediria e a de sada em componentes associados a cada n de entrada. Assim,
o peso resultante associado a cada entrada um reflexo de sua importncia.
Tal mtodo descrito aqui de forma resumida. Inicialmente, assume-
se que w
ij
(i=1,...,k; j=1,...,p) seja o peso que conecta o neurnio de entrada i com o
neurnio j na camada intermediria. Da mesma forma, assume-se que w
rs
(r=1,...,p)
seja o peso que conecta o neurnio r da camada intermediria com o neurnio de
sada. Ento, o peso w
rs
, independentemente de seu sinal pode ser incorporado aos
pesos w
ij
, usando a expresso (49), a seguir:

{ }( )
rs j ij ij
W S w w /
*
= (49)

onde

=
=
k
i
ij j
W S
1
.
A seguir, para cada n de entrada, os pesos ajustados so somados
para cada um dos ns da camada intermediria, ou seja, para todo i calcula-se

.
Desta forma, o percentual dado pela equao (50) serve como uma medida de
salincia da varivel representada pelo n de entrada.
*
ij
w
=
p
j
ij
w
1
*

8
Garson, D. G. Interpreting neural-network connection weights. AI Expert, 1991, April, 47-51.
Nair Cristina Margarido Brondino - 76

= =
=
=
k
i
p
j
ij
*
ij
w
w
1 1
*
p
1 j
(%) i varivel da relevncia (50)

Uma vez identificadas as variveis relevantes, uma nova rede
treinada considerando-se apenas estas variveis como entrada. O percentual de
representao de uma varivel que a torne irrelevante depende do autor e do
assunto. Para este estudo em particular, foram retiradas as variveis que
apresentavam percentuais de representao iguais ou menores a 5%.
O prximo passo constou da comparao espacial dos resultados,
objetivando verificar se os erros obtidos pelos mtodos empregados possuam
algum padro de distribuio espacial. Esta comparao de resultados partiu da
idia de verificar em quais bairros os modelos no apresentavam boas estimativas e,
se possvel, corrigir a distoro existente, atravs da adio de algum elemento novo
ao modelo. A primeira alternativa para este tipo de estudo seria a utilizao de um
programa especfico para anlise espacial, conforme o sugerido por LEVINE
(1996). Porm, como no havia disponibilidade imediata deste tipo de software,
resolveu-se utilizar um mtodo misto, onde tcnicas estatsticas de agrupamento
foram utilizadas e o resultado obtido foi adicionado ao SIG.
Para a construo dos mapas temticos em questo, os erros relativos
obtidos para cada um dos trs conjuntos, utilizando o Modelo de Regresso como
padro, foram agrupados pelo mtodo dos k-vizinhos mais prximos. Para cada
conjunto, os erros foram divididos em quatro clusters, cujos limites tambm foram
utilizados para construir os intervalos dos erros obtidos pelas ANN. A seguir,
verificou-se o percentual de pontos que se enquadrava em cada cluster para ambos
os mtodos.

4.1. A CIDADE DE ARAARIGUAMA

Araariguama uma cidade localizada a aproximadamente 40 km de
So Paulo e foi, durante muitos anos, distrito do municpio de So Roque e somente
Nair Cristina Margarido Brondino - 77
h pouco tempo conseguiu sua emancipao. Como caracterstica principal do
lugar, pode-se citar que ela uma cidade do tipo dormitrio, ou seja, boa parte de
sua populao economicamente ativa trabalha nas cidades vizinhas, principalmente,
So Paulo, So Roque e Sorocaba.
Atualmente, o nmero de habitantes no lugar est em torno de 6000 e
o nmero de propriedades, aproximadamente 1500, entre terrenos e construes. A
cidade est dividida em nove bairros, a saber: Centro, Vila Real, Vale da Beno,
Chcara Dora, Terra Baixa, Vila Alumnio, Cintra Gordinho, Estncia Imperial e
Vila Nova.

4.1.1 COLETA DE DADOS

Por ocasio do levantamento de dados para este projeto, a Prefeitura
local havia iniciado os trabalhos de cadastramento das propriedades e possua
registros apenas daquelas localizadas em seis dos bairros citados: Centro, Vila Real,
Vale da Beno, Chcara Dora, Estncia Imperial e Vila Nova. Dentre as
caractersticas constantes nos arquivos originais deste cadastro, procurou-se retirar
as mais relevantes para construir o modelo de avaliao, com base na bibliografia
pesquisada.
As variveis retiradas do cadastro, acompanhadas das codificaes
empregadas na construo do banco de dados, so dadas a seguir:
FORMA: forma do terreno - varivel binria, assumindo valor 1
(regular) ou 0 (irregular);
TESTADA: testada principal do terreno (m);
REA: rea do terreno (m
2
);
MURO: existncia de muro - varivel binria, assumindo valor 1
(presena) ou 0 (ausncia);
CALADA: existncia de calada - varivel binria, assumindo
valor 1 (presena) ou 0 (ausncia);
Nair Cristina Margarido Brondino - 78
SITUAO: situao dentro da quadra - varivel binria,
assumindo valor 1 (esquina) ou 0 (outros);

A stima varivel empregada, menor caminho percorrido at o centro
atravs da malha viria em quilmetros (MC), foi obtida atravs de uma rotina do
software TransCAD.
Os preos dos imveis foram obtidos, tambm de cadastro da
Prefeitura, por um ex-aluno de Engenharia Civil desta Escola, oriundo da cidade em
questo, como parte de um trabalho de graduao.
Diante do que se exps, pode-se dizer que no houve, para este
projeto, no caso de Araariguama, um trabalho prvio de dimensionamento da
amostra, nem um critrio de amostragem especfico. Porm, a amostra constituda
de 157 lotes, ou seja, mais que 10% do total de endereos (contando-se construes
e terrenos vazios) da cidade. Para os seis bairros citados, a amostra constituda
praticamente da totalidade da populao de imveis no construdos.
Um mapa da cidade, onde podem ser vistos os terrenos constantes da
amostra, apresentado na Figura 4.1.

Figura 4.1 - Distribuio espacial dos lotes pesquisados na cidade de Araariguama.
Nair Cristina Margarido Brondino - 79
4.2 A CIDADE DE SO CARLOS

So Carlos situa-se na regio centro-oeste do estado de So Paulo,
distante 230 km da capital. Possui cerca de 160.000 habitantes e conta hoje com um
importante centro industrial, quando comparada s demais cidades do interior com
mesmo porte. Possui empresas como Johann Faber (utenslios para desenho e
escrita), Tecumseh (compressores), Eletrolux Prosdcimo (eletrodomsticos),
Latina (eletrodomsticos) e Volkswagen (automotiva). Possui ainda vrias empresas
de pequeno e mdio porte, que atuam na rea de mquinas agrcolas, componentes
para as empresas de porte maior e informtica. Conta ainda com o Parque de Alta
Tecnologia, estrutura montada para fornecer apoio a novos empreendimentos
ligados a tecnologias de ponta.
Possui tambm duas Universidades pblicas, um campus da
Universidade de So Paulo e o campus da Universidade Federal de So Carlos, que
somados EMBRAPA (Empresa Brasileira de Pesquisa Agropecuria) tornam a
cidade um importante centro de pesquisas.

4.2.1 COLETA DE DADOS

Como se pode notar pelos modelos citados anteriormente, cada
modelo de avaliao pode fazer uso dos mais diversos tipos de variveis. Cada lugar
apresenta caractersticas prprias de valorizao e deve ser tratado individualmente.
Um modelo que produz bons resultados para uma cidade, pode no fornecer boas
estimativas para outra, mesmo estando as duas muito prximas fisicamente.
Para a coleta de dados em So Carlos, recorreu-se inicialmente ao
Setor de Cadastro da Prefeitura Municipal, onde os fechamentos de quadra, que so
uma espcie de planta de cada quarteiro, foram obtidos. Nestes fechamentos
constam todos os imveis pertencentes quadra, assim como os respectivos
endereos. Tais dados, totalizando mais de 2800 quadras, foram utilizados para a
execuo do plano de amostragem e para a localizao dos lotes amostrados no
mapa da cidade.
Nair Cristina Margarido Brondino - 80
Para a escolha das variveis que fariam parte deste estudo, foram
consultados alguns especialistas na rea imobiliria em So Carlos, a fim de
verificar quais so os fatores que mais pesam para o comprador na aquisio de um
imvel. De posse destas informaes, de algumas variveis utilizadas em estudos
similares e das variveis sugeridas pela Norma NBR 5676, elaborou-se uma ficha
para a execuo da pesquisa de campo. As variveis constantes nesta ficha,
acompanhadas de suas codificaes para entrada no banco de dados, so dadas a
seguir:
REA: rea do terreno (m
2
);
TESTADA: testada principal do terreno (m);
TOPOGRAFIA: declividade do terreno varivel binria,
assumindo valor1 (plano) ou 0 (outros);
FORMA: forma do terreno - varivel binria, assumindo valor 1
(regular) ou 0 (irregular);
SITUAO: situao dentro da quadra - varivel binria,
assumindo valor 1 (esquina) ou 0 (outros);
EDIF: existncia de edificaes na quadra varivel binria
assumindo valor 1 (sim) ou 0 (no);
GUA: existncia de rede de gua tratada varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
ESGOTO: existncia de rede de esgoto varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
LUZ: existncia de rede de energia eltrica - varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
ASFALTO: existncia de pavimentao varivel binria
assumindo valor 1 (presente) ou 0 (ausente);
MURO: existncia de muro - varivel binria assumindo valor 1
(presente) ou 0 (ausente)
Nair Cristina Margarido Brondino - 81
CALADA: existncia de calada - varivel binria assumindo
valor 1 (presente) ou 0 (ausente)

As caractersticas fsicas obtidas foram lanadas num Sistema de
Informaes Geogrficas. A medida de acessibilidade utilizada, ou seja, a distncia
ao centro atravs da malha viria dada em quilmetros (MC), tambm foi obtida a
partir dos recursos do SIG utilizado, neste caso, o software TransCAD.
A princpio, duas eram as possibilidades para a aquisio de dados:
uma junto s imobilirias locais e outra junto ao Cartrio de Registro de Imveis da
cidade. A segunda opo foi logo descartada porque, conforme informaes de
corretores, em geral, as escrituras na cidade so registradas utilizando-se o valor
venal do imvel fornecido pela Prefeitura, que bastante baixo comparado ao valor
de mercado, tornando esta informao muito pouco confivel. Optou-se, ento, por
procurar os dados nas imobilirias.
Segundo alguns profissionais do setor imobilirio consultados em So
Carlos, h atualmente na cidade uma grande oferta de terrenos, devido ao ltimo
plano de estabilizao monetria do governo federal (Plano Real). Quem adquiriu
um terreno antes do Plano Real para vend-lo mais tarde a um preo mais elevado
teve uma surpresa: ningum quer comprar. Estas pessoas querem agora vender os
imveis a um preo que seja, no mnimo, igual ao preo que pagaram. Acontece que
este preo ainda est acima do valor que os compradores aceitam pagar hoje,
fazendo com que haja hoje uma grande oferta de terrenos, mas com preos muito
altos. Portanto, os preos dos terrenos a serem utilizados sero aqueles a princpio
almejados pelos proprietrios destes e que muitas vezes esto acima do valor de
mercado e acabam sendo vendidos com descontos.
Alm disso, infelizmente, a maioria das imobilirias no dispe de
todos os dados desejados sobre as caractersticas dos lotes. Quase todas as
imobilirias organizam os dados em fichas e cadernos, pouqussimas organizam em
computadores pessoais e, em algumas, somente o corretor tem conhecimentos sobre
os dados dos terrenos, o que dificulta muito a coleta. Outro fator que atrapalha a
amostragem a ausncia de exclusividade de venda do terreno pela imobiliria. O
Nair Cristina Margarido Brondino - 82
dono do terreno pode coloc-lo venda em quantas imobilirias ele quiser, por isso
quase no h placas em terrenos que esto venda, impossibilitando uma coleta de
dados in loco antes de realizar a pesquisa em imobilirias. No caso de haver dados
do mesmo terreno em mais que uma imobiliria, assumiu-se como seu preo a
mdia entre todos os valores pedidos por ele.

4.2.1.1 DIMENSIONAMENTO DA AMOSTRA

Para a coleta de dados, a cidade foi dividida em trs grupos diferentes
de terrenos. Esta escolha deu-se pelo fato da cidade possuir propriedades com os
mais variados valores por metro quadrado e caractersticas. Optou-se, ento, por
dividir a cidade em bairros de trs categorias, a saber: A, B e C, sendo os do tipo A,
os bairros que apresentam o m
2
mais caro. Com esta diviso, alm de conseguir
bons resultados com amostras menores, pode-se obter modelos mais precisos em
termos de avaliao. Um modelo que contivesse todos os tipos de propriedades,
implicaria numa grande variabilidade de valores e poderia subestimar ou
superestimar o valor de algumas. Para esse fim, foram consultados especialistas na
rea de mercado imobilirio e, a partir dos dados fornecidos por estes e do
mapeamento de renda obtido pelos dados do Censo de 1991, a diviso em classes
foi elaborada como consta nas Tabelas 4.1, 4.2 e 4.3. Como bairros do tipo A, foram
considerados aqueles cujos terrenos apresentassem valores maiores que R$ 50,00
por m
2
. Como bairros do tipo B, classificou-se aqueles onde o valor por metro
quadrado est situado na faixa de R$ 36,00 a R$ 50,00 e do tipo C, os de valor por
m
2
abaixo de R$ 36,00.
Nair Cristina Margarido Brondino - 83

Tabela 4.1 - Classificao dos bairros da cidade de So Carlos pela classe de preo
A.
Centro Chcara So Joo
Cidade Jardim Jardim Bethania
Jardim Macarengo Jardim Ricetti
Jardim Santa Helena Jardim Santa Paula
Parque Arnoldo Schimid Parque Estncia Suia
Parque Nova Estncia Suia Parque Sabar
Parque Santa Mnica Vila Elisabeth
Vila Monteiro Vila Nery
Jardim Nova Santa Paula Jardim So Carlos
Loteamento Albertini Loteamento Centreville
Loteamento Taba Yacy Vila Prado

Tabela 4.2 - Classificao dos bairros da cidade de So Carlos pela classe de preo
B.
Chcara So Caetano Jardim Bandeirantes
Jardim Brasil Jardim Centenrio
Jardim Gilbertoni Jardim Hikari
Jardim Luthfalla Jardim Nossa Senhora Aparecida
Jardim Nossa Senhora de Ftima Jardim Nova So Carlos
Jardim Paulista Jardim Paulistano
Morada dos Deuses Ncleo Residencial Silvio Villari
Parque Industrial Miguel Abdelnur Parque Paraso
Parque Primavera Parque So Jos
Portal do Sol Recreio dos Bandeiraantes
Solar do Engenheiros Tijuco Preto
Vila Arnaldo Vila Bela Vista
Vila Boa Vista Vila Brazilia
Vila Costa do Sol Vila Marina
Vila Pelicano Vila Pureza
Vila Rancho Velho Vila Santo Antnio
Vila So Jos Vila Vista Alegre
Jardim Alvorada Jardim Cardinalli
Parque Santa Mnica II Vila Deriggi
Planalto Paraso Vila Faria
Jardim So Joo Batista Jardim So Paulo
Vila Alpes Vila Marcelino
Vila Marigo Vila Morumbi
Vila Redeno
Nair Cristina Margarido Brondino - 84

Tabela 4.3 - Classificao dos bairros da cidade de So Carlos pela classe de preo
C.
Chcara Bataglia Chcara Monjolinho
Chcara Paraso Chcaras de Recreio Mont Carlo
Cidade Aracy Jardim Beatriz
Jardim Botafogo Jardim Cruzeiro do Sul
Jardim das Rosas Jardim Gonzaga
Jardim Guanabara Jardim Jockey Clube
Jardim Maracan Jardim Maria Alice
Jardim Medeiros Jardim Pacaembu
Jardim Paraso Jardim Real
Jardim Santa Maria Jardim Santa Tereza
Jardim So Gabriel Jardim Tangar
Loteamento D'Aquino Ncleo Residencial Castello Branco
Parque Delta Parque Delta II
Parque Industrial Parque Sisi
Recreio So Judas Tadeu Residencial Itamaraty
Santa Felcia So Carlos II
So Carlos III So Carlos IV
Vila Carmen Vila Celina
Vila Conceio Vila Isabel
Vila Jacobucci Vila Monte Carlo
Vila Santa Madre Cabrini Vila Santa Maria
Vila Marques

Estimao do tamanho da amostra:

O primeiro passo foi definir o tamanho da amostra que iria ser retirada
de cada grupo. Uma escolha natural seria a de que o tamanho da amostra deveria ser
proporcional populao total do grupo a que ela pertencia.
Pelo critrio de amostragem sugerido por COCHRAN (1953), pode-se
dimensionar o tamanho da amostra e, conseqentemente o de cada grupo, a partir de
uma varincia desejada, V, que pode ser obtida atravs de estudos prvios ou
situaes parecidas. Esta varincia pode, ainda, ser obtida atravs de um coeficiente
de variao, estimado como sendo igual a um percentual do valor da mdia. Como
no havia, pelo menos nos ltimos anos, algum trabalho em avaliao de terrenos
atravs do qual uma estimativa para esta varincia pudesse ser obtida, foi feita uma
estimativa grosseira do valor da mdia dos terrenos para toda a populao e
atribuiu-se um desvio padro, aceitvel, que fosse igual a 20% do valor desta mdia.
Nair Cristina Margarido Brondino - 85
Em termos quantitativos, para uma mdia global igual a R$43,63, foi assumido um
desvio padro como sendo 20% deste valor, ou seja, igual a 0,20 que multiplicado
por 43,63, resultou em 8,73. Foi atravs deste desvio-padro desejado, que o
dimensionamento da amostra foi obtido. O valor estimado desta mdia global foi
obtido a partir de informaes fornecidas por algumas imobilirias, onde faixas de
valores por m
2
para terrenos situados em alguns dos bairros das categorias A, B e C
foram obtidas.
De posse do valor de V, o tamanho total da amostra, n, foi obtido
atravs da equao (51):
n
n
V
N s
h h
=
+

0
2
1
1
(51)

onde:
( )
n
N s
V
h h
0
2
=

;
s
h
2
: varincia amostral do grupo h;
N
h
: tamanho da populao do grupo h.
Sendo n
h
o tamanho da amostra que vai ser retirada do grupo h, este
nmero vai ser dado por:
n
nW s
W s
h
h h
h h
=

(52)
onde: W
N
N
h
h
=
Atravs dos registros armazenados nos fechamentos de quadra no
Setor de Cadastro da cidade fez-se a contagem de quantos terrenos sem construo
existem em So Carlos, ou seja, o nmero total de lotes, N, chegando-se a um total
de 15052. A partir da, estas propriedades foram classificadas de acordo com as
classes citadas nas Tabelas 4.1, 4.2 e 4.3, chegando-se s caractersticas de cada
estrato, conforme mostrado na Tabela 4.4. Os valores das varincias utilizadas
tambm foram calculados com base em informaes de corretores, que forneceram,
a priori, a faixa de preos por m
2
, em vrios bairros das classes A, B e C da cidade.
Nair Cristina Margarido Brondino - 86

Tabela 4.4 - Caractersticas das categorias.
GRUPO
TAMANHO
DO GRUPO
(N
h
)
VARINCIA DOS
VALORES POR
M
2

DESVIO PADRO
DOS VALORES
POR M
2
(s
h
)
W
h
= N
h
/N
A 1701 2116 46,00 0.11
B 3790 11,36 3,37 0.25
C 9561 7,10 7,10 0.64

A dimenso total da amostra foi obtida pela equao (51), utilizando-
se os valores da Tabela 4.4, chegando-se a um valor de n igual a 2641. Os tamanhos
das amostras para cada grupo foram obtidos pela equao (52) e so dados por
1301, 212 e 1128, para os estratos A, B e C, respectivamente.
Com o objetivo de verificar a adequabilidade do tamanho da amostra
proposta por COCHRAN (1953), outra estimativa foi feita com base na frmula
para dimensionamento de n, proposta por LEVY & LEMESHOW (1991).
Suponha que desejamos determinar o nmero de elementos
necessrios para ter 100 x (1 - )% de certeza de obter, da amostra aleatria
estratificada, uma mdia estimada, x que difere da verdadeira mdia
str
X em no
mais que 100 x %... A frmula para o n requerido como segue:

n
z
N
N
X
z
N
N
X
h hx
h h
L
h hx
h
L

|
\

|
.
|
|
\

|
.
|
+
|
\

|
.
|
|
\

|
.
|

1 2
2
2
2 2
2
1
2 1 2
2
2
2
2
1

/
/
(53)
onde: N: tamanho populacional
N
h
: tamanho do grupo h
z: valor tabelado da Distribuio Normal
X
2
: mdia global

hx
2
: varincia do grupo h

h
= n
h
/n
Nair Cristina Margarido Brondino - 87

Utilizando os mesmos dados do caso anterior, com =20%, o valor de
n obtido pela frmula (53) vai ser igual a 1637, ou seja, menor que o obtido
anteriormente. Os tamanhos das amostras a serem retiradas dos grupos A, B e C
ficaram com as seguintes dimenses: 809, 131 e 697, respectivamente.
Calculados os tamanhos amostrais, iniciou-se a coleta de dados. No
foi possvel, entretanto, obter o tamanho da amostra desejado a princpio pois toda a
populao de terrenos venda na cidade de So Carlos, tanto os ofertados em
imobilirias quanto em jornais, esgotou-se, totalizando 480 lotes amostrados.
Porm, isso no se torna um problema, pois, a maioria dos autores que publica
estudos sobre avaliao utiliza apenas uma amostra dentre os imveis que esto
venda. Somente para exemplificar, pode-se citar aqui os seguintes trabalhos:
GONZLEZ (1995 e 1996), GONZLEZ & FORMOSO (1994), VERTELO
(1996), TRIVELLONI et al. (1996) e BRANDO et al. (1995). O mapa para a
cidade de So Carlos, com os terrenos amostrados mostrado na Figura 4.2.


Figura 4.2- Distribuio espacial dos lotes pesquisados na cidade de So Carlos.
Nair Cristina Margarido Brondino - 88





5. RESULTADOS


Este captulo inicia com os resultados relativos ao primeiro estudo
de caso deste trabalho: Araariguama. Sero apresentados o modelo
de regresso estimado, os resultados obtidos com a aplicao das
Redes Neurais e uma comparao numrica e espacial do
desempenho dos dois mtodos. Em seguida, mostrado o estudo de
caso para a cidade de So Carlos, seguindo a mesma estrutura de
apresentao.

5.1. ESTUDO DE CASO: ARAARIGUAMA

5.1.1. MODELO DE REGRESSO PARA A CIDADE DE
ARAARIGUAMA

A escolha de um modelo adequado para a cidade de Araariguama
obedeceu a um processo de tentativa e erro, onde vrios modelos foram testados, a
fim de obter aquele que melhor se adequasse ao conjunto de dados.
Inicialmente ajustou-se um modelo do tipo linear aos dados,
considerando-se o preo por m
2
como varivel resposta. O valor 0,53 encontrado
para o coeficiente R
2
, mostrou que o modelo ajustado no era satisfatrio. Tentou-
se, ento, adicionar fatores de interao entre rea e testada, rea e menor caminho e
Nair Cristina Margarido Brondino - 89
testada e menor caminho, obtendo-se uma melhora significativa no coeficiente de
determinao, que passou de 0,53 para 0,72. Quando a interao destes trs fatores
foi acrescentada a este modelo, no entanto, este coeficiente sofreu um aumento
desprezvel, em torno de 0,01. Alm disso, tal modelo no obedeceu s suposies
de Normalidade e varincia constante do distrbio aleatrio.
A alternativa encontrada foi fazer novas tentativas, empregando-se
transformaes aos dados numricos. Para tal, foram feitos grficos de preo/m
2

versus rea, preo/m
2
versus testada e preo/m
2
versus menor caminho.
Posteriormente, foram ajustadas curvas aos pontos de cada um destes grficos, cujos
melhores resultados foram obtidos atravs das seguintes relaes:

Preo/m
2
= funo (rea
-0.5
), cujo valor para o R
2
foi aproximadamente igual
ao obtido para a relao Preo/m
2
= funo (ln (rea))
Preo/m
2
= funo (testada
-0.6
), cujo valor para o R
2
foi aproximadamente
igual ao obtido para a relao Preo/m
2
= funo (ln (testada))
Preo/m
2
= funo (mc + mc
2
)

Devido maior facilidade de anlise, a relao do tipo logartmica foi
escolhida para introduzir no modelo as variveis rea e testada. J para a varivel
mc, com o objetivo de facilitar a interpretao dos resultados, seguiu-se a sugesto
de CASSIDY (1980), que recomenda que apenas um dos termos seja adicionado ao
modelo, preferencialmente o termo quadrtico. Porm, quando o modelo geral foi
testado, este termo conduziu a um menor valor para o R
2
, com relao ao modelo
que s continha esta varivel em sua forma pura.
Os resultados obtidos para as melhores tentativas so mostrados na
Tabela 5.1, onde foram includas apenas as equaes que obtiveram um R
2
maior
que 0,30.

Nair Cristina Margarido Brondino - 90
Tabela 5.1 - Melhores modelos de regresso ajustados, considerando o preo por
m
2
para a cidade de Araariguama.

MODELO R
2
1
(Preo/m
2
) = funo (rea, testada, forma, muro,
calada, menor caminho, situao)
0,53
2
(Preo/m
2
) = funo (rea, testada, forma, muro,
calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc )

0,72
3
(Preo/m
2
) = funo (rea, testada, forma, muro,
calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc,
rea*testada*mc)

0,73
4
(Preo/m
2
) = funo ((rea)
-0.5
, testada, forma,
muro, calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc)

0,74
5
(Preo/m
2
) = funo ((rea)
-0.5
, (testada)
-0.6
, forma,
muro, calada, menor caminho, situao,
rea*testada, rea*mc, testada*mc)

0,76
6
(Preo/m
2
) = funo ((rea)
-0.5
, (testada)
-0.6
, forma,
muro, calada, (mc)
2
, situao, rea*testada,
rea*mc, testada*mc)

0,72
7
(Preo/m
2
) = funo (mc, forma, situao, muro,
calada, (rea)
-0.5
, testada
-0.6
, (mc)
2
,
rea*testada, rea*mc, testada*mc)

0,81
8
(Preo/m
2
) = funo (mc, forma, situao, muro,
calada, ln (rea), ln (testada), rea*testada,
rea*mc, testada*mc)

0,81


Escolhida a funo a ser utilizada (nmero 8 na Tabela 5.1), uma
anlise da multicolinearidade envolvendo as variveis independentes foi executada.
O nmero de condio obtido para a matriz normalizada X'X foi igual a 46,07,
indicando a possvel existncia de dependncia linear entre duas ou mais variveis.
Para identificar as variveis envolvidas em multicolinearidade, os valores do
2
ij
R
ij

foram calculados para cada par de variveis. Os resultados obtidos so mostrados
nas Tabelas 5.2 e 5.3, respectivamente.

Nair Cristina Margarido Brondino - 91
Tabela 5.2 - Valores de
ij
obtidos para as colunas da matriz X'X para
Araariguama.

MC FORMA SITUAO MURO
LN
(REA)
CALADA
LN
(TESTADA)
MC 0,21 0,37 0,00 0,01 0,01 0,34 0,06
FORMA 0,27 0,32 0,27 0,00 0,09 0,04 0,00
SITUAO 0,03 0,03 0,61 0,15 0,13 0,04 0,00
MURO 0,00 0,01 0,00 0,39 0,49 0,01 0,12
LN (REA) 0,00 0,00 0,00 0,00 0,00 0,03 0,97
CALADA 0,00 0,02 0,02 0,20 0,19 0,53 0,02
LN (TESTADA) 0,00 0,01 0,14 0,35 0,48 0,01 0,01

Tabela 5.3 - Valores dos obtidos para cada par de variveis para a cidade de
Araariguama.
2
ij
R
MC FORMA SITUAO MURO CALCADA LN (REA) LN (TESTADA)
MC 1,00
FORMA 0,03 1,00
SITUAO 0,00 0,08 1,00
MURO 0,00 0,02 0,00 1,00
CALCADA 0,01 0,00 0,00 0,08 1,00
LN (REA) 0,07 0,07 0,00 0,01 0,01 1,00
LN
(TESTADA)
0,01 0,04 0,01 0,02 0,00 0,56 1,00

Pode-se observar pela Tabela 5.2 que as variveis ln (rea) e ln
(testada) apresentaram um valor para o
ij
maior que 0,5, o que poderia ser
indicativo de uma possvel fonte de multicolinearidade. A Tabela 5.3 revela que o
valor do para esta relao no maior que aquele obtido para o R
2
ij
R
2
geral. Porm,
segundo GREENE (1997), a regra utilizada para comparar os R com o R
2
ij
2
geral
apenas sugestiva e "...no d indicao de como proceder". Desta forma, optou-se
por utilizar os valores da Tabela 5.2 para a tomada de deciso. Para resolver este
problema, duas eram as possveis solues. A primeira seria a execuo de uma
regresso do tipo Ridge, o que geraria estimadores viciados e um conseqente
comprometimento do resultado dos testes de hipteses. A outra alternativa seria a
retirada de uma destas duas variveis do modelo, assim como dos fatores de
interao envolvendo-as, o que poderia conduzir perda de informao. Optou-se,
ento, por elaborar as duas tentativas, verificar os resultados e, a partir da, tomar a
deciso sobre a escolha do modelo.
Nair Cristina Margarido Brondino - 92
Para a regresso Ridge iniciou-se com um valor de r igual a 0,01, que
foi sendo acrescido em 0,01 at que parmetros estveis fossem obtidos. A
estabilidade no valor dos parmetros foi obtida com r=0,04. O modelo final
apresentou um R
2
igual a 0,70 e os parmetros estimados so apresentados na
Tabela 5.4.

Tabela 5.4 - Modelo de Regresso Ridge obtido para Araariguama utilizando o
valor do m
2
como varivel dependente.
PARMETRO
ESTIMADO
DESVIO
PADRO
ESTATSTICA
t
p-level
CONSTANTE 144,49 13,1578 10,98132 7,93E-21
MC -12,5288 1,832527 -6,83692 2,05E-10
FORMA -5,88981 1,566124 -3,76075 0,000245
SITUAO 2,74178 2,122308 1,291886 0,198438
MURO -2,4022 2,983959 -0,80504 0,422107
LN (REA) -11,3232 2,155853 -5,25229 5,21E-07
AR*MC 0,002285 0,000449 5,084042 1,12E-06
CALADA 11,2199 9,237964 1,214543 0,226501
TEST*MC 0,149612 0,047678 3,137973 0,002058
LN (TEST) -11,858 3,476079 -3,41133 0,000836
AREA*TES -2,1E-05 1,08E-05 -1,95433 0,052573

A tomada de deciso sobre qual das duas variveis retirar do modelo
foi baseada no valor do R
2
. Na primeira regresso, cujo coeficiente de determinao
obtido foi igual a 0,67, tanto a varivel ln (rea) quanto os fatores de interao
envolvendo-a foram retirados. A segunda tentativa constou em retirar a varivel ln
(testada), assim como seus fatores de interao. Nesta nova situao, cujos
parmetros podem ser vistos na Tabela 5.5, o R
2
obtido foi igual a 0,72, da sua
escolha.

Nair Cristina Margarido Brondino - 93
Tabela 5.5 - Modelo de Regresso obtido para Araariguama utilizando o valor do
m
2
como varivel dependente aps a retirada da varivel ln (testada).
PARMETRO
ESTIMADO
DESVIO-
PADRO
ESTATSTICA t p-level
CONSTANTE 146,4912 13,62418 10,75229 2,56E-20
MC -10,0447 1,873369 -5,36181 3,08E-07
FORMA -6,49788 1,545863 -4,2034 4,51E-05
SITUAO 2,753884 2,055459 1,33979 0,182353
MURO -5,13412 2,9238 -1,75597 0,081148
LN (REA) -16,7819 2,436357 -6,88809 1,48E-10
REA * MC 0,002686 0,000387 6,938565 1,13E-10
CALADA 15,77541 9,091707 1,735143 0,084783

Uma comparao entre as Tabelas 5.4 e 5.5 mostra que os parmetros
obtidos para as variveis muro, ln (rea) e calada sofreram as maiores alteraes
relativas. Pode-se verificar tambm que tanto o parmetro estimado para a varivel
muro quanto para as variveis calada e situao no so significativos e, portanto,
as alteraes observadas no so um problema maior. Por outro lado, o aumento no
coeficiente da varivel ln (rea) pode ter decorrido da retirada do ln (testada) do
modelo.
Alm do valor dos parmetros, uma comparao entre as somas dos
Quadrados dos Resduos (SSE) para os dois casos foi feita com o objetivo de
verificar qual das duas situaes gerou menor erro de estimao. Para a regresso
Ridge, a SSE obtida foi igual a 11560,98 contra um valor igual a 10984,75 para a
outra alternativa.
Diante dos resultados obtidos, optou-se pelo modelo mostrado na
Tabela 5.5, uma vez que, alm de no ter sido notada nenhuma mudana
significativa com relao ao outro modelo, pode-se fazer inferncias mais seguras
com relao aos parmetros estimados.
Como os testes com relao aos parmetros s so eficientes se o
distrbio aleatrio possuir Distribuio Normal e varincia constante, estas
suposies deveriam ser verificadas a princpio. Assim, com o objetivo de verificar
a suposio de Distribuio Normal, foi elaborado um teste do tipo Qui-quadrado
para verificar a distribuio do resduo da regresso. A estatstica de teste obtida foi
Nair Cristina Margarido Brondino - 94
igual a 11,02, cujo valor foi comparado ao tabelado a um nvel de significncia de
5%, donde a suposio de distribuio Normal no foi rejeitada.
Para analisar a suposio de heterocedasticidade foi elaborado, a
princpio, o Teste Geral de White. A estatstica de teste obtida, com valor igual a
2,59 10
-14
, foi comparada com o valor tabelado da Distribuio Qui-quadrado para
um valor crtico igual a 95% e 7 graus de liberdade (14,07). Como o valor calculado
menor que o tabelado, a hiptese de homocedasticidade no foi rejeitada.
Outro teste elaborado foi o Teste de Goldfeld-Quandt. Para tal, a
amostra foi ordenada de acordo com o valor da varivel mc e dividida em trs
grupos, o primeiro e o ltimo com 55 pontos e o intermedirio com 37 pontos. A
hiptese de que a varincia no primeiro grupo seria maior que a do ltimo foi
rejeitada a um nvel de significncia igual a 5% (estatstica de teste obtida foi igual
a 0,337 - cujo valor foi comparado ao valor tabelado da Distribuio F para um
valor crtico igual a 95% com n
1
=47 e n
2
=47 graus de liberdade). Portanto, por este
teste, a hiptese de homocedasticidade tambm no foi rejeitada.
Obedecidas as suposies de homocedasticidade e Distribuio
Normal, pde-se, ento, fazer inferncias sobre os parmetros do modelo. Os dados
da Tabela 5.5 revelam que, alm do termo constante, os parmetros obtidos para as
variveis mc, forma, ln (rea) e para a interao entre a rea e a distncia so
significativos. Desta forma, pode-se notar que a forma irregular causa decrscimo
no valor do m
2
. Por sua vez, a rea e a distncia ao centro no podem ser tratadas de
forma individual. Assim, pode-se verificar que o efeito marginal (proporcional a
0,0027rea) da varivel distncia ao centro sobre o preo do m
2
sofre um ligeiro
aumento quando a rea aumenta, ou seja, reas grandes e localizadas longe da
regio central tm seu preo aumentado. Por sua vez, o efeito marginal da varivel
rea sobre o valor estimado no to fcil de ser medido, uma vez que este vai ser
proporcional a [(1/rea)+0,0027mc].

Nair Cristina Margarido Brondino - 95
5.1.2. REDES NEURAIS PARA A CIDADE DE
ARAARIGUAMA

Inicialmente, o conjunto de dados foi subdividido, de forma aleatria,
em trs subconjuntos: o primeiro para treinamento da rede, o segundo para
validao e o terceiro para teste, num total de 77, 40 e 40 lotes, respectivamente.
Esta subdiviso foi executada trs vezes, gerando trs conjuntos diferentes de dados.
O tipo de topologia empregada foi a MLP (Multlayer Perceptron) com
uma camada escondida e o algoritmo de aprendizado escolhido foi
backpropagation, com atualizao dos pesos por padro.
Inicialmente, os dados no sofreram nenhum tipo de pr-
processamento e foram montadas diversas redes, variando a taxa de aprendizado, o
momentum e o nmero de ns na camada intermediria. Como os resultados obtidos
no se mostraram satisfatrios, optou-se por normalizar os dados entre 0 e 1 e,
posteriormente, entre 0,1 e 0,9, variando-se tambm a taxa de aprendizado e o
momentum para estes dados. Os resultados das melhores tentativas, com a incluso
de todas as variveis, so mostrados na Tabela 5.6.
Para cada um dos trs conjuntos de treinamento, foram calculados os
somatrios dos erros de previso de preos, cujos valores foram obtidos atravs da
equao (35) e que tambm so mostrados na Tabela 5.6. A ltima coluna da tabela
refere-se mdia dos somatrios dos erros obtidos.

Nair Cristina Margarido Brondino - 96
Tabela 5.6 - Resultados das melhores simulaes, usando todas as variveis para a
cidade de Araariguama.
taxa Momentum Mdia dos
MODELO
n
o
neurnios na
camada intermediria aprendizado erros
1 Dados brutos 3 0,3 0,3 28,84
2 Dados brutos 7 0,5 0,8 28,79
3 Dados brutos 4 0,5 0,8 31,99
4 dados brutos 7 0,3 0,8 30,65
5 dados brutos 7 0,2 0,8 30,02
6 dados brutos 7 0,4 0,4 27,48
7 dados brutos 7 0,3 0,3 29,48
8 norm. 0 -1 7 0,4 0,3 29,29
9 norm. 0 -1 7 0,5 0,8 31,08
10 norm 0,1- 0,9 4 0,3 0,4 33,22
11 norm 0,1- 0,9 7 0,3 0,4 17,47
12 norm 0,1- 0,9 4 0,3 0,4 16,91
13 norm 0,1- 0,9 4 e 3 (2 cam. int.) 0,3 0,4 16,00
14 norm 0,1- 0,9 3 e 2 (2 cam. int.) 0,3 0,4 16,37

Pode-se verificar pelos valores acima que, com os dados normalizados
entre 0,1 e 0,9, a rede apresentou erro menor. Observa-se, tambm, que os melhores
valores para a taxa de aprendizado e o momentum ficam na escala 0,3 a 0,4.
Devido ao fato de que o mtodo de salincia de variveis proposto por
Garson somente pode ser empregado em redes com apenas uma camada
intermediria, a configurao nmero 12 foi escolhida para o seu emprego, embora
as redes 13 e 14 tenham apresentado erro ligeiramente menor. A Tabela 5.7
apresenta a salincia calculada para cada varivel em cada um dos trs conjuntos
distintos de dados.

Tabela 5.7 - Relevncia de cada varivel para a cidade de Araariguama.
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV.(%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
MC 34 MC 59 MC 41
REA 18 REA 10 REA 18
TESTADA 18 SITUAO 9 TESTADA 13
CALADA 16 TESTADA 7 SITUAO 7,5
FORMA 5 FORMA 6 FORMA 6
MURO 5 MURO 5 MURO 6
SITUAO 5 CALADA 4 CALADA 6

Nair Cristina Margarido Brondino - 97
Embora a cidade em questo seja de pequeno porte, os dados da
Tabela 5.7 revelam que a varivel menor caminho exerce a maior influncia sobre o
valor estimado para os trs conjuntos de dados, seguida pela varivel rea. Ao
contrrio do modelo de regresso, a varivel testada aparece em terceiro lugar em
dois dos conjuntos. Pode-se notar tambm que as variveis forma e muro exercem
pouca influncia sobre os valores estimados. Conforme proposto na Metodologia
apresentada aqui, as variveis cuja influncia fosse menor que 5% deveriam ser
retiradas do conjunto de dados e haveria, ento, um novo treinamento da rede.
Portanto, diante dos valores observados na Tabela 5.7, optou-se, ento, por retirar
somente a varivel muro, embora esta tenha mostrado salincia superior a este valor
para o ltimo conjunto de dados. A mesma configurao de rede foi ento treinada
para esta nova situao e a mdia dos erros obtida baixou para 16,54.

5.1.3. COMPARAO DOS RESULTADOS OBTIDOS
PELOS DOIS MTODOS PARA A CIDADE DE
ARAARIGUAMA

Os mesmos conjuntos de dados utilizados para a parte de teste das
Redes Neurais foram utilizados para estimar os erros obtidos pelo modelo de
regresso. Alm destes erros, o R
2
tambm foi calculado para os dois modelos.
Estes resultados so mostrados na Tabela 5.8.

Tabela 5.8 - Erros e R
2
obtidos para os dois modelos e os trs conjuntos de dados
para Araariguama.
REGRESSO RN
ERRO R
2
ERRO R
2
conjunto 1 29,49 0,23 18,77 0,23
conjunto 2 18,99 0,55 12,88 0,45
conjunto 3 22,61 0,62 17,98 0,79
MDIA 23,70 - 16,54 -

Os resultados mostrados na Tabela 5.8 indicam que o erro relativo
total obtido pelo modelo de regresso ficou em torno de 43% maior que aquele
fornecido pelas Redes Neurais. Quanto ao valor do R
2
, no se pode concluir muita
Nair Cristina Margarido Brondino - 98
coisa, uma vez que os valores obtidos oscilaram muito de um conjunto de dados
para outro.
Ainda com o objetivo de comparar os erros relativos obtidos atravs
da equao (48) para os dois mtodos, foram feitos os grficos mostrados nas
Figuras 5.1, 5.2 e 5.3 mostrando estes valores para ambos os mtodos e os
conjuntos de dados 1, 2 e 3, respectivamente.
GRUPO 1
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (ANN) ERRO (REG)

Figura 5.1 - Erros relativos obtidos para os dois mtodos e o primeiro conjunto de
dados para a cidade de Araariguama.

GRUPO 2
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (ANN) ERRO (REG)

Figura 5.2 - Erros relativos obtidos para os dois mtodos e o segundo conjunto de
dados para a cidade de Araariguama.

Nair Cristina Margarido Brondino - 99
GRUPO 3
0
1
2
3
4
147
1
0
1
3
1
6
1
9
2
2
2
5
2
8
3
1
3
4
3
7
4
0
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (ANN) ERRO (REG)

Figura 5.3 - Erros relativos obtidos para os dois mtodos e o terceiro conjunto de
dados para a cidade de Araariguama.

Os grficos mostrados nas Figuras 5.1, 5.2 e 5.3 indicam que, quando
observados ponto a ponto, os resultados obtidos com as Redes Neurais
apresentaram, em geral, erro relativo menor. Pode-se notar que para o primeiro e o
segundo conjuntos, a maioria dos valores fornecidos por este mtodo situou-se em
torno de 0,5, podendo-se notar a existncia de apenas um ponto discrepante para o
primeiro conjunto. Para o terceiro grupo de dados, a situao um pouco diferente,
pois pode-se notar que os erros obtidos so um pouco maiores do que os observados
anteriormente.
Num prximo passo, erros encontrados para o modelo de regresso
para cada um dos trs conjuntos foram agrupados em cinco clusters atravs da
utilizao do pelo mtodo denominado K-means clustering. Os mesmos extremos
foram, ento, utilizados para agrupar os erros fornecidos pelas Redes Neurais. A
proporo de pontos em cada categoria foi identificada (Tabela 5.9) e utilizada para
a comparao dos resultados.

Nair Cristina Margarido Brondino - 100
Tabela 5.9 - Proporo de erros relativos nos clusters encontrados com os dois
modelos para os trs conjuntos de dados para Araariguama.
Conjunto/Cluster Limites de
classe
REGRESSO RN
Conjunto 1 - Cluster1 <= 0,209 19,0% 25,5%
Conjunto 1 - Cluster 2 0,209 a 0,602 32,5% 66,0%
Conjunto 1 - Cluster 3 0,603 a 0,890 30,0% 6,5%
Conjunto 1 - Cluster 4 0,891 a 1,302 8,5% 0,0%
Conjunto 1 - Cluster 5 >= 1,303 10,5% 2,0%
Conjunto 2 - Cluster 1 <= 0,160 21,5% 32,0%
Conjunto 2 - Cluster 2 0,161 a 0,348 24,0% 16,0%
Conjunto 2 - Cluster 3 0,349 a 0,602 27,0% 35,0%
Conjunto 2 - Cluster 4 0,603 a 0,890 16,0% 16,0%
Conjunto 2 - Cluster 5 >= 0,891 11,0% 0,0%
Conjunto 3 - Cluster 1 <= 0,224 25,0% 25,0%
Conjunto 3 - Cluster 2 0,225 a 0,359 15,0% 17,5%
Conjunto 3 - Cluster 3 0,360 a 0,719 27,5% 40,0%
Conjunto 3 - Cluster 4 0,720 a 1,302 20,0% 12,5%
Conjunto 3 - Cluster 5 >= 1,303 12,5% 2,5%

Os resultados mostrados na Tabela 5.9 indicam que para os trs
conjuntos de dados, a concentrao de pontos localizados nos intervalos que
apresentam erros menores (clusters 1, 2 e 3) aumentou quando as RN foram
utilizadas. Disso, pode-se concluir que, de maneira geral, o erro de estimao
diminuiu quando esta tcnica foi utilizada. Outra informao importante que pode
ser retirada da mesma tabela a diferena entre a concentrao de pontos no cluster
5 para os dois mtodos. Enquanto para a regresso este valor foi sempre superior a
10%, para as RN ele nunca superou os 2,5%.
Identificadas as propores de pontos em cada cluster, partiu-se para a
representao espacial dos resultados, atravs da construo de mapas temticos. As
Figuras 5.4, 5.5, 5.6, 5.7, 5.8 e 5.9 mostram como os erros de estimao esto
distribudos espacialmente para ambos os mtodos e os trs conjuntos de dados.
Nair Cristina Margarido Brondino - 101



Figura 5.4 Distribuio espacial dos erros para o modelo de regresso e o
primeiro grupo de dados de Araariguama.




Figura 5.5 Distribuio espacial dos erros para as RN e o primeiro grupo de
dados de Araariguama.

Nair Cristina Margarido Brondino - 102




Figura 5.6 Distribuio espacial dos erros para o modelo de regresso e o
segundo grupo de dados de Araariguama.



Figura 5.7 Distribuio espacial dos erros para as RN e o segundo grupo de
dados de Araariguama.

Nair Cristina Margarido Brondino - 103

Figura 5.8 Distribuio espacial dos erros para o modelo de regresso e o terceiro
grupo de dados de Araariguama.


Figura 5.9 Distribuio espacial dos erros para as RN e o terceiro grupo de dados
de Araariguama.

A Figura 5.4 revela que a maioria dos pontos cujo erro de estimao
maior se concentra no bairro localizado abaixo da estrada. Neste mesmo bairro
tambm se localiza o nico ponto do cluster 5 para as RN (Figura 5.5). Para os
mapas mostrados nas Figuras 5.6 e 5.7, pode-se observar uma maior concentrao
Nair Cristina Margarido Brondino - 104
de valores grandes de erro no bairro localizado no lado superior esquerdo para
ambos os modelos. Para o terceiro conjunto de dados e o modelo de regresso
(Figura 5.8), no entanto, observa-se valores maiores de erros espalhados pelos dois
bairros. J para as RN, o nico ponto pertencente ao cluster 5 tambm se localiza no
bairro situado abaixo da estrada. Diante do que foi observado, pode-se dizer que a
distribuio espacial dos erros no apresenta um padro de localizao especfico
para a Regresso. Por outro lado, observa-se que os maiores erros fornecidos pelas
RN se localizam num bairro especfico para dois dos conjuntos de dados (1 e 3).

5.2. ESTUDO DE CASO: SO CARLOS

5.2.1. MODELO DE REGRESSO PARA A CIDADE DE
SO CARLOS

A metodologia para obteno do Modelo de Regresso de So Carlos
foi a mesma utilizada no Modelo de Regresso de Araariguama. A nica diferena
est no maior nmero de variveis qualitativas e maior nmero de registros.
Inicialmente, optou-se por trabalhar com o preo por m
2
como
varivel resposta. O primeiro modelo ajustado foi o linear, onde foram includas
todas as variveis independentes, mas sem considerar os fatores de interao. O
valor de R
2
obtido foi 0,34.
Ao fazer uma transformao logartmica na varivel dependente, o R
2

elevou-se para 0,51. A partir da, outras tentativas de transformaes tanto na
varivel dependente quanto nas independentes tambm no conduziram a grandes
melhoras (ver Tabela 5.10).
Diante destes valores, optou-se por fazer grficos de (preo/m
2
) versus
rea, (preo/m
2
) versus testada e (preo/m
2
) versus menor caminho, a fim de
verificar possveis relaes atravs de regresses simples. As melhores relaes
obtidas para as variveis duas a duas so mostradas a seguir:


Nair Cristina Margarido Brondino - 105
Preo/m
2
= funo (rea
0.50
)
Preo/m
2
= funo (testada
0.50
) e Preo/m
2
= funo (e
testada*0,02
) que
apresentaram aproximadamente o mesmo R
2
.
Preo/m
2
= funo (e
-0.2*mc
) e Preo/m
2
= funo (mc
-0,2
) que apresentaram
aproximadamente o mesmo R
2
.

A incluso destas transformaes ao modelo tambm no trouxe
melhoras substanciais em termos de R
2
, cujo valor passou para 0,43. Outras
transformaes nas variveis independentes e tambm na dependente foram feitas,
no conduzindo a nenhuma melhora significativa, em termos de coeficiente de
determinao, como pode ser observado na Tabela 5.10 (na qual s so
apresentados os modelos que forneceram R
2
maior que 0,30). A incluso da
categoria a que pertence o lote no modelo, contudo, gerou uma melhora substancial.
Para a incluso desta varivel, adicionou-se ao modelo duas variveis binrias:
TERR_B (assumindo valor 1 para terrenos da categoria B e 0, caso contrrio) e
TERR_C (assumindo valor 1 para terrenos da categoria C e 0, caso contrrio). Desta
forma, terrenos pertencentes categoria A possuram valor (0,0) para as variveis
TERR_B e TERR_C. O novo modelo, que incluiu somente as variveis em sua
forma pura e sem transformao na varivel dependente conduziu a um R
2
igual a
0,57. O modelo que incluiu uma transformao do tipo logartmica na varivel
dependente gerou um coeficiente de determinao igual a 0,73 e, portanto, foi o
escolhido para a anlise.
De maneira similar escolha do modelo para Araariguama, uma
anlise da multicolinearidade envolvendo as variveis independentes foi executada
aps a escolha do modelo. O nmero de condio obtido para a matriz normalizada
X'X foi igual a 158,02, indicando a possvel existncia de dependncia linear entre
duas ou mais variveis. Novamente, para identificar as variveis envolvidas em
multicolinearidade, os valores do
ij
e do R foram calculados para cada par de
variveis. Os resultados obtidos so mostrados nas Tabelas 5.11 e 5.12,
respectivamente.
2
ij
Nair Cristina Margarido Brondino - 106
A Tabela 5.11 indica valores maiores que 0,5 para as seguintes
relaes: rea e testada, testada e categoria, calada e categoria, asfalto e testada,
edificao e asfalto e gua e luz. Pelos valores observados na Tabela 5.12 verifica-
se que as relaes rea e testada e gua e luz apresentam coeficientes de
determinao maiores que o obtido para o modelo geral (0,73) e iguais a 0,87 e
0,80, respectivamente, indicando possveis fontes de multicolinearidade.
Novamente, duas eram as possveis solues: uma regresso do tipo Ridge ou a
retirada de algumas variveis e nova estimao do modelo. Da mesma forma que
para Araariguama, as duas tentativas foram analisadas.
Para a regresso do tipo Ridge, iniciou-se com um valor igual a 0,01
para r, que sendo foi acrescido em 0,01 at que os parmetros atingissem a
estabilidade. O modelo obtido, com r=0,01 e R
2
igual a 0,72 praticamente no difere
daquele em que o tipo de modelagem convencional foi utilizado e mostrado na
Tabela 5.13.
Pelos mesmos motivos mencionados no estudo de caso para
Araariguama, optou-se por utilizar os valores dos
ij
para a retirada de variveis
envolvidas em multicolinearidade. Desta forma, optou-se por retirar a varivel
testada, uma vez que esta aparecia em trs relaes cujo valor para o
ij
era maior
que 0,5, mantendo-se, ento as variveis categoria, rea e asfalto. Outra relao que
poderia ser considerada como possvel fonte de multicolinearidade envolvia as
variveis calada e categoria. Assim, optou-se por retirar a varivel calada, uma
vez que a categoria havia sido mantida no modelo. O mesmo motivo conduziu
retirada da varivel edificao em lugar da varivel asfalto. O critrio para a retirada
das variveis gua ou luz obedeceu ao mesmo princpio utilizado para
Araariguama, ou seja, o valor do R
2
. Como este no sofreu alterao alguma,
optou-se, ento, por retirar a varivel gua. O modelo obtido mostrado na Tabela
5.14.

Nair Cristina Margarido Brondino - 107
Tabela 5.10 - Melhores modelos de regresso ajustados, considerando o preo/m
2

para So Carlos.

MODELO R
2
1
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua)
0,34
2
(Preo/m
2
) = funo (rea
0.5
, e
testada*0.02
, forma, muro, calada,
e
-mc*0.2
, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua)
0,38
3
(Preo/m
2
) = funo (rea
0.5
, e
testada*0.02
, forma, muro, calada,
e
-mc*0.2
, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc)
0,38
4
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc)
0,34
5
(Preo/m
2
) = funo (rea
0.5
, testada
0.5
, forma, muro, calada,
mc
-0.2
, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc)
0,31
6
(Preo/m
2
) = funo (1/rea, 1/testada, forma, muro, calada,
1/mc, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua)
0,31
7
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*testada, rea*mc, testada*mc,
rea*testada*mc)
0,37
8
Ln (Preo/m
2
) = funo (rea, testada, forma, muro, calada,
menor caminho, situao, topologia, asfalto, existncia de
edificaes na quadra, esgoto, luz, gua, rea*testada, rea*mc,
testada*mc)
0,51
9
Ln (Preo/m
2
) = funo (1/rea, 1/testada, forma, muro, calada,
1/mc, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*test, rea*mc, testada*mc)
0,38
10
Ln (Preo/m
2
) = funo (1/rea, 1/testada, forma, muro, calada,
1/mc, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, rea*test, rea*mc, testada*mc,
rea*testada*mc)
0,51
11
(Preo/m
2
) = funo (rea, testada, forma, muro, calada, menor
caminho, situao, topologia, asfalto, existncia de edificaes na
quadra, esgoto, luz, gua, categoria)
0,53
12
Ln (Preo/m
2
) = funo (rea, testada, forma, muro, calada,
menor caminho, situao, topologia, asfalto, existncia de
edificaes na quadra, esgoto, luz, gua, categoria)
0,73

Nair Cristina Margarido Brondino - 108
T
O
P
.

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
1

0
,
0
3

0
,
0
1

0
,
0
3

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

R
E
A

0
,
2
1

0
,
6
6

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
1

0
,
0
7

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

M
C

0
,
0
3

0
,
1
0

0
,
3
3

0
,
2
8

0
,
0
4

0
,
0
5

0
,
0
1

0
,
1
1

0
,
0
0

0
,
0
1

0
,
0
3

0
,
0
0

0
,
0
1

0
,
0
1

T
E
S
T
.

0
,
0
8

0
,
8
1

0
,
0
4

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
2

0
,
0
2

0
,
0
2

0
,
0
0

0
,
0
1

0
,
0
0

F
O
R
M
A

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
1

0
,
0
3

0
,
2
2

0
,
6
2

0
,
0
2

0
,
0
4

0
,
0
6

0
,
0
0

S
I
T
.

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
3

0
,
0
0

0
,
0
3

0
,
4
4

0
,
3
9

0
,
0
6

0
,
0
3

0
,
0
0

0
,
0
3

0
,
0
0

C
A
T
.

0
,
0
0

0
,
0
0

0
,
0
1

0
,
5
7

0
,
0
2

0
,
1
0

0
,
0
0

0
,
1
0

0
,
0
8

0
,
1
0

0
,
0
1

0
,
0
0

0
,
0
1

0
,
0
0

M
U
R
O

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
4

0
,
2
1

0
,
3
9

0
,
2
4

0
,
1
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
0

C
A
L

.

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
1

0
,
2
2

0
,
0
1

0
,
6
8

0
,
0
3

0
,
0
2

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

A
S
F
.

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
4

0
,
0
4

0
,
0
3

0
,
2
1

0
,
0
7

0
,
5
8

0
,
0
3

0
,
0
0

0
,
0
0

E
D
I
F
.

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
2

0
,
0
2

0
,
0
1

0
,
0
0

0
,
0
3

0
,
6
9

0
,
2
3

0
,
0
0

0
,
0
0

E
S
G
.

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
3

0
,
0
2

0
,
9
3

0
,
0
0

0
,
0
0

L
U
Z

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
1

0
,
0
7

0
,
9
2

G
U
A

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
2

0
,
9
8


T
O
P
O
G
.

R
E
A

M
C

T
E
S
T
A
D
A

F
O
R
M
A

S
I
T
.

C
A
T
E
G
.

M
U
R
O

C
A
L

.

A
S
F
.

E
D
I
F
.

E
S
G
.

L
U
Z

G
U
A

T
a
b
e
l
a

5
.
1
1

-

V
a
l
o
r
e
s

d
e

i
j

o
b
t
i
d
o
s

p
a
r
a

a
s

c
o
l
u
n
a
s

d
a

m
a
t
r
i
z

X
'
X

p
a
r
a

S

o

C
a
r
l
o
s
.




Nair Cristina Margarido Brondino - 109

T
O
P
O
G
1
,
0
0

R
E
A

0
,
0
0

1
,
0
0


M
C

0
,
0
3

0
,
0
7

1
,
0
0


F
O
R
M
A

0
,
0
1

0
,
1
3

0
,
0
0

1
,
0
0


S
I
T
.

0
,
0
0

0
,
0
4

0
,
0
0

0
,
1
2

1
,
0
0


C
A
T
.

0
,
0
0

0
,
0
7

0
,
4
5

0
,
0
0

0
,
0
0

1
,
0
0


M
U
R
O

0
,
0
0

0
,
0
0

0
,
0
3

0
,
0
0

0
,
0
0

0
,
0
2

1
,
0
0


C
A
L

.

0
,
0
3

0
,
0
1

0
,
0
9

0
,
0
0

0
,
0
0

0
,
0
6

0
,
1
1

1
,
0
0


A
S
F
.

0
,
0
1

0
,
0
1

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
3

0
,
0
3

0
,
0
3

1
,
0
0


E
D
I
F
0
,
0
1

0
,
0
1

0
,
0
1

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
3

0
,
0
3

0
,
3
6

1
,
0
0


E
S
G
.

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
2

0
,
0
1

0
,
2
9

0
,
3
3

1
,
0
0


L
U
Z

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
3

0
,
0
4

0
,
0
9

1
,
0
0

G
U
A

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
0

0
,
0
4

0
,
0
5

0
,
1
1

0
,
8
0

1
,
0
0


T
E
S
T
A
D
A

0
,
0
0

0
,
8
7

0
,
0
3

0
,
0
9

0
,
0
4

0
,
0
5

0
,
0
0

0
,
0
1

0
,
0
1

0
,
0
1

0
,
0
0

0
,
0
0

0
,
0
0

1
,
0
0


T
O
P
O
G
.

R
E
A

M
C

F
O
R
M
A

S
I
T
.

C
A
T
.

M
U
R
O

C
A
L

.

A
S
F
.

E
D
I
F
.

E
S
G
.

L
U
Z

G
U
A

T
E
S
T
A
D
A

T
a
b
e
l
a

5
.
1
2

-

V
a
l
o
r
e
s

d
o
s

R
i
j
2

o
b
t
i
d
o
s

p
a
r
a

c
a
d
a

p
a
r

d
e

v
a
r
i

v
e
i
s

p
a
r
a

a

c
i
d
a
d
e

d
e

S

o

C
a
r
l
o
s
.

Nair Cristina Margarido Brondino - 110
Tabela 5.13 - Modelo de Regresso Ridge obtido para So Carlos utilizando o
valor do m
2
como varivel dependente.
PARMETRO
ESTIMADO
DESVIO-
PADRO
ESTATSTICA t p-level
CONSTANTE 4,312927 0,15962 27,01994 0
TOPOGRAFIA 0,052628 0,032766 1,606169 0,108917
AREA -6,8E-05 0,000134 -0,50649 0,612753
MC -0,07765 0,010264 -7,5657 2,09E-13
TESTADA 0,006377 0,00519 1,228618 0,219838
FORMA 0,029272 0,058809 0,497743 0,618901
SITUAO -0,07487 0,042791 -1,74964 0,080842
TERR_B -0.43542 0.034308 -12.6913 7,01E-32
TERR_C -0,80181 0,044431 -18,0461 0
MURO -0,04215 0,029719 -1,41819 0,156807
CALADA 0,008085 0,031415 0,257368 0,797008
ASFALTO -0,0169 0,05512 -0,30654 0,759332
EDIFICAO -0,01243 0,064541 -0,19259 0,847367
ESGOTO 0,117046 0,083914 1,394834 0,163733
LUZ 0,042453 0,262258 0,161876 0,871474
GUA 0,037644 0,297839 0,126391 0,899477


Tabela 5.14 - Modelo de Regresso obtido para So Carlos utilizando o valor do
m
2
como varivel dependente aps a retirada das variveis testada,
calada, edificao e gua.
PARMETRO
ESTIMADO
DESVIO-
PADRO
ESTATSTICA t p-level
CONSTANTE 4,277913 0,146914 32,52175 0
TOPOGRAFIA 0,051465 0,03197 1,60977 0,108122
REA 8,32E-05 5,29E-05 1,571414 0,116762
MC -0,07623 0,009909 -7,69263 8,6E-14
FORMA 0,040086 0,057437 0,697917 0,485576
SITUAO -0,08141 0,042281 -1,92556 0,054765
TERR_B -0.43542 0.034308 -12.6913 7,01E-32
TERR_C -0,80181 0,044431 -18,0461 0
MURO -0,04342 0,028126 -1,54361 0,123358
ASFALTO -0,02148 0,050163 -0,42826 0,668662
ESGOTO 0,116266 0,077692 1,496499 0,135198
LUZ 0,061065 0,126934 0,48108 0,630684

Uma comparao entre as Tabelas 5.13 e 5.14 revela que no existe
grande diferena entre o modelo estimado atravs de regresso Ridge e aquele
encontrado aps a retirada de algumas variveis. Alm do valor dos parmetros,
Nair Cristina Margarido Brondino - 111
uma comparao entre as somas dos Quadrados dos Resduos (SSE) para os dois
casos tambm foi feita. Para a regresso Ridge, a SSE obtida foi igual a 34,138
contra um valor igual a 33,659 para a outra alternativa. Desta forma, mais uma vez,
devido maior confiabilidade com relao aos testes de hipteses, optou-se por
utilizar o modelo apresentado na Tabela 5.14.
Antes dos testes t, porm, as suposies sobre a distribuio e
varincia do distrbio aleatrio deviam ser verificadas. Os testes utilizados para
verificao destas suposies foram os mesmos do caso anterior, ou seja, Qui-
Quadrado para verificar Normalidade e Teste Geral de White e Teste de Goldfeld-
Quandt para homocedasticidade.
A estatstica obtida para o teste de Normalidade foi igual a 65,89, cujo
valor foi comparado ao tabelado da Distribuio Qui-Quadrado para um valor
crtico de 95%, donde a suposio de distribuio Normal no foi rejeitada.
Para analisar a suposio de heterocedasticidade foi elaborado, a
princpio, o Teste Geral de White. A estatstica de teste obtida , com valor igual a
4,35, foi comparada com o valor tabelado da Distribuio Qui-quadrado para um
valor crtico igual a 95% e 10 graus de liberdade (18,31). Como o valor calculado
ficou menor que o tabelado, a hiptese de homocedasticidade no foi rejeitada.
Para o Teste de Goldfeld-Quandt, a amostra foi ordenada de acordo
com o valor da varivel rea e dividida em trs grupos, o primeiro e o ltimo com
168 pontos e o intermedirio com 144 pontos. A hiptese de que a varincia no
primeiro grupo seria maior que a do ltimo foi rejeitada a um nvel de significncia
igual a 5% (estatstica de teste obtida foi igual a 0,324 - cujo valor foi comparado ao
valor tabelado da Distribuio F para um valor crtico igual a 95% com 158 e 158
graus de liberdade). Portanto, por este teste, a hiptese de homocedasticidade
tambm no foi rejeitada.
Obedecidas as suposies de Normalidade e varincia constante, os
testes t com relao aos parmetros do modelo puderam, ento, ser executados. Os
valores mostrados na Tabela 5.14 indicam que os nicos parmetros significativos
so os estimados para as variveis mc e categoria. O sinal negativo observado para
o coeficiente da varivel mc indica que um aumento na distncia ao centro provoca
Nair Cristina Margarido Brondino - 112
uma diminuio no preo. Atravs dos resultados, pode-se notar tambm que os
logaritmos dos preos por m
2
de lotes situados nas categorias B e C so diminudos
de 0,435 e 0,870, respectivamente, com relao queles situados na categoria A.

5.2.2. APLICAO DAS REDES NEURAIS ARTIFICIAIS
PARA SO CARLOS

Da mesma forma que para o estudo de caso anterior, para o emprego
das RN, a princpio, o conjunto de dados foi dividido de forma aleatria em trs
subconjuntos distintos: treinamento (50% dos casos), validao (25% dos casos) e
teste (25% dos casos). Este procedimento foi ento repetido trs vezes, o que gerou
trs diferentes conjuntos de dados. Redes com vrios tipos de configuraes foram
ento simuladas e o erro relativo total fornecido por cada uma destas, calculado. A
taxa de aprendizado, o momentum e o erro admitido para a fase de treinamento
tambm foram variados. Inicialmente, 13 variveis (rea, testada, esquina, muro,
calada, existncia de edificaes na quadra, distncia ao centro, topografia, gua,
luz, esgoto, asfalto e forma) foram utilizadas. Como os resultados no foram
favorveis, uma dcima quarta varivel, indicando a categoria em que o terreno se
enquadra (A, B ou C), de acordo com as categorias de amostragem, foi adicionada.
Os resultados da Tabela 5.15, obtidos para um erro admitido na fase de treinamento
igual a 0,03, mostram a mdia dos erros obtidos pela utilizao dos trs conjuntos
de dados, assim como as topologias das redes testadas quando o valor do m
2
foi
utilizado como varivel resposta.

Tabela 5.15 - Resultados das melhores simulaes, usando todas as variveis e o
preo do m
2
para So Carlos.
NS NA
CAMADA
INTERM.
TAXA
DE
APREN.
MOMENTUM
MDIA
DOS
ERROS
R
2

(conj. 1)
R
2

(conj. 2)
R
2

(conj. 3)
5 0,5 0,8 30,08 0,51 0,40 0,50
6 0,3 0,4 28,99 0,53 0,48 0,55
6 0,5 0,8 31,11 0,27 0,32 0,53
13 0,5 0,8 29,26 0,54 0,43 0,47
6 - 4 0,5 0,8 27,88 0,53 0,41 0,55
13 - 5 0,5 0,8 27,87 0,52 0,42 0,56
14 - 6 0,5 0,8 27,63 0,53 0,44 0,56
Nair Cristina Margarido Brondino - 113

Conforme pode ser observado na Tabela 5.15, os valores obtidos para
o R
2
ficaram baixos com relao ao observado para o modelo de regresso. Desta
forma, foi feita uma tentativa de transformao logartmica na varivel resposta
com o objetivo de verificar se a sada fornecida pela rede iria se adequar melhor aos
dados. Os novos resultados obtidos, para um erro de treinamento igual a 0,03, so
mostrados na Tabela 5.16.

Tabela 5.16 - Resultados das melhores simulaes, usando todas as variveis e o ln
do preo do m
2
para So Carlos.
NS NA
CAMADA
INTERM.
TAXA
DE
APREN.
MOMENTUM
MDIA
DOS
ERROS
R
2

(conj. 1)
R
2

(conj. 2)
R
2

(conj. 3)
6 0,5 0,6 7,86 0,63 0,56 0,65
6 0,5 0,8 7,91 0,63 0,54 0,65
6 0,4 0,4 7,74 0,69 0,64 0,73
6 0,3 0,4 7,86 0,68 0,56 0,73
6 0,5 0,5 7,81 0,68 0,56 0,72
6 0,4 0,3 7,31 0,68 0,66 0,73
6 0,4 0,2 7,74 0,68 0,68 0,73
9 - 8 0,5 0,8 7,38 0,66 0,64 0,66
10 - 8 0,5 0,8 7,41 0,63 0,69 0,68
14 - 6 0,5 0,8 7,14 0,65 0,67 0,66
8 - 7 0,5 0,8 7,14 0,66 0,66 0,69
8 - 6 0,5 0,8 7,70 0,64 0,66 0,68
8 - 8 0,5 0,8 6,97 0,67 0,63 0,66
8 - 9 0,5 0,8 7,60 0,65 0,66 0,68
9 - 8 0,4 0,4 7,90 0,65 0,66 0,69
8 - 7 0,4 0,4 7,40 0,67 0,63 0,67

Os valores obtidos para o R
2
observados na Tabela 5.16 mostraram
uma melhora significativa quando a transformao logartmica foi aplicada
varivel resposta. Pode-se observar tambm que a melhor configurao de rede
observada foi aquela com 6 ns na camada intermediria, taxa de aprendizado igual
a 0,4 e momentum igual a 0,2.
Da mesma forma que o caso anterior, a importncia de cada varivel
no valor estimado final foi calculada atravs do mtodo proposto por Garson. Os
resultados obtidos so mostrados na Tabela 5.17.
Nair Cristina Margarido Brondino - 114
Tabela 5.17 - Relevncia de cada varivel para a cidade de So Carlos.
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV. (%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
CATEGORIA 17 MC 17 MC 16
MC 15 CATEGORIA 14 CATEGORIA 14
MURO 12,5 MURO 7,5 MURO 12
REA 9,5 REA 7,5 REA 11
GUA 7 ESGOTO 7,5 GUA 8
LUZ 6 CALADA 6,5 CALADA 7
ESGOTO 6 FORMA 6,5 TESTADA 5
CALADA 5,5 EDIFICAO 6 EDIFICAO 5
SITUAO 4 LUZ 6 LUZ 5
TESTADA 4 GUA 5 ESGOTO 4
EDIFICAO 3,5 TOPOGRAFIA 5 SITUAO 3,7
TOPOGRAFIA 3,5 SITUAO 4 TOPOGRAFIA 3,7
ASFALTO, 3 ASFALTO 3,6 FORMA 2,5
FORMA
3 TESTADA 3,6 ASFALTO 1,5


Os dados observados na Tabela 5.17 revelam que, para a cidade de
So Carlos, a varivel mc aparece em primeiro lugar em dois dos conjuntos de
dados, seguida pela categoria a que o lote pertence. No primeiro conjunto, contudo,
a distncia ao centro aparece em segundo lugar, mas tambm com uma contribuio
significativa para o valor final, igual a 15%. Observa-se que a existncia de muro
representa uma varivel importante na valorizao de lotes, uma vez que aparece
em terceiro lugar para todos os conjuntos de dados. A varivel rea em nenhum dos
casos apresentou contribuio superior a 11%. Da mesma forma que para o modelo
de regresso, a existncia de asfalto no causa influncia significativa no preo de
terrenos, fato este que pode ser explicado pelo alto nvel de pavimentao da cidade.
Devido ao tipo de relevo acidentado comum na cidade, lotes com topografia
irregular tambm no so desvalorizados. A varivel testada tambm no aparece
como fator relevante.
Conforme proposto na Metodologia, as variveis cuja influncia fosse
igual ou inferior a 5% seriam retiradas do conjunto de dados e a rede, novamente
testada. Desta forma, as variveis topografia, situao, testada e asfalto foram
retiradas do conjunto de dados e a rede novamente treinada. Esta nova situao,
porm, no gerou resultados estatisticamente significativos para um nvel crtico
Nair Cristina Margarido Brondino - 115
igual a 95%, uma vez que o erro mdio observado ficou igual a 7,71 e os R
2
obtidos
foram 0,69, 0,68 e 0,73 para os conjuntos 1, 2 e 3, respectivamente.

5.2.3. COMPARAO DOS RESULTADOS OBTIDOS
PELOS DOIS MTODOS PARA A CIDADE DE SO
CARLOS

Os mesmos conjuntos de dados utilizados para a fase de teste das
Redes Neurais foram utilizados para estimar os erros e R
2
obtidos pelo modelo de
regresso. Estes resultados so mostrados na Tabela 5.18.

Tabela 5.18 - Erros e R
2
obtidos para os dois modelos e os trs conjuntos de dados
para So Carlos.
REGRESSO RN
ERRO R
2
ERRO R
2
conjunto 1 6,38 0,70 6,72 0,69
conjunto 2 7,93 0,67 7,80 0,68
conjunto 3 8,55 0,70 8,62 0,73
MDIA 7,62 - 7,71 -

Os resultados mostrados na Tabela 5.18 indicam que o erro relativo
total obtido pelas RN ficou em torno de 1,2% maior que aquele fornecido pela
regresso. Quanto ao valor do R
2
, pode-se observar que o segundo mtodo mostrou
uma ligeira superioridade para os conjuntos 2 e 3. Desta forma, os resultados
obtidos at aqui indicam uma certa coerncia em termos de erros de estimao e R
2

para os dois mtodos, no se podendo notar mudanas significativas quando um ou
outro foi utilizado.
O prximo passo constou em comparar os erros relativos para os dois
mtodos, atravs dos grficos mostrados nas Figuras 5.10, 5.11 e 5.12, mostrando
estes valores para ambos os mtodos e os conjuntos de dados 1, 2 e 3,
respectivamente.
Nair Cristina Margarido Brondino - 116
GRUPO 1
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
1 13 25 37 49 61 73 85 97 109
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO REG ERRO ANN

Figura 5.10 - Erros relativos obtidos para os dois mtodos e o primeiro conjunto de
dados para a cidade de So Carlos.

GRUPO 2
0
0,1
0,2
0,3
0,4
0,5
0,6
1 12 23 34 45 56 67 78 89 100 111
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO REG ERRO ANN

Figura 5.11 - Erros relativos obtidos para os dois mtodos e o segundo conjunto de
dados para a cidade de So Carlos.

Nair Cristina Margarido Brondino - 117
GRUPO 3
0
0,1
0,2
0,3
0,4
0,5
0,6
1 12 23 34 45 56 67 78 89 100 111
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO REG ERRO ANN

Figura 5.12 - Erros relativos obtidos para os dois mtodos e o terceiro conjunto de
dados para a cidade de So Carlos.

As Figuras 5.10, 5.11 e 5.12 revelam um comportamento bastante
parecido, em termos de erro de estimao. Pode-se notar tambm que, para os trs
casos, quando o valor do erro relativo atingiu seu pico para um dado modelo, o
mesmo ocorreu para o outro, o que pode ser indicativo da existncia de um ponto
cujo valor observado era muito discrepante do restante do conjunto de dados.
O prximo passo constou do agrupamento dos valores dos erros em
clusters, visando a construo de mapas temticos e posterior identificao de um
possvel padro espacial nos valores dos erros. A diviso em clusters, foi obtida
atravs do emprego do mesmo mtodo utilizado para Araariguama e mostrada na
Tabela 5.19.

Nair Cristina Margarido Brondino - 118
Tabela 5.19 - Proporo de erros relativos nos clusters encontrados com os dois
modelos para os trs conjuntos de dados para So Carlos.
Conjunto/Cluster Limites de
classe
REGRESSO RN
Conjunto 1 - Cluster1 <= 0,0267 35,0% 36,0%
Conjunto 1 - Cluster 2 0,0268 a 0,0638 35,0% 31,0%
Conjunto 1 - Cluster 3 0,0639 a 0,1327 22,5% 24,0%
Conjunto 1 - Cluster 4 >= 0,1328 8,5% 7,5%
Conjunto 2 - Cluster 1 <= 0,0381 53,0% 52,0%
Conjunto 2 - Cluster 2 0,0382 a 0,0880 27,5% 30,0%
Conjunto 2 - Cluster 3 0,0881 a 0,1989 10,0% 7,5%
Conjunto 2 - Cluster 4 >= 0,1990 9,5% 10,5%
Conjunto 3 - Cluster 1 <= 0,0355 33,0% 42,5%
Conjunto 3 - Cluster 2 0,0355 a 0,0891 44,0% 34,0%
Conjunto 3 - Cluster 3 0,0892 a 0,1725 12,5% 12,5%
Conjunto 3 - Cluster 4 >= 0,1726 11,0% 11,0%

Diferentemente do que aconteceu para Araariguama, no se percebe
uma grande diferena na concentrao de pontos situados dentro dos intervalos que
apresentaram valores de erros menores (clusters 1 e 2) para os dois mtodos.
Portanto, parece no haver diferena entre regresso e Redes Neurais quando a
anlise de clusters foi utilizada.
Uma anlise dos mapas temticos mostrados nas Figuras 5.13, 5.14,
5.15, 5.16, 5.17 e 5.18 mostra que para os elementos do grupo 1 parece no haver
padro espacial definido para a distribuio dos erros tanto para um mtodo quanto
para outro. Para os grupos 2 e 3, no entanto, nota-se uma concentrao de erros
maiores no bairro situado no canto inferior esquerdo para ambos os modelos. As
Figuras 5.15, 5.16, 5.17 e 5.18 revelam uma grande semelhana no padro de
distribuio espacial para os erros obtidos para os mtodos de regresso e Redes
Neurais.
Nair Cristina Margarido Brondino - 119



Figura 5.13 - Distribuio espacial dos erros para o modelo de regresso e o
primeiro grupo de dados de So Carlos.



Figura 5.14 - Distribuio espacial dos erros para as RN e o primeiro grupo de
dados de So Carlos.

Nair Cristina Margarido Brondino - 120



Figura 5.15 - Distribuio espacial dos erros para o modelo de regresso e o
segundo grupo de dados de So Carlos.



Figura 5.16 - Distribuio espacial dos erros para as RN e o segundo grupo de
dados de So Carlos.

Nair Cristina Margarido Brondino - 121



Figura 5.17 - Distribuio espacial dos erros para o modelo de regresso e o terceiro
grupo de dados de So Carlos.



Figura 5.18 - Distribuio espacial dos erros para as RN e o terceiro grupo de dados
de So Carlos.

Nair Cristina Margarido Brondino - 122
5.3. AVALIAO DO DESEMPENHO DAS REDES
NEURAIS

Uma das principais caractersticas de uma Rede Neural a de que ela
capaz de fornecer boas estimativas mesmo quando as variveis independentes
possuam algum tipo de relao desconhecida entre si. Esta uma das vantagens do
mtodo com relao aos modelos de estimao convencionais, uma vez que nem
sempre possvel saber com exatido que tipo de relao envolve duas ou mais
variveis de entrada. O mesmo se aplica com respeito s variveis de sada e de
entrada, uma vez que o esperado que a rede seja capaz de captar o tipo de relao
existente entre elas e fornecer estimativas adequadas.
Para os estudos de caso mostrados aqui, a rede foi treinada utilizando
o valor m
2
ou uma funo deste como varivel resposta. Porm, tornou-se
interessante verificar como as RN reagiriam se uma nova situao fosse
apresentada, onde o valor total do terreno fosse utilizado como entrada.
A Tabela 5.20 mostra os resultados obtidos para a cidade de
Araariguama, quando o valor total do terreno foi utilizado na sada.

Nair Cristina Margarido Brondino - 123
Tabela 5.20 Resultados obtidos pelas Redes Neurais quando o valor total do
terreno foi utilizado como sada para a cidade de Araariguama.
Nmero de ns
nas camadas
intermedirias
Taxa de
aprendizado
Momentum Mdia dos erros
relativos
Erro de treinamento = 0,05
Dados brutos 4 0,5 0,8 24,96
Dados brutos 6 0,5 0,8 23,87
Dados brutos 4 0,3 0,4 24,08
Dados brutos 2 0,4 0,4 24,82
Dados brutos 6 0,4 0,4 25,16
Dados brutos 3 0,2 0,1 34,78
Dados brutos 3 0,2 0,1 24,36
Norm. 0 1 6 0,2 0,7 23,34
Norm. 0 1 4 0,3 0,4 23,64
Norm. 0 1 7 6 0,3 0,4 23,69
Norm. 0 1 5 3 2 0,5 0,8 23,40
Norm. 0 1 3 0,3 0,2 23,79
Norm. 0 1 6542 0,3 0,4 23,92
Erro de treinamento = 0,01
Dados brutos 4 0,5 0,8 27,90
Dados brutos 6 0,5 0,8 29,09
Dados brutos 4-3 0,5 0,8 50,65
Dados brutos 6-3 0,1 0,2 27,20
Dados brutos 7 0,5 0,6 23,57
Norm. 0 - 1 7 0,5 0,8 27,17
Norm. 0 - 1 4 0,5 0,8 36,73
Norm. 0 - 1 4 0,3 0,4 26,95


Os valores observados na Tabela 5.20 indicam que a rede com 4 ns
na camada intermediria, taxa de aprendizado igual a 0,3 e momentum igual a 0,4
apresentou erro relativo mdio situado entre os menores valores observados,
independentemente do erro de treinamento (0,05 ou 0,01). Vale observar que para o
caso onde se usou o m
2
como varivel resposta, a configurao de rede escolhida foi
a mesma. Portanto, estes resultados indicam que, independentemente da
transformao a que se sujeitou os dados, a configurao de rede citada forneceu
bons resultados. Uma anlise da salincia das variveis tambm foi executada para
este caso, cujos resultados so apresentados na Tabela 5.21.
Nair Cristina Margarido Brondino - 124
Tabela 5.21 - Relevncia de cada varivel para a cidade de Araariguama quando o
preo total do terreno foi utilizado .
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV. (%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
REA 16 REA 16 FORMA 17
FORMA 16 FORMA 16 REA 16
SITUAO 16 SITUAO 15 SITUAO 16
TESTADA 15 TESTADA 15 TESTADA 15
MC 13 MC 14 MC 13
CALADA 13 CALADA 12 MURO 11,5
MURO 11 MURO 11 CALADA 11,5

Os valores observados na Tabela 5.21 indicam que a varivel mc
aparece em quinto lugar na lista de importncias relativas, sempre precedido pelas
variveis rea, testada, forma e situao. Portanto, quando o preo total do lote est
sendo estimado pelas Redes Neurais, suas caractersticas fsicas so as mais
consideradas.
O mesmo tipo de anlise foi elaborado para a cidade de So Carlos, e
os resultados so mostrados na Tabela 5.22.

Tabela 5.22 - Resultados obtidos pelas Redes Neurais quando o valor total do
terreno foi utilizado como sada para a cidade de So Carlos.
NMERO
NS NA
ENTRADA
NS NA
CAMADA
INTERME-
DIRIA
TAXA
DE
APREN.
MOMENTUM MDIA
DOS
ERROS
ERRO ADMITIDO PARA A FASE DE TREINAMENTO = 0,05
14 6 0,5 0,8 139,103
14 8 - 5 0,5 0,8 156,997
14 3 0,5 0,8 140,333
14 6 0,3 0,4 156,767
14 8 - 5 0,3 0,4 162,793
14 3 0,3 0,3 152,293
13 6 0,5 0,8 138,327
13 11 0,5 0,8 134,327
13 5 - 3 0,5 0,8 163,123
13 5 - 3 0,3 0,3 163,777
13 11 0,3 0,3 161,517
ZONA 1: VAR 6 A 13
3 0,5 0,8 151,253
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
3 0,3 0,3 156,470
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
6 0,5 0,8 151,493
Nair Cristina Margarido Brondino - 125
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
6 0,3 0,3 164,657
13 6 - 5 - 4 0,3 0,3 166,330
13 4 - 3 0,2 0,1 173,063
13 7 - 6 - 4 0,2 0,2 189,657
13 12 - 11 0,3 0,3 165,383
ERRO ADMITIDO PARA A FASE DE TREINAMENTO = 0,01
13 5 - 3 0,3 0,3 145,413
14 6 0,3 0,4 53,453
14 8 - 5 0,5 0,8 89,357
14 3 0,5 0,8 57,520
14 5 - 3 0,5 0,8 102,563
13 6 0,5 0,8 68,610
13 11 0,5 0,8 65,147
ZONA 1: VAR 6 A 13
3 0,5 0,8 61,507
ZONA 1: VAR 1 E 2
ZONA 2: VAR 6 A 13
6 0,5 0,8 86,703
13 6 - 5 -4 0,5 0,8 134,477
13 4 - 3 0,5 0,8 128,153
13 7 - 6 - 4 0,5 0,8 131,873
13 12 - 11 0,5 0,8 95,240
14 5 0,3 0,3 104,737
14 6 - 5 0,3 0,3 118,893
14 6 0,5 0,8 53,993
14 4 0,5 0,8 54,600
14 5 - 4 0,5 0,8 107,970


A Tabela 5.22 mostra os resultados obtidos para as redes simuladas
para So Carlos com 13 e 14 ns na camada de entrada e erros de treinamento
iguais a 0,05 e 0,01, onde a rede com 14 ns incluiu a varivel categoria.
De acordo com os dados fornecidos, chegou-se concluso de que a
rede que apresentou os melhores resultados foi aquela com 14 ns na camada de
entrada, 6 na camada intermediria, taxa de aprendizado igual a 0,3 e momentum
igual a 0,4, considerando o erro de treinamento igual a 0,01. Novamente, observou-
se que esta configurao tambm conduziu a um dos menores erros mdios obtidos
para o modelo onde se usou o ln (m
2
), ou seja, independentemente da transformao
aplicada, esta configurao de rede conduziu a bons resultados. Uma anlise da
salincia das variveis mostrada na Tabela 5.23.

Nair Cristina Margarido Brondino - 126
Tabela 5.23 - Relevncia de cada varivel para a cidade de So Carlos, quando o
preo total do terreno foi considerando.
CONJUNTO 1 CONJUNTO 2 CONJUNTO 3
VARIVEL RELEV. (%) VARIVEL RELEV. (%) VARIVEL RELEV. (%)
REA 23 REA 24 REA 31
CATEGORIA 12 CATEGORIA 12 MC 10
MC 8,5 MC 8 CATEGORIA 7
EX. EDIF. 8,5 EX. EDIF. 8 EX. EDIF 7
TESTADA 6,5 TESTADA 6,5 FORMA 6
FORMA 6,5 FORMA 6,5 SITUAO 6
ASFALTO 6 ASFALTO 6 ASFALTO 6
SITUAO 6 SITUAO 6 ESGOTO 5
ESGOTO 4,5 ESGOTO 4,5 TESTADA 5
LUZ 4,5 LUZ 4,5 LUZ 5
MURO 4 MURO 4 MURO 5
CALADA 4 CALADA 4 CALADA 4
TOPOGRAFIA 3 TOPOGRAFIA 3 TOPOGRAFIA 4
GUA 3 GUA 3 GUA 3

Os dados mostrados na Tabela 5.23 indicam que a varivel rea
apresenta a maior importncia no valor estimado, como j era esperado, uma vez
que o preo total do lote est sendo considerado. Quanto varivel mc, nota-se que
esta aparece em terceiro lugar de importncia para dois dos conjuntos de dados,
sendo precedida pela varivel categoria. Para o terceiro conjunto, no entanto, a
acessibilidade aparece em segundo lugar na escala de relevncias.
Os resultados observados nas Tabelas 5.20 e 5.22 indicam que, em se
tratando de estimao de valor, as Redes Neurais apresentam uma certa coerncia
em termos de configurao, independentemente da transformao empregada nas
variveis. Assim, para Araariguama, uma rede com 4 ns na camada intermediria,
taxa de aprendizado igual a 0,4 e momentum igual a 0,3 seria adequada tanto para
estimar o valor total dos lotes quanto o valor do m
2
, dependendo do conjunto de
dados de treinamento. O mesmo foi observado para So Carlos, onde uma rede com
6 ns na camada intermediria, taxa de aprendizado igual a 0,3 e momentum igual a
0,4 seria adequada tanto para estimar o valor total quanto unitrio.
Porm, ao analisar a salincia de cada varivel na resposta fornecida
para Araariguama, percebe-se uma diferena em termos de importncia, uma vez
que a acessibilidade, que teve uma contribuio superior a 34% para a estimao do
Nair Cristina Margarido Brondino - 127
valor do m
2
, se apresenta em quinto lugar para a nova situao, sempre precedida
pela rea e outras caractersticas fsicas e com representao relativa variando de
13% a 15%.
Da mesma maneira que ocorreu para Araariguama, os dados
apresentados na Tabela 5.23 indicam que, para So Carlos, a varivel mais relevante
a rea, fato j esperado quando se considera o valor total do lote. Por sua vez, a
acessibilidade aparece em terceiro lugar, precedida pela varivel categoria e no
ltimo conjunto estas posies se invertem. No caso onde se analisou o preo do
m
2
, contudo, verificou-se que a acessibilidade aparecia em primeiro lugar para dois
dos conjuntos.
Diante dos resultados mostrados nas Tabelas 5.21 e 5.23, resolveu-se
fazer uma comparao dos erros relativos obtidos para os dois casos (estimao do
valor total e do m
2
para as duas cidades e os trs conjuntos de dados). Os resultados
obtidos para Araariguama so mostrados nas Figuras 5.19 a 5.21 para os grupos 1,
2 e 3, respectivamente. Para So Carlos, a comparao grfica destes erros
mostrada nas Figuras 5.22 a 5.24.

GRUPO 1
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)

Figura 5.19 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o primeiro conjunto de dados e a cidade de Araariguama.
Nair Cristina Margarido Brondino - 128
GRUPO 2
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)

Figura 5.20 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o segundo conjunto de dados e a cidade de Araariguama.

GRUPO 3
0
1
2
3
4
1 4 7 10 13 16 19 22 25 28 31 34 37 40
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)

Figura 5.21 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o terceiro conjunto de dados e a cidade de Araariguama.

GRUPO 1
0,0000
1,0000
2,0000
3,0000
1 14 27 40 53 66 79 92 105 118
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO(TOTAL)

Figura 5.22 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o primeiro conjunto de dados e a cidade de So Carlos.

Nair Cristina Margarido Brondino - 129
GRUPO 2
0,0000
0,5000
1,0000
1,5000
2,0000
2,5000
3,0000
1 14 27 40 53 66 79 92 105 118
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO(TOTAL)

Figura 5.23 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o segundo conjunto de dados e a cidade de So Carlos.


GRUPO 3
0
1
2
3
4
1 12 23 34 45 56 67 78 89 100 111
OBSERVAES
E
R
R
O
S

R
E
L
A
T
I
V
O
S
ERRO (M2) ERRO (TOTAL)

Figura 5.24 Erros relativos obtidos pelas RN para o m
2
e o preo total do lote para
o terceiro conjunto de dados e a cidade de So Carlos.


Os resultados observados nas Figuras 5.19 a 5.24 indicam que quando
o valor do m
2
foi usado em lugar do valor total do terreno, no geral os erros
relativos foram menores. Para a cidade de Araariguama, observa-se que para os
conjuntos 1 e 3 h um pico no valor do erro quando o m
2
foi utilizado. Porm, para
os demais casos, verifica-se que o erro obtido para o preo total , na maioria das
vezes, maior. Para So Carlos verifica-se que apenas para o grupo 2 existe um pico
no erro relativo obtido para o modelo que utilizou o m
2
. Na maioria dos casos
restantes, os erros obtidos pela utilizao do valor total foram maiores.
Nair Cristina Margarido Brondino - 130
Embora alguns autores (DANTAS, 1999; MENDONA et al., 1998)
tambm utilizem o valor total do lote sem maiores prejuzos, optou-se aqui por
basear as anlises no valor do m
2
, uma vez que os erros fornecidos pela sua
utilizao foram menores que os obtidos pelo modelo que utilizou o valor total.
Os mapas temticos mostrados nas Figuras 5.25 a 5.27 mostram a
distribuio espacial dos erros fornecidos pelas RN quando o valor total do lote foi
utilizado para a cidade de So Carlos. Uma comparao entre estes mapas e aqueles
obtidos pela utilizao do m
2
indica que a concentrao de erros maiores apresenta
aproximadamente o mesmo padro, independentemente da transformao a que as
variveis foram sujeitas.




Figura 5.25 - Distribuio espacial dos erros obtidos para as RN e o primeiro grupo
de dados de So Carlos quando o valor total do lote foi utilizado.
Nair Cristina Margarido Brondino - 131

Figura 5.26 - Distribuio espacial dos erros obtidos para as RN e o segundo grupo
de dados de So Carlos quando o valor total do lote foi utilizado.


Figura 5.27 - Distribuio espacial dos erros obtidos para as RN e o terceiro grupo
de dados de So Carlos quando o valor total do lote foi utilizado.
Nair Cristina Margarido Brondino - 132





6. CONCLUSES


Este trabalho tinha trs objetivos, a saber: identificar as variveis que
interferem no valor das propriedades, avaliar o uso de Redes Neurais Artificiais
para fins de avaliao e estudar a influncia de uma medida de acessibilidade no
valor de terrenos urbanos. Os resultados obtidos sero comentados a seguir.
Embora no tenham sido observados muitos casos na literatura, a
adio de variveis de natureza espacial, como por exemplo a distncia a algum
plo de atrao, tem trazido uma melhora significativa em termos de avaliao e se
apresenta como um assunto em ascenso. Porm, se no tipo de avaliao expedita
utilizada por negociadores de imveis, este tipo de varivel , de alguma forma,
levado em considerao, uma modelagem matemtica de sua influncia ainda no
to fcil de ser obtida.
Como pde ser observado na reviso bibliogrfica apresentada, alguns
modelos de avaliao que utilizaram somente variveis de natureza espacial no
foram muito bem sucedidos. Por outro lado, observou-se alguns casos em que
somente caractersticas de natureza fsica foram consideradas e o resultado obtido
foi julgado satisfatrio. Porm, tambm observou-se casos em que a incluso apenas
de atributos fsicos no conduziu a estimativas adequadas. Diante de quadros deste
tipo, fartos na literatura, a utilizao de um banco de dados misto, onde tanto
variveis de natureza espacial quanto fsica possam ser includas, se torna bastante
atraente.
Porm, se a incluso de alguma medida de natureza espacial parece
ser interessante, o julgamento correto de sua influncia est vinculado a um mtodo
Nair Cristina Margarido Brondino - 133
de estimao eficiente, baseado em modelagem matemtica adequada. Desta forma,
alm da adio de uma varivel de natureza espacial, a distncia ao centro da
cidade, este trabalho comparou dois mtodos de avaliao. O primeiro, que alm de
ser muito utilizado na prtica, recomendado pela ABNT (Associao Brasileira de
Normas Tcnicas), foi o modelo de regresso mltipla, cujos resultados serviram
para comparao com o outro mtodo utilizado aqui: as Redes Neurais. Embora
casos que utilizaram este tipo de modelagem sejam escassos na literatura sobre
avaliao imobiliria, os bons resultados que vm sendo obtidos em vrios campos
de estudo motivaram sua utilizao neste trabalho.
Para estudar a adequabilidade de uma tcnica inovadora no ramo de
avaliao, como o caso das Redes Neurais, e, mais do que isso, verificar a
influncia da acessibilidade na valorizao de imveis urbanos, este trabalho
abordou dois estudos de caso, as cidades de Araariguama e So Carlos. A primeira
uma cidade dormitrio, de pequeno porte, localizada nas proximidades da capital
do estado, So Paulo. A segunda, por sua vez, uma cidade de porte mdio,
localizada no centro do estado e tem como principal caracterstica ser um plo
industrial e tecnolgico. A escolha destas cidades se deu, num primeiro momento,
pela facilidade de aquisio de dados, reforada pela oportunidade de estudar a
influncia de uma varivel como a acessibilidade em dois lugares com contextos
regionais diferentes.
Os resultados obtidos para Araariguama indicam que, mesmo sendo
uma cidade de pequeno porte, a medida de acessibilidade empregada, distncia ao
centro, uma das variveis mais importantes na formao do preo de propriedades.
Uma possvel explicao para isso que devido s pequenas dimenses da cidade,
os plos de atrao, como escolas, bancos e rea comercial se localizam no centro e
as limitaes do sistema de transporte pblico fazem com que propriedades
localizadas na regio central sejam mais valorizadas. Quanto aos resultados obtidos
pelos modelos empregados, pde-se observar que, ao utilizar regresso mltipla, o
efeito da varivel distncia ao centro no pode ser estudado sozinho, pois esta
varivel interage com a rea. Desta forma, utilizando a expresso obtida, verificou-
se que um aumento na rea aumenta o efeito marginal desta varivel, ou seja,
Nair Cristina Margarido Brondino - 134
propriedades grandes localizadas longe do centro so valorizadas. Uma explicao
para isso que um dos bairros mais luxuosos da cidade composto por chcaras e
se situa distante da regio central.
A utilizao de Redes Neurais, por sua vez, tambm forneceu
estimativas adequadas de valor. A importncia relativa de cada varivel pde ser
medida atravs de um mtodo proposto por Garson e forneceu um panorama da
valorizao de imveis na cidade. Para os trs conjuntos de dados utilizados na
anlise, verificou-se que a acessibilidade apresenta um peso superior a 34% no valor
final, seguida pela rea, com importncia relativa entre 10% e 18%.
Uma comparao dos dois mtodos para Araariguama mostrou que,
em termos do coeficiente de determinao (R
2
), no se pode concluir muita coisa,
uma vez que estes valores oscilaram muito de um conjunto para outro de dados. Ao
considerar o valor da erro relativo total, no entanto, pode-se observar que as Redes
Neurais (RN) demonstraram um desempenho superior, gerando uma diminuio de
43% com relao ao modelo de regresso. Uma comparao ponto a ponto para os
erros obtidos pelos dois mtodos e os trs conjuntos de dados analisados indicou
que, no geral, os erros relativos fornecidos pelas RN foram menores.
Com o objetivo de analisar a distribuio espacial dos erros fornecidos
pelo modelo de regresso, estes foram agrupados em cinco clusters. Os mesmos
limites de classe foram utilizados para agrupar os erros fornecidos pelas RN.
Observou-se da que, no geral, a maior proporo de erros observados pelo emprego
das Redes Neurais se concentrou nos clusters com valores menores. Ao observar os
mapas temticos gerados, pode-se constatar que os maiores erros fornecidos pelas
RN se concentram em um nico bairro. Para a regresso, no entanto, no se
consegue distinguir uma concentrao espacial dos erros maiores.
A anlise para So Carlos seguiu o mesmo critrio utilizado para a
outra cidade. Assim como para Araariguama, pde-se constatar que a distncia ao
centro um dos fatores preponderantes na avaliao imobiliria local, o que pde
ser observado pelos resultados obtidos por ambos os mtodos. Os resultados obtidos
indicaram que um aumento no valor da distncia ao centro da cidade provoca uma
diminuio do preo por metro quadrado.
Nair Cristina Margarido Brondino - 135
Uma anlise da importncia de cada varivel na resposta estimada
para as RN mostrou que, tambm para So Carlos, a acessibilidade a varivel que
contribuiu com a maior representatividade na estimao de valor em dois dos
conjuntos de dados, seguida pela categoria de bairro a que pertence o lote.
Diferentemente do que aconteceu para Araariguama, no se percebeu uma
diferena significativa entre os valores estimados por este mtodo e os fornecidos
pela regresso, tanto em termos de coeficiente de determinao quanto de erro
relativo total.
Atravs dos mapas temticos construdos para verificar a distribuio
espacial dos erros, notou-se uma concentrao de erros maiores em um dos bairros
analisados, o que pde ser observado para os dois mtodos empregados e dois dos
conjuntos de dados. Uma possvel explicao para este problema que o bairro em
questo possui uma grande quantidade de lotes vazios sendo oferecidos a preos de
mercado bastante baixos quando comparados aos outros bairros da cidade. Uma
soluo para este problema poderia ser a diviso da dcima quarta varivel
(categoria do bairro) em mais um subgrupo, indicando se o terreno se localiza neste
bairro. Alm dessa, outra opo seria isolar estes lotes do conjunto de dados e
construir modelos diferentes para eles. Tais sugestes, que merecem uma ateno
especial, sugerem um estudo mais aprofundado das caractersticas do bairro em
questo.
Alm da comparao dos resultados fornecidos por ambos os
mtodos, uma anlise do desempenho das Redes Neurais tambm foi realizada. Para
tal, redes utilizando o valor total do lote em lugar do preo por m
2
, foram simuladas
para as duas cidades. Os resultados indicaram que, se o objetivo for apenas o valor
estimado e no a influncia de cada varivel, uma configurao de rede que conduz
aos menores erros relativos para uma situao, tambm pode ser utilizada para a
outra. Porm, os erros relativos obtidos quando o preo total do lote foi utilizado
apresentaram, no geral, valores maiores que os obtidos para o modelo que utilizou o
m
2
.
Alm da diferena observada nos valores dos erros, notou-se que a
rea do lote passou a ter a maior representatividade nos valores estimados para o
Nair Cristina Margarido Brondino - 136
preo total, fato observado para os dois estudos de caso e que j era esperado devido
ao tipo de varivel utilizada. Alm disso, os mapas temticos construdos para a
verificao da distribuio espacial dos erros fornecidos para o caso em que o valor
total do lote foi utilizado para a cidade de So Carlos, apresenta uma certa coerncia
com aqueles obtidos para os erros observados para os valores estimados do m
2
,
sugerindo, mais uma vez que, em termos de valor estimado e para este estudo, as
redes forneceram boas estimativas, independentemente da transformao a que as
variveis foram previamente submetidas.
Quanto acessibilidade, um fato que chamou a ateno foi o de que
para Araariguama, que uma cidade de porte menor, a importncia relativa desta
varivel foi maior que para a outra cidade. Uma possvel explicao para isso que,
alm da existncia de um sistema de transporte pblico com boa cobertura, So
Carlos apresenta alguns plos de atrao em outros bairros, o que faz com que
moradores destes lugares no precisem se deslocar at a regio central da cidade
para executar vrias tarefas e, portanto, a varivel distncia ao centro parece no ser
to decisiva na aquisio de uma propriedade. Este fato sugere que outros tipos de
medida de acessibilidade, que levem em considerao situaes deste tipo, tambm
devem ser analisados. A comparao de cidades com portes e caractersticas
semelhantes tambm um assunto que deve ser futuramente considerado, com o
objetivo de verificar se a influncia da acessibilidade ocorre de maneira similar.
A utilizao de uma ferramenta mais poderosa de estatstica espacial
tambm mostrou-se de grande importncia para a anlise de resultados, uma vez
que poderia executar o trabalho de visualizao da distribuio dos erros de maneira
mais adequada. Apesar da simplicidade do mtodo aqui utilizado, que uniu
ferramentas estatsticas a um Sistema de Informaes Geogrficas, pde-se observar
fatos que haviam passado despercebidos, como por exemplo, a concentrao de
erros maiores em determinados bairros. Problemas como este poderiam ser
facilmente identificados e quantificados se fossem empregadas ferramentas
especficas para este tipo de anlise.
De maneira geral, os resultados obtidos aqui sugerem que, em termos
de facilidade de aplicao, os programas que fazem uso de Redes Neurais se
Nair Cristina Margarido Brondino - 137
apresentam como um mtodo mais acessvel, em termos de interface com o usurio.
Por sua vez, a verificao de algumas suposies bsicas com relao aos modelos
de regresso, embora raramente executada pelos usurios deste tipo de mtodo,
restringe seu uso a pessoas que tenham noes de lgebra de matrizes e nem sempre
esto disponveis em pacotes computacionais especficos, o que dificulta sua
utilizao de forma teoricamente correta.
O inconveniente das RN, por outro lado, a obscuridade da lgica
interna de processamento, em geral no visvel para os usurios. Isto , de certa
forma, desmistificado pelo mtodo de Garson aqui empregado.
Diante dos resultados comentados aqui, sugere-se a seguinte relao
de trabalhos para futuro desenvolvimento:
Avaliao do emprego de outras medidas de acessibilidade;
Comparao da influncia da acessibilidade para cidade de portes e
caractersticas parecidas;
Incluso de uma nova categoria de bairro no banco de dados de So
Carlos e novo treinamento da rede;
Utilizao de ferramentas especficas de anlise espacial para a
verificao da distribuio dos erros.
Nair Cristina Margarido Brondino - 138




7. BIBLIOGRAFIA


ABELSON, P. (1997). House and Land Prices in Sydney from 1931 to 1989. In: Urban
Studies, v. 34, n. 9. pp. 1381-1400.
ABNT - ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 5676/90.
(1989). Avaliao de Imveis Urbanos. Rio de Janeiro, ABNT.
ALMOND, N.; JENKINS, D.; GRONOW, S. (1997). Development of a Prototype
Residential Valuation System. In: Proceedings of the 5
th
Conference on Computers in
Urban Planning and Urban Management, Mumbai. Anais... Mumbai, 1997, v. 1. pp.
204-215.
ANTON, H. (1991). Elementary Linear Algebra. Segunda edio. John Wiley & Sons.
526 p.
AOKI, Y.; OSARAGI, T.; ISHIZAKA, K. (1994). An Interpolating Model for Land-price
Data with Transportation Costs and Urban Activities. In: Environment and Planning,
v. 21. pp. 53-65.
AZAR, K. T.; FERREIRA JR, J.; ABED J.; KAZZAZ, T. (1994). Using GIS for
Estimating the Spatial Distribution of Land Value in Metropolitan Beirut. Urban and
Regional Information Association - URISA.
BALARINE, O. F. O. (1995). Contribuies Macroeconmicas ao Entendimento da
Formao de Preos Habitacionais Locais. In: VIII COBREAP - Congresso
Brasileiro de Engenharia de Avaliaes e Percias, Florianpolis. Anais...
Florianpolis, 1995. pp. 361-265.
BEALE, R.; JACKSON, T. (1990). Neural Computing: An Introduction. Institute of
Physics Publishing.
BENTICK, B. L. (1996). The Differencial Incidence of an Urban Land Tax Depends on
the Travel Intensities of Substitutes for Land. In: Urban Studies, v. 33, n. 9. pp. 1729-
1732.
BIELLI, M.; REVERBERI, P. (1996). New Operations Research and Artificial
Intelligence Approaches to Traffic Engineering Problems. In: European Journal of
Operational Research, n. 92, pp. 550-572.
BORGES, J. M. M. (1975). Custo de Transporte e Valor dos Terrenos Urbanos.
Dissertao de Mestrado. Faculdade de Economia e Administrao - Universidade de
So Paulo.
Nair Cristina Margarido Brondino - 139
BRANDO, D. Q.; GUCH, D. U.; NEUMANN, C. (1995). Avaliao de Unidades de
Edifcios Residenciais Utilizando Estatstica Inferencial: Aplicao em Bairros da
Regio Continental de Florianpolis. In: VIII COBREAP - Congresso Brasileiro de
Engenharia de Avaliaes e Percias, Florianpolis. Anais... Florianpolis, 1995. pp.
229-236.
BRONDINO, N. C. M.; SILVA, A. N. R. (1997). Comparando Estratgias de Avaliao
de Imveis Para Fins de Tributao Com o Auxlio de um SIG. GIS Brasil 1997
Curitiba. Anais... Curitiba, 1997. (CD-ROM).
BRONDINO, N. C. M.; SILVA, A. N. R. (1998a). Atualizao de Plantas Genricas de
Valores: Novo Levantamento Cadastral ou Amostra de Valores de Mercado? GIS
Brasil 1998. Curitiba. Anais... GIS Brasil 98. (CD-ROM).
BRONDINO, N. C. M.; SILVA, A. N. R. (1998b). A Comparison of Land Valuation
Methods Supported by GIS. In: 4
th
Conference on Design and Decision Support
Systems in Architeture and Urban Planning. Maastricht. Anais... Maastricht, 1998
(CD-ROM).
BULLEN, N. (1997). Linking GIS and Multilevel Modelling in the Spatial Analysis of
House Prices. In: CRAGLIA, M. & COUCLELIS, H. Geographical Information
Research. pp. 412-426.
BUZAI, G. D.; DURAN, D. (1997). Ensear e Investigar com Sistemas de Informacin
Geogrfica (S.I.G.). Editora Troquel. 191 p.
CMARA, G.; CASANOVA M. A.; HEMERLY, A. S.; MAGALHES, G. C.;
MEDEIROS, C. M. B. (1996). Anatomia de Sistemas de Informao Geogrfica.
Instituto de Computao, UNICAMP. Campinas. 1996. 193p.
CARVALHO, A. P. L. F.; BRAGA, A.; LUDERMIR, T. (1998). Fundamentos de Redes
Neurais. Publicao da COPPE/UFRJ para a XI Escola de Computao Brasileria. Rio
de Janeiro.
CASSIDY, H. J. (1981). Using Econometrics: A Begginers Guide. Reston Publishing
Company. Virgnia. 304p.
CHESHIRE, P.; SHEPPARD, S. (1995). On the Price of Land and the Value of
Amenities. In: Economica. v. 62. pp. 247-267.
COCHRAN, W. G. (1953). Sampling Techniques. John Wiley & Sons.pp. 65-90.
DANTAS, R. A. (1999). Engenharia de Avaliaes Uma Introduo Metodologia
Cientfica. Editora Pini. So Paulo. 251p.
DAVIDSON, K. B. (1995). Accessibility and Isolation in Transport Network Evaluation.
In: WCTR The Seventh World Conference on Transport Research. Sydney. pp. 10-8.
DIA, H.; ROSE, G. (1995). Development of Artificial Neural Network Models for
Automated Detection of Freeway Incidents. In: WCTR The Seventh World
Conference on Transport Research. Sydney. pp. 1-21.
DRAPER, N. R.; SMITH, H. (1980). Applied Regression Analysis. John Wiley & Sons.
709 p.
DUNN, O. J.; CLARK, V. A. (1987). Applied Statistics: Analysis of Variance and
Regression. Second Edition. John Wiley & Sons. 445 p.
Nair Cristina Margarido Brondino - 140
DUARTE, A. M.; GABBAY, A. (1995). Avaliao em Massa: Modelos Genricos de
Valores Integrados a um Sistema de Informaes Geogrficas - SIG. In: VIII
COBREAP - Congresso Brasileiro de Engenharia de Avaliaes e Percias,
Florianpolis. Anais... Florianpolis, 1995. pp. 237-240.
FALAS, T. (1995). Neural Networks in Empirical Accounting Research: An Alternative
to Statistical Models. In: Neural Network World, v. 5, n. 4. pp. 419-432.
FERRAZ, A. C. P. (1990). Por um Imposto Sobre os Terrenos Urbanos Ociosos. Folha de
So Paulo. So Paulo, 26 de jan. cad. B, p.2.
FERRAZ, A. C. P.; SILVA, A. N. R. (1990). Reforma Urbana J. Folha de So Paulo.
So Paulo, 01 de mai. cad. C, p.5.
FERRAZ, A. C. P.; SILVA, A. N. R. (1992). Tributao Justa de Propriedade. Folha de
So Paulo. So Paulo, 24 de set. cad. 3, p.5.
FERRARI, R. (1996). Cenrios Alternativos para o Uso de GIS em Municpios. GIS
BRASIL 96. Curitiba. Anais ... Curitiba, 1996. Mdulo Municipal. pp.17-23.
FIKER, J. (1989). Manual de Redao de Laudos. Editora Pini. So Paulo. 119 p.
FIKER, J. (1993). Avaliao de Imveis Urbanos. Quinta Edio. Editora Pini. So Paulo.
104 p.
FLITMAN, A. M. (1997). Towards Analyzing Student Failures: Neural Networks
Compared with Regression Analysis and Multiple Discriminant Analysis. In:
Computers & Operations Research, v. 24, n. 4. pp. 367-377.
FORREST, D.; GLEN, J.; WARD, R. (1996). The Impact of a Ligth Rail System on the
Structure of House Prices A Hedonic Longitudinal Study. In: Journal of Transport
Economics & Policy, v. 30, n.1. pp. 15-29.
GIBB, K. (1994). Before and After Deregulation: Market Renting in Glasgow and
Edinburgh. In: Urban Studies, v. 31, n. 9 pp. 1481-1495.
GONALVES, M. F. R.. (1988). O Imposto Predial e Territorial Urbano e a
Progressividade. In: Revista de Administrao Municipal. Rio de Janeiro, v. 35, n.189.
pp. 6-14, out./dez.
GONALVES, M. F. dos R. (1990). IPTU: Alcance dos Princpios da Legalidade e da
Anualidade. In: Revista de Administrao Municipal. Rio de Janeiro, v. 37, n. 197. pp.
54-61, out./dez.
GONZLEZ, M. A. S. (1995) Plantas de Valores Inferenciais: A Espacialidade
Considerada Atravs de Trend Surfaces. In: VIII COBREAP - Congresso Brasileiro
de Engenharia de Avaliaes e Percias, Florianpolis. Anais... Florianpolis, 1995.
pp. 390-397.
GONZLEZ, M. A. S. (1996a). Aspectos Legais e Conceituais da Fixao de Valores do
IPTU. In: II COBRAC - Congresso Brasileiro de Cadastro Tcnico Multifinalitrio.
Florianpolis. Anais... Florianpolis 1996. pp. 123-130.
GONZLEZ, M. A. S. (1996b) Desenvolvimento de Planta de Valores com Sistemas de
Informaes Geogrficas e ITBI. In: II COBRAC - Cadastro Brasileiro de Cadastro
Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo II. pp.
225-231.
Nair Cristina Margarido Brondino - 141
GONZLEZ, M. A. S.; FORMOSO, C. T. (1994) O Emprego de Dados do ITBI Para
Atualizao de Cadastros de Valores Venais: Um Estudo de Viabilidade. In: I
COBRAC - Congresso Brasileiro de Cadastro Tcnico Multifinalitrio - Florianpolis,
1994. Anais... Florianpolis. Mdulo CTMU. pp. 154-162.
GONZLEZ, M. A. S.; FORMOSO, C. T. (1995). Integrao dos Tributos Imobilirios
Urbanos: Uma Planta de Valores Inferencial nica, Determinada com Dados do
ITBI. In: VIII COBREAP - Congresso Brasileiro de Engenharia de Avaliaes e
Percias, Florianpolis, 1995. Anais... Florianpolis, 1995, p. 326-335.
GONZLEZ, M. A. S. (1993). A Formao do Valor de Aluguis de Apartamentos
Residenciais na Cidade de Porto Alegre. Dissertao de Mestrado. Porto Alegre.
CPGEC/UFRGS.
GREENE, W. H. (1997). Econometric Analysis. Third Edition. Prentice Hall. New Jersey.
1075 p.
GUEDES, J. C. (1995). O Emprego de Inteligncia Artificial na Avaliao de Bens. In:
VIII COBREAP - Congresso Brasileiro de Engenharia de Avaliaes e Percias,
Florianpolis. Anais... Florianpolis, 1995. pp. 368-374.
GUNST, R. F.; MASON, R. L. (1980). Regression Analysis and its Application A Data
Oriented Approach. Marcel Dekker. New York. 402 p.
HADDAD, E. (1995). Using GIS to Monitor Housing Markets in So Paulo, Brazil. In:
4
th
International Conference on computers in Urban Planning and Urban Management.
Melbourne. Anais...Melbourne 1995, v.2. pp. 481-494.
HADDAD, E. (1997). Using GIS to Monitor Housing Markets in So Paulo, Brazil: Part
II. In: Proceedings of the 5
th
Conference on Computers in Urban Planning and Urban
Management, Mumbai. Anais... Mumbai, 1997, v. 1 pp. 193-203.
HAINING, R. (1995). Designing Spatial Data Analysis Modules for Geographical
Information Systems. In: FOTHERRINGHAN, S. and ROGERSON, P. Spatial
Analysis and GIS. pp. 45-63.
HARDGRAVE, B. C.; WILSON, R. L.; WALSTROM, K. A. (1994). Predicting Graduate
Students Success: A Comparison of Neural Networks and Traditional Techniques.
In: Computers & Operations Research, v. 21, n. 3. pp. 249-263.
HAYKIN, S. (1994). Neural Networks: A Comprehensive Foundation. Macmillan
College Publishing Company. pp. 1-88.
HOCHHEIM, N.; PETRY, G.; SCHERER, S. R.; SIMON, L. M.; WOLSKI, M. S. (1996)
Avaliao de Imveis Urbanos por Estatstica Inferencial e Regresso Mltipla:
Aplicao para o Centro de Florianpolis. In: II COBRAC - Cadastro Brasileiro de
Cadastro Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo
II pp. 61-69.
HSIAO, S.; STERLING, J. (1992). Use of Geographic Information System for
Transportation Data Analysis. In: Chow, J.; Litvin, D. M.; Opiela, K. S. (eds).
Microcomputers in Transportation. American Society of Civil Engineers. New York.
pp 94-102.
HUXHOLD W. E. (1991). An Introduction to Urban Geographic Information Systems.
Oxford University Press. Wisconsin. 337p.
Nair Cristina Margarido Brondino - 142
JOHNSON, R. A.; WICHERN, D. W. (1998). Applied Multivariate Statistical Analysis.
Fourth Edition. Prentice Hall. 816 p.
KIRCHNER, F. F. (1994). O Sistema Geogrfico de Informaes e o Cadastro Tcnico
Multifinalitrio. In: I COBRAC - Congresso Brasileiro de Cadastro Tcnico
Multifinalitrio. Florianpolis. Anais... Florianpolis, 1994.
KWON, O.; GOLDEN, B.; WASIL, E. (1995). Estimating the Length of the Optimal TSP
Tour: An Empirical Study Using Regression and Neural Networks. Computers &
Operations Research, v. 22, n. 10. pp. 1047-1056.
LAPOLLI, A. R. S.; DE CESARE, C. M.; LUNARDI, M. L. F.; OLIVEIRA, O. S. de;
GRANDO, P. A. (1994). Metodologia para a Determinao de Regies Homogneas
de Valorizao Imobiliria, Tendo em Vista a Gerao de Informaes Cadastrais:
O Caso do Municpio de Porto Alegre. In: I COBRAC - Congresso Brasileiro de
Cadastro Tcnico Multifinalitrio. Florianpolis. Anais... Florianpolis, 1994, Mdulo
CTMU.
LEVY, P. S.; LEMESHOW, S. (1991). Sampling of Populations-Methods and
Applications. John Wiley & Sons.
LEVIN, E. J.; WRIGHT, R. E. (1997). Speculation in the Housing Market? In: Urban
Studies, v. 34, n.9. pp. 1419-1437.
LEVINE, N. (1996). Spatial Statistics and GIS Software Tools to Quantify Spatial
Patterns. In: Journal of The American Planning Association, v. 62, n. 3. pp. 381-391.
LIM. D. (1992). The Nonneutrality of the Land Value Tax: Impacts on Urban Structure.
In: Journal of Urban Economics, v. 32. pp. 186-194.
LIPSCHULTZ, S. (1968). Linear Algebra. Schaum Publish Co. 413 p.
LONGLEY, P.; BATTY, M. (1996). Spatial Analysis: Modelling in a GIS Environment.
John Wiley & Sons. 392 p.
LONGO, C. A. (s.d.). Finanas Municipais e Ociosidade dos Terrenos na rea Urbana.
In: LONGO, C. A. & RIZZIERI, J. A. B. org. Economia urbana: custos de
urbanizao e finanas pblicas. Fundao Instituto de Pesquisas Econmicas - Srie
Relatrios de Pesquisa RP-10. So Paulo. pp. 197-232.
LONGO, C. A.; LIMA, J. C. S. (s.d.). O IPTU como Fonte de Recursos a Nvel
Municipal: Aspectos de Eficincia e Eqidade. In: LONGO, C. A. & RIZZIERI, J.
A. B., org. Economia urbana: custos de urbanizao e finanas pblicas. Fundao
Instituto de Pesquisas Econmicas - Srie Relatrios de Pesquisa RP-10. So Paulo.
pp. 233-256.
LUGER, G. F.; STUBBLEFIELD, W. A. (1989). Artificial Intelligence and the Design of
Expert Systems. The Benjamin/Cummings Publishing Company. pp. 581-584.
MEDEIROS JR., J. R.; FIKER, J. (1996). A Percia Judicial Como Redigir Laudos e
Argumentar Dialeticamente. Editora Pini. So Paulo. 138 p.
MENDONA, M. C.; SOLLERO FILHO, M. ; CURI, E.; AGUIAR, J. B.; QUEIROGA,
H. S.; MAIA, E. A.; AQUINO, R.; RESENDE, O.; CANADO, J. M. M. (1998).
Fundamentos de Avaliaes Patrimoniais e Percias de Engenharia. Editora Pini.
So Paulo. 316 p.
MLLER, L. F. C. (1995). Planta de Valores Genricos Avaliao de Imveis Para
Fins Tributrios. Sagra DC Luzzatto Editores. Porto Alegre. 79 p.
Nair Cristina Margarido Brondino - 143
MOREIRA, A. L. (1997). Princpios de Engenharia de Avaliaes. Quarta Edio.
Editora Pini. So Paulo. 504 p.
MUSSONI, L.; RINELLI, S. REITANI, G. (1996). Estimating the Accident Probability of
a Vehicular Flow by Means of an Artificial Neural Network. In: Environment and
Planning B: Planning and Design, v 23, n. 6. pp. 667-676.
NATH, R.; RAJAGOLAPALAN, B.; RYKER, R. (1997). Determining the saliency of
input variables in Neural Network Classifiers. In: Computers & Operational
Research, v. 24, n. 8. pp. 767-773.
OTTENSMANN, J. R. (1977). Urban Sprawl, Land Values and the Density of
Development. In: Land Economics, v. 53, n. 4. pp. 389-400.
PAULINO, A. A. D. D.; FREITAS, A. F; HEINECK, L. F. M. (1995) Atributos
Valorativos dos Imveis e Pesquisas Mercadolgicas: Uma Anlise de Mercado de
Florianpolis - SC. In: VIII COBREAP - Congresso Brasileiro de Engenharia de
Avaliaes e Percias. Florianpolis. Anais... Florianpolis, 1995. pp. 176-184.
PERUZZO, C. A.; LIMA JR., C. O.; RECH, J. V.; MARISCO, N. (1996) Avaliao de
Apartamentos por Inferncia Estatstica - Estudo de Caso: Balnerio de
Canasvieiras, Florianpolis - SC. In: II COBRAC - Cadastro Brasileiro de Cadastro
Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo II pp. 152-
158.
PHANG, S.; WONG, W. (1997). Government Policies and Private Housing prices in
Singapore. In: Urban Studies, v. 34, n. 11. pp. 1819-1829.
PASHA, H. A.; BUTT, M. S. (1996) Demand for Housing Attributes in Developing
Countries: A Study of Pakistan. In: Urban Studies, v. 33, n. 7. pp. 1141-1154.
PATKAR, V. N. (1997) On Integration of Analytical Techniques and GIS for Urban
Management. In: Proceedings of the 5
th
Conference on Computers in Urban Planning
and Urban Management, Mumbai. Anais... Mumbai, 1997, v. 1. pp.257-268.
PRATT, A. C. (1996). Coordinating Employment, Transport and Housing in Cities: An
Institucional Perspective. In: Urban Studies, v. 33, n. 8. pp. 1357-1375.
RAIA JR, A. A. (1995). Uma Avaliao do Modelo META para Clculo de Custos de
Transportes e Seu Uso na Tributao de Terrenos Urbanos Ociosos.. Dissertao de
Mestrado - Escola de Engenharia de So Carlos, Universidade de So Paulo. So
Carlos. 144 p.
RAIA JR, A. A.; SILVA, A. N.R.; LIMA, R. S. (1996a). Acessibilidade e Valor de
Terrenos Urbanos - O Caso da Cidade de Araraquara. In: VIII CLATPU - Congresso
Latino Americano de Transporte Pblico e Urbano. Curitiba. Anais... Curitiba 1996.
pp. VI-1 - VI-11.
RAIA JR., A. A.; SILVA, A. N. R.; LIMA, R. S. (1996b). Utilizando um SIG Para
Avaliar Nveis de Acessibilidade em Uma Cidade Mdia. In: II COBRAC - Cadastro
Brasileiro de Cadastro Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis,
1996, Tomo III. pp. 193-204.
RAIA JR., A. A.; SILVA, A. N. R. (1996). Relao Acessibilidade-Preo de Terrenos
Com o Uso de um SIG. In: CONGRESSO TCNICO-CIENTFICO DE
ENGENHARIA CIVIL. Florianpolis. Anais... Florianpolis, 1996. v. III. pp.338-348.
Nair Cristina Margarido Brondino - 144
RAIA JR. A. A. (1997). Acessibilidade e Preo do Terrenos em Cidades Mdias de um
Pas em Desenvolvimento. Exame de qualificao ao doutorado apresentado ao
Departamento de Transportes da EESC USP.
RIPLEY, B. D. (1981). Spatial Statistics. John Wiley & Sons. New York. 252 p.
ROAKES, S. L. (1996). Reconsidering Land Value Taxation The Golden Key? In:
Land Use Policy, v. 13, n. 4. pp. 261-272.
RODGHER, S. F.; FABBRI, G. T. P.; CARVALHO, A. C. P. L. F. (1997). A Utilizao de
Redes Neurais Artificiais para Classificao de Solos Tropicais. In: XI Congresso de
Pesquisa e Ensino em Transportes. Rio de Janeiro.
SALCHENBERGER, L.; VENTA, E. R.; VENTA, L. A. (1997). Using Neural Networks
to Aid the Diagnosis of Best Implant Rupture. In: Computers & Operations Research,
v. 24, n. 5. pp. 435-444.
SAMPAIO, A. C. F. (1996) Mapeamento Cadastral - Exemplos e Alternativas de
Execuo. In: II COBRAC - Congresso Brasileiro de Cadastro Tcnico
Multifinalitrio. Florianpolis. Anais... Florianpolis, Tomo III. pp. 386-392.
SCHNEIDER, V. P. (1994). Cadastro Tcnico Multifinalitrio e o Sistema Tributrio. In:
I COBRAC - Congresso Brasileiro de Cadastro Tcnico Multifinalitrio -
Florianpolis. Anais... Florianpolis 1994.
SILVA, A. N. R. (1993). O Custo do Solo Urbano Ocioso e uma Nova Sistemtica de
Tributao da Propriedade. Tese de Doutorado em Transportes, Universidade de So
Paulo. So Carlos. 137 p.
SILVA, A. N. R. (1998). Sistemas de Informao Geogrfica em Transportes. Texto
apresentado Escola de Engenharia de So Carlos para obteno do ttulo de Livre-
Docente. So Carlos. 112 p.
SILVA, A. N. R.; FERRAZ, A. C. P. (1993). Uma Nova Sistemtica de Tributao da
Propriedade Urbana. In: Revista de Administrao Municipal. IBAM - Instituto
Brasileiro de Administrao Municipal, v. 40, n. 208. pp. 51-61, jul/set.
SILVA, A. N. R; VARGAS, E. N. Z.; ITO, L. E.; CUBAS, S. I. B. (1994). O Cadastro dos
Terrenos Ociosos e a sua Importncia para uma Tributao Mais Justa da
Propriedade Urbana. In: I CONGRESSO BRASILEIRO DE CADASTRO TCNICO
MULTIFINALITRIO. Florianpolis. Anais... Florianpolis, 1994, Tomo III pp.118-
126.
SILVA, A. N. R.; MELO, J. J. O.; BRONDINO, N. C. M. (1997). Uma Introduo ao
Planejamento de Transportes com Sistemas de Informao Geogrfica. Editora da
Escola de Engenharia de So Carlos. So Carlos. 74p.
SILVA, A. N. R.; WAERDEN, P. v. (1997) Combining Simplified Models and GIS to
Estimate Urban Costs in Developing Countries. In: Proceedings of the 5
th
Conference
on Computers in Urban Planning and Urban Management, Mumbai. Anais... Mumbai,
1997, v. 1. pp. 85-96.
SILVA, A. N. R.; FERRAZ, A. C. P.; RAIA JR., A. A. (1999). Towards a Strategy to
Minimize the Negative Effects of Urban Sprawl in Brazil. In: Jenks, M. & Burgess,
R. The Compact City in Developing Countries. Routledge. Londres. (no prelo).
Nair Cristina Margarido Brondino - 145
SUBRAMANIAN, V.; HUNG, M. S.; HU, M. Y. (1993). An Experimental Evaluation of
Neural Networks for Classification. In: Computers & Operations Research, v. 20, n.
7. pp. 769-782.
TEIXEIRA, A. L. A.; MORETTI, E.; CHRISTOFOLETTI, A. (1992). Introduo aos
Sistemas de Informao Geogrfica. Edio do autor. Rio Claro.
TOLEDO, M. C. S.; DOMINGUES, R. M. (1995). Valores Unitrios Bsicos para Glebas
e Lotes no Estado de So Paulo, VII COBREAP - Congresso Brasileiro de
Engenharia de Avaliaes e Percias. Florianpolis. Anais... Florianpolis, 1995. pp.
448-456.
TRIPPI, R. R.; TURBAN, E. (1992). Neural Networks in Finance and Investing. Probus
Publishing Company. pp. 3-72.
TRIVELLONI, C. A.; LIMA JUNIOR, C. O.; RECH, J. V.; MARISCO, N. (1996).
Avaliao de apartamentos por inferncia estatstica - estudo de caso: Balnerio de
Canasvieiras, Florianpolis - SC. In: II COBRAC - Cadastro Brasileiro de Cadastro
Tcnico Multifinalitrio. Florianpolis. Anais.... Florianpolis, 1996. Tomo II. pp.
152-160.
TUBB, N. R. (1993). A Development Path to Success in Neural Computing. In: Expert
Systems Applications, v. 9, n. 5. pp. 5-9.
ULUACHA, N. O. (1997). The Development and Application of a Geographical
Information system (GIS) for Property Tax Administration: Experiences from
Nigeria In: Proceedings of the 5
th
Conference on Computers in Urban Planning and
Urban Management, Mumbai. Anais... Mumbai, 1997, v. 2. pp. 560-571.
VERTELO, J. B. (1996). Planta Genrica de Valores da Cidade de Governador
Valadares. In: II COBRAC - Cadastro Brasileiro de Cadastro Tcnico Multifinalitrio.
Florianpolis. Anais.... Florianpolis, 1996, Tomo II. pp. 232-243.
WONG, D. W. S.; WU, V. C. (1995). Quality of Aggregated Spatial Data A Guidance
for Decision. In: 4
th
International Conference on Computers in Urban Planning and
Urban Management. Melbourne. Anais...Melbourne 1995, v.2. pp. 559-570.
WYATT, M. D. (1994). A Critical View of Land Value Taxation as a Progressive
Strategy for Urban Revitalization, Rational Land use, and Tax Relief. In: Review of
Radical Political Economics, v. 26, n. 1. pp. 1-25.
WYATT, R. (1995). Strategy Evaluation Using Neural Networks. In: Proceedings of the
4
th
International Conference in Urban Planning and Urban Management. Melbourne,
pp. 367-378.
WYATT, R. (1996). Evaluating Strategies by Means of an Artificial Neural Network. In:
Environment and Planning B: Planning and Design, v. 23, n. 6. pp. 685-696.
WYATT, R. (1997). Consistency of Planning Style. In: Proceedings of the 5
th
Conference
on Computers in Urban Planning and Urban Management, Mumbai. Anais... Mumbai,
1997, v. 1, pp.181-192.
XU, F.; MITTELHAMMER, R. C.; BARKLEY, P. W. (1993). Measuring the
Contribuitions of Site Characteristics to the Value of Agricultural Land. In: Land
Economics, v. 69, n. 4. pp. 356-369.
YUAA, F. (1996). Estimador de Valor do Lote Urbano. GIS BRASIL 96. Curitiba.
Anais ... Curitiba, 1996. Mdulo Municipal. pp.25-39.
Nair Cristina Margarido Brondino - 146
ZANCAN, E. C.; HEINECK, L. F. (1994). Metodologia Para Execuo de Planta de
Valores Genricos: Caso de Cricima-SC. In: I COBRAC - Congresso Brasileiro de
Cadastro Tcnico Multifinalitrio. Florianpolis. Anais... Florianpolis, 1994. Mdulo
CTMU. pp. 52-59
ZANCAN, E. C. (1996). Avaliaes de Imveis em Massa Para Efeitos de Tributos
Municipais. Rocha Grfica e Editora Ltda. Florianpolis. 121p.

You might also like