Professional Documents
Culture Documents
ARTIGO 05
Resumo: A tecnologia oferece atualmente excelentes solues para organizar grandes volumes de documentos dos
mais variados tipos (armazenados em arquivos, bibliotecas, rgos pblicos, empresas de grande porte). Entretanto
a soluo para organizar a informao neles contida ainda no foi resolvida a contento, de forma generalizada, e
quanto mais cresce o volume de documentos, mais e mais informao se perde nos arquivos e na memria dos
computadores. Os fundamentos para a soluo existem e so conhecidos de (alguns) tcnicos e especialistas da
gesto da informao e do conhecimento, mas preciso aprofundar e aprimorar os processos de anlise da
informao e representao do conhecimento, e realizar o casamento desses princpios com a mais nova tecnologia
de gesto dos documentos.
Palavras-chave: Documento; Organizao; Informao; Arquivo; Memria; Representao do Conhecimento.
Abstract: Nowadays, technology offers excellent solutions to organize great volumes of the most different types of
documents (such as the ones kept in archives, libraries, public agencies, great corporations, etc.). Nevertheless, the
solution to organize the information they contain was not found by now either in a satisfactory or general manner,
and as the volume of documents increases, more and more information is lost in files and in computer memories.
The foundations of a solution do exist and they are known by [some] specialists and experts in information or
knowledge management, but it is necessary to improve and deepen the processes of information analysis and
knowledge representation, as well as to match these processes with the newest technologies of document
management.
Keywords: Document; Organization; Information; Archive; Memory; Knowledge Representation.
" ...
Onde esto os documentos
que se perderam nos arquivos?
Onde esto os livros
que se perderam nas bibliotecas?
Onde esto os dados
Que se perderam nos computadores? ..."
num ambiente 'kardecista', tambm deveriam ter sido cruzadas com o nome do indivduo.
Todavia preciso pensar que podem existir ou ter existido vrias pessoas com igual identidade e que para
'cercar' a pessoa certa seria necessrio introduzir 'filtros' tais como o local e data de nascimento, filiao,
CPF, certido de casamento, etc., informaes estas que no sempre se encontram acessveis num nico
banco de dados.
Outro exemplo:
Consideremos um sistema altamente sofisticado, capaz de identificar de forma automtica, num processo
de varredura dos textos dos documentos, aqueles termos e expresses possveis e provveis que podem ser
utilizados como 'ponteiros' ou pontos de acesso para recuperar as informaes desejadas. Suponhamos que
desejamos fazer uso desse sistema para localizar documentos que tratam da evoluo e uso dos sinos e
outros instrumentos assemelhados, ao longo de um certo perodo de tempo. Imaginemos que o dito sistema
examinou com todo rigor um acervo de documentos manuscritos cuidadosamente digitalizados e
indexados procura das palavras 'sino' ou 'campana', palavra esta que, como explica qualquer dicionrio,
refere-se a um sino pequeno. Imaginemos, enfim, que o sistema identificou um certo nmero de
documentos com a palavra 'sino' e outra quantidade de documentos com a palavra 'campana'. timo!
Muito bom!!... Ento pedimos ao sistema para ver o texto dos documentos encontrados e... Surpresa!
Entre os documentos que, a primeira vista nos parecem bem pertinentes para o que queramos
encontramos um, do qual reproduzimos um fragmento (Figura2) onde efetivamente identificamos a
palavra 'campana' misturada com um monte de palavras escritas com uma grafia que no conseguimos
entender.
1. A identificao e anlise do contedo informacional dos documentos ou, de forma mais genrica
conhecimentos' que podem parecer mais prprias dos sistemas de inteligncia artificial que do tema que
vimos tratando. Pode parecer, mas no bem assim. Seno, vejamos: Na Figura 6 representamos o
esquema clssico de um sistema especialista, tpico de numerosas reas de aplicao da inteligncia
artificial.
A Figura 7 pode ajudar a fixar de forma mais forte a relao conceitual intrnseca de nossas preocupaes
de conservao, organizao e gesto de documentos com os sistemas especialistas da inteligncia
artificial, e no por acaso que j se comea a falar de 'arquivamento inteligente da informao'. A figura
mostra as trs grandes reas em que pode ser subdividida a inteligncia artificial [3].
Observe-se que as trs reas esto fortemente implicadas na soluo de nosso problema:
- O foco linguagem natural aponta para o desenvolvimento de aplicaes capazes de ler, interpretar
e codificar automaticamente os textos dos documentos;
- A robtica, presente numa infinidade de sistemas e aplicaes sensveis a estmulos visuais e
eletro-magnticos (leitores ticos e magnticos) est cada vez mais presente nos grandes sistemas
de armazenamento/arquivamento de importantes volumes de documentos;
- Os sistemas especialistas, dos quais acabamos de falar nos pargrafos anteriores, apontam para o
desenvolvimento de aplicaes informticas suscetveis de utilizar o conhecimento simblico da
forma o mais prxima possvel do comportamento humano.
Convm destacar que a considerao conjunta das duas figuras anteriores leva concluso de que etapa
fundamental de todo o processo de gesto da informao e do conhecimento justamente a primeira etapa,
ou seja a interface de aquisio. Com efeito, essa etapa a que h de permitir a gerao, alimentao,
organizao e atualizao, com o padro de qualidade requerido, da base de conhecimento. Essa etapa, por
ser justamente a que mais requer um elevado padro de qualidade e por apresentar um elevado nvel de
complexidade, para chegar a permitir a representao codificada das informaes e conhecimentos, de
forma a abrir o caminho para os sucessivos processamentos que se fizerem necessrios, tambm,
http://www.dgz.org.br/fev04/Art_05.htm (10 of 16)9/8/2005 08:45:46
Figura 8.- Indexao automtica a partir dos ttulos e resumos dos registros documentrios
Publicados em 'Cincia da Informao' no perodo 1972-1983
Figura 9. - Fragmento do ndice temtico remissivo gerado automaticamente a partir dos resultados da
indexao mostrados na figura anterior.
As Figuras 10 e 11 mostram, respectivamente, um exemplo de processamento de uma carta e o resultado
da identificao e extrao automtica dos termos que podero servir como ponteiros ou pontos de acesso,
para busca e recuperao de informaes na base de conhecimento.
Figura 11. Descritores temticos extrados automaticamente da carta da figura precedente, que serviro
como pontos de acesso na base de conhecimento
Hoje, algoritmos mais avanados, mas que pouco diferem conceitualmente dos implementados e utilizados
nos exemplos mostrados, so utilizados por todos ns cada vez que fazemos uso dos motores de busca de
Yahoo, Google, Altavista e muitos outros, que vo buscar a respostas s nossas indagaes em gigantescos
bancos de dados e informaes.
Voltando ao nosso assunto, antes de encerrar estas consideraes, permitam-me lembrar um filme
realizado e difundido h alguns anos, protagonizado por Michael Douglas e pela bonita Demi Moore,
filme esse que, com uma histria de assdio sexual da segunda sobre o primeiro, como pano de fundo
apresentava um sistema de tele-acesso a documentos confidenciais. Poderia parecer pura fico mais ou
menos cientfica e tecnolgica se no existissem j naquela data sistemas totalmente automatizados de
registro, organizao, armazenamento e consulta de documentos, com diversas variantes e em vrios
pases. A ttulo de exemplo citarei um dos primeiros, instalado e operado pelo Ministrio das Finanas da
Frana, num corredor de mais de 200 metros, nos terrenos de uma antiga fbrica da Renault, em BoulogneBillancourt, perto de Paris, que permite tele-processar, tele-organizar, tele-localizar, tele-extrair, e teleconsultar os documentos.
5. Concluso
Sem comentrios.
considerado razovel gastar uma fortuna e um tempo considervel para consolidar e nivelar o piso do(s)
local(ais) onde sero instalados os equipamentos mais ou menos robotizados. considerado razovel
gastar uma fortuna e um tempo considervel em refazer completamente toda a instalao eltrica.
considerado razovel gastar uma fortuna e um tempo considervel em adquirir novos e poderosos
equipamentos informticos. considerado razovel gastar uma fortuna e um tempo considervel em
escolher e instalar diversos sistemas de segurana e preveno. Entretanto, realizar uma despesa que
dificilmente ultrapassaria dez por cento das despesas totais, na implementao do sistema de aquisio,
processamento e armazenamento inteligente das informaes e do conhecimento, nica forma de dispor de
bases de dados, informaes e conhecimentos suscetveis de informar corretamente e de alcanar o
domnio da informao.
Na Figura 12 podemos ver como um alto executivo bem informado, que conseguiu o domnio inteligente
da informao, pode monitorar o bom andamento de seus negcios de qualquer lugar do planeta.
[1] Eliot, Thomas Stearns. The Rock. Apud Nery da Fonseca, Edson. Conferncia de abertura do 2
Seminrio Nacional de Bibliotecas Universitrias - 2 SNBU. Braslia DF, ABDF, jun 1981, Anais.
[2] Harmong, Paul; King, David. Sistemas especialistas. Rio de Janeiro RJ: Campus, 1988. Apud Teixeira,
Alison Ribeiro. A utilizao de programas de computador com agentes no processo de tranferncia da
http://www.dgz.org.br/fev04/Art_05.htm (15 of 16)9/8/2005 08:45:46
informao: criao e avaliao de um sistema especialista baseado em casos. Braslia DF: Universidade
de Braslia/Departamento de Cincia da Informao,2000 (Dissertao de Mestrado.)
[3] Op. cit. Ibidem.
[4] Robredo, Jaime. Indexao automtica de textos: uma abortdagem automatizada e simples. Cincia da
Informao, v.20, n.2, 1991, p.130-136.