Professional Documents
Culture Documents
Outline
Introduo
Caracterizao do problema
Trabalhos Relacionados
INTRODUO
Recuperao de Informao
Recuperao de Informao a rea que estuda mtodos para facilitar o
acesso a itens de informao.
Variaes de itens:
Textos
Vdeos
Imagens
Hipertextos
Conjunto de documentos
Conjunto de consultas
Mecanismo para determinar quais documentos atendem s consultas
Objetivo:
Atender s necessidades de informao de usurios, expressas por consultas.
CARACTERIZAO DO PROBLEMA
Caracterizao do Problema
10
TRABALHOS RELACIONADOS
11
Trabalhos Relacionados
Modelos:
sTerm
JuruXML
12
Trabalhos Relacionados
Avaliao de Modelos de RI: Modelos de R.I. podem ser avaliados de acordo com o
conjunto de resultados retornados como resposta a uma consulta
Preciso-Revocao
EPRUM
Coleo de testes:
INEX
13
Preciso-Revocao
Mecanismo de avaliao da qualidade do resultado da consulta.
Preciso
Revocao
14
Preciso-Revocao
EPRUM
EPRUM - Generalizao do Preciso-Revocao
Objetivo:
Aplicao:
16
INEX
Programa que fornece colees para testes de documentos XML.
Dois tipos de consultas:
CO - somente contedo
CAS - contedo e estrutura
17
sTerm
Estrutura:
18
sTerm
Consulta:
19
sTerm
Clculo do Grau de similaridade:
20
sTerm
Vetor de documentos
Vetor de consultas
21
JuruXML
Similar ao modelo sTerm
Diferena:
22
CARACTERIZAO DA CONTRIBUIO
23
Caracterizao da Contribuio
Motivao
Proposta
Mtodo
24
25
Implementado em Java
artigo [ acadmico,empresas]
Termos: acadmico, empresas
Contexto: artigo
26
Implementado em Java
API SAX
termo# contexto
Termo: termo da consulta (folha da rvore)
Contexto: caminho da raz at a folha
27
Prxima etapa
28
Concluso
29
Concluso
Uma vez que solues para recuperao de dados semi-estruturados no podem ser apresentadas
por sistemas de bancos de dados convencionais e diante de um cenrio onde a busca de informao
est cada vez mais ligada a dados que apresentam estruturas heterogneas, como os encontrados na
WEB, o estudo sobre a recuperao semi-estruturada se torna cada vez mais relevante e buscas de
solues para os problemas relacionados a esse tipo de consulta so necessrias para minimizar o
impacto desse quadro atual.
30
Referncias
ROBERTSON, S.E.; SPARCK-JONES, K. Relevance weighting on search terms.
Journal of American Society for Information Sciences , v. 27, n. 3, p.129146,
1976.
SALTON, G. Automatic information organization and retrieval . New York:
McGraw Hill, 1968. 421 p.
JUNQUEIRA, M. S.. Um estudo sobre diferentes modelos de Recuperao de
Informao em documentos semi-estruturados (XML) - Implementao,
nalise, Avaliao e Comparao. -- Uberlndia: UFU, 2007.
31