You are on page 1of 37

Alunos: Diego de Liz Jos Mario Fernandes Rosa Maurcio Cavichioli Passos Osni Borges Padilha

WEB SEMNTICA
Vem se apresentando como a soluo para ordenar o caos informacional existente na web; Possibilitar a compreenso e o gerenciamento dos contedos armazenados na web; O fantasma da perda de informao ou mensagens do tipo Error 404: Not Found devero inexistir, ou estar sob controle; Para implementao ou reorganizao da WEB SEMNTICA h um contingente de pesquisadores trabalhando no W3C, em pases como EUA, Frana e Japo, com a misso de alavancar a web ao seu potencial mximo.

INTRODUO
A internet tornou-se um fenmeno mundial, sendo possvel acessar informaes em diversas partes do mundo instantaneamente. O volume destas informaes alcanaram nmeros impressionantes nos dias atuais.Entretanto o vasto nmero de documentos Web e a falta de padronizao dessas informaes originaram um problema para os usurios na hora de navegar na Internet e assim achar as informaes desejadas. Esse problema chamado de Information Overload. Esse problema caracterizado quando uma pessoa, ao realizar uma consulta, obtm um nmero excessivo de informaes como resposta e no consegue absorv-las ou trat-las, tendo que examinar todos os documentos resultantes para encontrar as informaes desejadas. Como a maior parte das informaes disponveis na Internet, est disposta em linguagem natural, sendo compreensveis apenas por humanos, houve a necessidade de uma semntica que permitisse uma padronizao das informaes sendo possvel o processamento dessas informaes por humanos e mquinas, surgindo assim a idia do desenvolvimento da Web Semntica.

ARQUITETURA DA WEB SEMNTICA

ARQUITETURA

A Web Semntica introduz estrutura e significado ao contedo disponvel na internet, visando transformar uma rede de documentos em uma rede de dados, compreensvel tanto para humanos quanto para computadores, de maneira a possibilitar que os ltimos cooperem melhor durante a realizaco de tarefas, ou quando da realizao de um servio aos usurios.
O principal desafio da Web Semntica criar uma linguagem que consiga expressar o significado e ao mesmo tempo estabelecer regras para processar esse significado de forma a inferir novos dados e regras. As regras para o processamento do significado devem ser exportadas para a web afim de permitir que outros sistemas inteligentes possam interagir.

Na proposta de desenvolvimento da Web Semntica sugerida uma arquitetura de trs camadas:

ARQUITETURA

Web Semntica Camada Lgica Camada de Ontologia Camada de Estrutura Regras de Inferncia

Dados

A camada de Estrutura: que estrutura os dados e define seu significado; A camada Ontologia: que define as relaes entre os dados; A camada Lgica: que define mecanismos para fazer inferncias sobre os dados.

ARQUITETURA
A CAMADA DE ESTRUTURA:
A camada de estrutura prov uma forma de definir os dados do documento e o significado associado a esses dados. Trata tambm da estruturao e disposio dos dados de forma que os programas que rodam na web possam fazer inferncia a partir dos mesmos. Para que haja a representaco do conhecimento so necessarias trs condies: Interoperabilidade estrutural: Permite que os dados sejam representados de forma distinta, permitindo especicar tipos e possveis valores para cada forma de representao;

Interoperabilidade sinttica: Constitui- se de regras precisas que permitem o intercmbio de dados na Web;

Interoperabilidade Semntica: Possibilita a compreenso e associao entre os dados.


Para atender esses requisitos, utiliza-se XML e RDF.

ARQUITETURA
A CAMADA DE ONTOLOGIA:

A utilizao das triplas <objeto, atributo, valor> garante a definio nicas dos conceitos, no entanto, o mesmo conceito pode ser expresso de forma diferente e em linguagens diferentes. Por exemplo, duas bases de dados podem armazenar os mesmos conceitos utilizando terminologias distintas. Para que a informao existente possa ser processada e relacionada necessrio que exista uma definio da relao entre os conceitos contidos em diferentes documentos. Para isso so utilizadas as ontologias.

Uma ontologia pode ser definida como um conjunto de termos de conhecimento incluindo o vocabulrio, interconexes semnticas e simples regras de inferncia.

ARQUITETURA
A CAMADA DE LGICA:

atravs da camada lgica que so possveis os relacionamentos de informao e as inferncias de conhecimento da Web Semntica. As regras de inferncia fornecem aos agentes(programas) poder de raciocinar sobre os termos e seus significados, que foram definidos na camada esquema e de raciocinar a respeito dos relacionamentos entre os conceitos segundo a sua definio na camada ontologia. Os agentes so sistemas computacionais capazes de interagir autonomamente para atingir os objetivos do seu criador. Os agentes possuem algumas caractersticas como autonomia, reatividade (percebem o ambiente e tomam as decises), tm comportamento colaborativo, possuem objetivos, so flexveis, sociveis e tm a capacidade de aprender. A Web Semntica possuir vrios agentes interagindo entre si, compreendendo, trocando ontologias, adquirindo novas capacidades racionais quando adquirirem novas ontologias e formando cadeias.

LINGUAGENS DA WEB

SEMNTICA

LINGUAGENS DE REPRESENTAO DE RECURSOS INFORMACIONAIS

Principais Linguagens Computacionais Padronizadas pelo W3C: XML (Extensible Markup Language) RDF (Resource Description Framework) OWL (Web Ontology Language)

LINGUAGENS DE REPRESENTAO DE RECURSOS INFORMACIONAIS


o XML
Objetivos da linguagem: 1. Direta e Objetiva 2. Suporta ampla gama de aplicativos 3. Compatvel com SGML 4. Fcil de desenvolver programas 5. Nmero de recursos adicionais mnimos 6. Documetos legveis e claros 7. Preparado rapidamente 8. Design formal e conciso 9. Documentos fceis de serem criados 10. A conciso na marcao de importncia mnima

Importante Caracterstica: Permite ao autor do documento a definio das suas prprias marcas, o que confere ao XML habilidades semnticas que possibilitam melhorias nos processos de recuperao e disseminao da informao

LINGUAGENS DE REPRESENTAO DE RECURSOS INFORMACIONAIS

RDF Modelo para descrever recursos Baseado em um modelo de grafo no lugar de rvore Sintaxe: (Sujeito, Predicado, Objeto) Usa XML como sintaxe Melhora a descoberta, o acesso e o gerenciamento das informaes da Web

LINGUAGENS DE REPRESENTAO DE RECURSOS INFORMACIONAIS

OWL Recomendada pelo W3C para o desenvolvimento de ontologias, definida a partir de: RDF e RDF Schema DAML+OIL Estrutura baseada nos seguintes elementos bsicos: Namespaces; Cabealhos; Classes; Indivduos; Propriedades; Restries

Linguagens de Representao de Recursos Informacionais

OWL Lite: Verso simplificada de OWL Oferece primariamente hierarquias e restries simples OWL DL Aumenta a expressividade, mantendo decidibilidade OWL Full Expressividade, sem garantia de decidibilidade

A WEB SEMNTICA SOB O PRISMA DA CINCIA DA INFORMAO

EXEMPLOS
possvel identificar atualmente alguns projetos que tm como principal objetivo o desenvolvimento de novas tecnologias no mbito de bibliotecas digitais utilizando-se das tecnologias relacionadas ao projeto Web Semntica, entre os quais pode-se destacar o JeromeDL e o MarcOnt.

JEROMEDL
Reconnecting Digital Libraries and the Semantic Web, o projeto JeromeDL Consiste de uma biblioteca digital de cdigo aberto baseada nas principais tecnologias presentes no projeto Web Semntica, permitindo a descrio de recursos a partir da linguagem computacional RDF e a realizao de buscas semnticas baseadas em ontologias, possibilitando uma melhora considervel na preciso das buscas e um maior nvel de interoperabilidade.

MARCONT

O principal objetivo deste projeto criar uma ontologia capaz de tornar-se um padro de representao de informaes para bibliotecas digitais, possibilitando a descrio dos aspectos semnticos dos contedos e favorecendo a integrao de bibliotecas. Assim, est em fase de desenvolvimento e avaliao a ontologia MarcOnt, desenvolvida utilizando-se a linguagem OWL, de modo que se espera que tal ontologia seja compatvel com o formato MARC 21, permitindo que as descries semnticas possam ser convertidas para outros formatos, possibilitando grande interoperabilidade e o reaproveitamento das bases de conhecimento, por meio da incorporao de outras ontologias que sigam os mesmos critrios.

RECUPERAO DA INFORMAO NA WEB SEMNTICA

ESTRATGIA DE BUSCA
conhecido que a maior parte dos usurios,ao realizar uma busca, acredita possuir uma boa compreenso dos prprios problemas. A tarefa do intermedirio junto aos sistemas ajudar o usurio a definir e especificar o problema, com termos e conceitos que so apropriados para aquela fonte de informao especfica que ser utilizada para a busca. Oldroyd & Citroen (1977) identificaram trs grandes etapas para deciso no processo de planejamento da estratgia de busca: deciso sobre qual a melhor base de dados para um determinado tema; deciso referente seleo dos termos de busca e sua adequao para a base a ser consultada; deciso sobre a formulao lgica da estratgia.

ESTRATGIA DE BUSCA ETAPAS


1 Etapa: Discusso do tpico geral da pesquisa til perguntar como os resultados da busca iro ser aplicados, porque a resposta pode mudar a direo ou a nfase da busca. 2 Etapa: Conhecimentos bsicos sobre os instrumentos de busca Isto pode ajudar a definir o tpico e gerar uma lista das palavras chave a serem usadas na estratgia de busca 3 Etapa: Formulao provisria da estratgia de busca A busca estar bem definida se o intermedirio for capaz de assegurar a recuperao de todas as citaes para vrios termos. Porem, desejvel que para informaes mais complexas, seja usado pelo menos dois conjuntos de termos.

ESTRATGIA DE BUSCA ETAPAS


4 Etapa: Compreenso da lgica dos conjuntos de termos O uso da interseo de mais de dois conjuntos de termos deve ser evitado, porque, embora os resultados possam ser bem precisos, eles sero limitadores e podem provocar uma possvel excluso de informaes relevantes. 5 Etapa: Interdisciplinaridade Realizar a expanso da busca em outros campos, aumentando consequentemente as possibilidades de documentos de interesse virem a ser recuperados.

ESTRATGIA DE BUSCA ETAPAS


6 Etapa: Eliminao de termos indesejados Os termos indesejados sero excludos do resultado da busca depois de se ver o impacto dessa excluso no resultado total da busca. A deciso para excluir termos nem sempre fcil e, visualmente, depende da especificao do tpico.

7 Etapa: Especificao dos parmetros relevantes para a execuo da busca Todos os parmetros relevantes devem ser considerados para se determinarem os limites da busca. Deve a busca ser limitada nos anos mais recentes? Quais as bases de dados que provavelmente iro fornecer as mais relevantes citaes? O pesquisador quer todas as citaes que mencionam uma autoridade particular ou somente as que so autorizadas por uma pessoa particular?

O QUE FALTA ?

CONHECIMENTO MAIS APROFUNDADO DOS PROGRAMADORES DE PGINAS WEB ADOO DA TECNOLOGIA PELOS SITES DE BUSCA

INFRA ESTRUTURA PARA ARMAZENAMENTO E DISSEMINAO


ATUALIZAO DA WEB

COMO RECUPERAR Estratgia:


Arte de aplicar os meios disponveis com vista consecuo de objetivos especficos.

Busca:
Procura com o fim de encontrar alguma coisa

Ttica:
Processo empregado para sair-se bem num empreendimento

OBJETIVOS

DIMINUIR O CAOS DE EXCESSO DE INFORMAES

ESTRUTURAR A INFORMAO COM BASES SLIDAS


DINAMIZAR O RELACONAMENTO HOMEM-MQUINA

MELHOR QUALIDADE DE REVOCAO E PRECISO

CONCLUSO

UTILIZAR O VASTO REPOSITRIO DE INFORMAES DISPONVEL DA WEB DE MANEIRA MAIS PRODUTIVA, GIL E SIGNIFICATIVA.

PROPORCIONAR AO INDIVDUO TUDO DE FORMA ORDENADA, MINIMIZANDO A QUANTIDADE DE BUSCA.

RECONHECIMENTO DE PADRES

O Reconhecimento de Padres um subtpico da Aprendizagem de Mquina, a qual, por sua vez, um subcampo da Inteligncia Artificial. A Aprendizagem de Mquina tem por funo desenvolver algoritmos e tcnicas que permitam a um computador aprender, ou seja, melhorar o seu desempenho em determinada tarefa. Um padro pode ser considerado como um conjunto de caractersticas semelhantes. Ele tambm pode ser a descrio de um problema recorrente para o qual existe uma soluo que pode ser reutilizada diversas vezes em situaes diferentes

A HISTRIA

O termo "reconhecimento de padres" surgiu no incio da dcada de 60 e no principio significava a "deteco de formas simples" . Uma definio interessante foi em 1973 por Duda e Hart. "Reconhecimento de padres um campo interessado no reconhecimento por mquinas de regularidades significativas em ambientes ruidosos ou complexos", ou a procura por uma estrutura nos dados. Enquanto alguns padres podem ser identificados como bem estruturados ou, ao menos, estruturados adequadamente outros dados podem ser de difcil identificao / classificao. Por este motivo o reconhecimento de padres , muitas vezes, chamado de "cincia no exata".

PARA QUE RECONHECER PADRES?

A Inteligncia Artificial utiliza-se do Reconhecimento de Padres para analisar determinado conjunto de dados (conjunto de treinamento) e organiz-los de acordo com padres. O reconhecimento de padres visa classificar dados baseados em conhecimento a priori (preliminar ou dedutivo) ou informaes estatsticas extradas de padres. Estes padres a serem classificados normalmente so grupos de medidas ou observaes que definem pontos em um espao multidimensional apropriado. Antes de partir para a anlise efetiva, uma etapa de treinamento realizada: nela o algoritmo de reconhecimento testado para que seja possvel saber se ele encontra os resultados esperados.

TIPOS DE RECONHECIMENTO DE PADRES

Supervisionado: O reconhecimento supervisionado utiliza o conjunto de treinamento para classificar os dados obtidos de acordo com as categorias j existentes e nelas organiz-los.

No Supervisionado: o reconhecimento no supervisionado utiliza o conjunto de treinamento para criar novas categorias, ao invs de simplesmente separar os dados de acordo com as categorias j existentes.

EXEMPLOS DE REAS QUE APLICAM


RECONHECIMENTO DE PADRES

Comunicao homem-mquina: reconhecimento automtico de fala, reconhecimento da escrita / (Optical Character Rocognition - OCR), compreenso de fala, compreenso de imagens, processamento da linguagem natural; Defesa: reconhecimento automtico de alvos, orientao e controle; Medicina: diagnstico mdico, anlise de imagens, classificao de doenas; Veculos: controladores de automveis, avies, trens, barcos; Polcia e investigao: deteco criminal a partir da fala, escrita manual, impresses digitais, fotografias;

Estudo e estimativa de recursos naturais: agricultura, extrativismo, geologia, ambiente; Indstria: CAD, CAM, teste e montagem de produtos, controle e inspeo de qualidade; Sistemas domsticos: utenslios inteligentes; Bio-informtica: anlise de seqncias do genoma; Classificao de documentos da Internet; Reconhecimento biomtrico, incluindo faces, ris ou impresses digitais;

REFERNCIAS
RAMALHO, Rogrio Aparecido S. Web Semntica: aspectos interdisciplinares da gesto de recursos informacionais no mbito da Cincia da Informao; The New York Time, Museu belga revela a internet de papel do incio do sculo 20; OLIVEIRA, Rosa Maria Vivona Bertolini. Web Semntica: Novo desafio para os profissionais da informao; http://www.abranet.org.br/historiadainternet/ocomeco.htm Bogo, Kellen Cristina. A Histria da Internet