Professional Documents
Culture Documents
FORTALEZA
2015
i
Dissertao submetida
Coordenao do Curso de Mestrado
Profissional em Computao Aplicada da
Universidade Estadual do Cear e do
Instituto Federal de Educao, Cincia e
Tecnologia do Cear, como requisito
parcial para a obteno do grau de Mestre
em Computao Aplicada.
FORTALEZA
2015
ii
(MODELO)
Dados Internacionais de Catalogao na Publicao
Universidade Estadual do Cear
Biblioteca Central Prof. Antnio Martins Filho
CDD: 001.64
iii
Dissertao submetida
Coordenao do Curso de Mestrado
Profissional em Computao Aplicada da
Universidade Estadual do Cear e do
Instituto Federal de Educao, Cincia e
Tecnologia do Cear, como requisito
parcial para a obteno do grau de Mestre
em Computao Aplicada.
Orientador: Prof. Dr. Antnio Mauro
Barbosa de Oliveira.
BANCA EXAMINADORA
__________________________________________________
Prof. Dr. Antnio Mauro Barbosa de Oliveira (IFCE)
Presidente (Orientador)
__________________________________________________
Prof. Dr. Marcos Jos Negreiros Gomes (UECE)
1 Membro Interno
__________________________________________________
Prof. Dr. Anilton Salles Garcia (UFES)
2 Membro Interno
__________________________________________________
Prof. Dr. Luiz Odorico Monteiro de Andrade (UFC)
Membro Externo
iv
AGRADECIMENTOS
minha Tia Antonilda e V Regina, que me tornaram a pessoa que sou hoje.
Ao meu pai, Jorge, que nunca deixou de acreditar no meu sucesso.
Ao meu esposo, Thiago, por toda a pacincia, amor e dedicao.
Ao meu orientador, Prof. Dr. Mauro Oliveira, por nunca duvidar do meu
trabalho e por ser hoje o meu espelho profissional e pessoal.
Ao Prof. Dr. Anilton Garcia, pelas orientaes e disponibilidade, sempre.
Deus, pelos belssimos planos traados para a minha vida.
todos os meus familiares e amigos, em especial aos amigos feitos no
MPCOMP, Evandro, Pablo e Reivel, pelo apoio e unio.
E toda equipe MPCOMP.
vi
RESUMO
ABSTRACTS
The use of information and communication technologies (ICT's) applied to health has
been rising in recent decades, primarily by enabling better management of
knowledge and interpretation of the integrated information, fundamental functions to
support decision-making. To meet this trend stands out the LARIISA, an intelligent
platform that aims to assist decision making in the area of health, using concepts of
context-aware, ontologies and intelligences of health governance to support the
realization of the inference by the system. In order to enlarge the power of LARIISA
inference is necessary to enrich the knowledge base of the framework, which can be
achieved through the integration of existing health-related data. In this way, this work
presents a specification of the data integration process for the LARIISA, which will
allow the platform to create a richer knowledge base, which will result in making
inferences more efficient, because the proposed specification considers data from
heterogeneous sources, independent and distributed, such as data from the systems
maintained by the Ministry of health, or by other spheres of Government. The present
work also results in an architecture that is able to guide the development of
applications for the LARIISA that will consider the use of integrated data. The results
of this work are obtained through the use of linked data concepts (Linked Data) and
ontologies, which stand out in the context of the Semantic Web.
Key words: Ontology; Semantic Web; Linked Data; Data Integration; Health
Systems; LARIISA
ix
LISTA DE FIGURAS
LISTA DE TABELAS
LISTA DE LISTAGENS
ANVISA! Agncia!Nacional!de!Vigilncia!Sanitria!
APAC! Autorizao!de!Procedimentos!Ambulatoriais!
API! Application*Programming*Interface*
ARiDa! Advanced*Research*in*Database*
CNES! Cadastro!Nacional!de!Estabelecimentos!de!Sade!
CSV! Comma:Separated*Values*
DATASUS! Departamento!de!Informtica!do!Sistema!nico!de!Sade!
EHR! Electronic*Health*Record*
ETL! Extract,*Transform,*Load*
FUNCEME! Fundao!Cearense!de!Meteorologia!e!Recursos!Hdricos!
HTML! HyperText*Markup*Language*
HTTP! HypeText*Transfer*Protocol*
IDH! ndice!de!Desenvolvimento!Humano!
KTA! Knowledge:To:Action*
LARIISA! Laboratrio!de!Redes!Inteligentes!e!Integradas!de!Sade!
LIDMS! Linked*Data*Mashup*Services**
OLAP! On:line*Analytical*Processing*
OMS! Organizao!Mundial!da!Sade!
OQL! Object*Query*Language*
OWL! Web*Ontology*Language*
PEP! Pronturio!Eletrnico!do!Paciente!!
PNI! Programa!Nacional!de!Imunizaes!
PNUD! Programa!das!Naes!Unidas!para!o!Desenvolvimento!
QEFULD! Query*Evaluation*Framework*:*Linked*Data*
RDF! Resource*Description*Framework*
RDFS! Resource*Description*Framework*Schema*
SCNS! Sistema!do!Carto!Nacional!de!Sade!
xiv
SGBD! Sistema!de!Gerenciamento!de!Banco!de!Dados!
SIA! Sistema!de!Informaes!Ambulatoriais!
SIAB! Sistema!de!Informao!da!Ateno!Bsica!
SIH! Sistema!de!Internaes!Hospitalares!
SIM! Sistema!de!Informaes!de!Mortalidade!
SIMDA! Sistema!de!Monitoramanto!Dirio!de!Agravos!
SINAC! Sistema!de!Informaes!de!Nascidos!Vivos!
SINAN! Sistema!de!Informao!de!Agravos!de!Notificao!
SIS! Sistemas!de!Informao!de!Sade!
SISA! Sistema(de(Sade(AdaptadoUaoUcontexto'de'Gesto'de'Sade'!
SOA! Service:Oriented*Architecture*
SOAP! Simple*Object*Access*Protocol*
SPARQL! Sparql*Protocol*And*RDF*Query*Language*
SQL! Structured*Query*Language*
SUS! Sistema!nico!de!Sade!
UDDI! Universal*Description,*Discovery*and*Integration*
UFC! Universidade!Federal!do!Cear!
UFRN! Universidade!Federal!do!Rio!Grande!do!Norte!
UNICEF! United*Nations*Children's*Fund**
URI! Uniform*Resource*Identifier*
WSDL! Web*Services*Description*Language*
XML! eXtensible*Markup*Language*
!!
xv
SUMRIO
2.2.1.! Classificao das Ontologias Baseado na Granularidade que Representam .... 35!
3.2.! Integrao de Dados de Sade Baseada na Utilizao de Web Services .............. 45!
3.3.! Integrao de Dados de Sade Baseada na Abordagem de Data Warehouse ...... 46!
1. INTRODUO
1
Inseticida pulverizado em ultra baixo volume
2
http://dbpedia.org/sparql
3
environment.data.gov.uk/lab/sparql.html
21
1.2 Objetivos
1.3 Contribuies
2. FUNDAMENTAO TERICA
2.1. LARIISA
O LARIISA foi concebido para ser um sistema capaz de auxiliar na tomada de
deciso em sade a partir da inferncia de informaes obtidas de aplicaes que
interagem com o usurio. Essas aplicaes devem ser desenvolvidas considerando
a obteno de dados de contexto, enriquecendo o poder de inferncia do sistema.
Inicialmente concebido para ter como principal provedor de contexto
softwares desenvolvidos para a TV Digital Brasileira, suportando aplicaes de tele
monitoramento, procedimentos mdicos remotos, etc., trabalhos seguintes
comprovaram que a plataforma LARIISA teria inmeras outras possibilidades de
obter esses dados contextuais.
A exploso dos dispositivos e da Internet mveis cria um ambiente perfeito
para novos provedores de contexto, alm da TV Digital Brasileira anteriormente
definida na plataforma. Os smartphones, com seus sensores j embutidos, podem
ser utilizados para coleta e envio de informaes sobre as condies de sade de
27
Context Provider
possvel observar, atravs da Figura 2, que o conceito de ontologias j era
O CP, ou Provedor de Contexto, o responsvel pela coleta de dados brutos
considerado na arquitetura do LARIISA, mas nunca foi explorado no contexto da
com contexto de um ambiente. Contexto de sensores mveis (ex: dispositivo mvel
integrao de dados, alm da representao por ontologias do conceito de
de agente de sade) e residncias de famlias (usando set-top-box), podem ser
informaes contextuais de sade. Vale destacar aqui o componente da arquitetura
enviados ao CA (ver a seguir). Esses sensores podem estar fisicamente conectados
relacionado com o conceito de ontologias:
ao set-top-box da TV Digital ou podem estabelecer uma conexo externa (ex:
atravs de WiMAX, GSM/GPRS/3G ou similares) com o sistema para transmitir
dados recuperados do contexto. O projeto Lariisa utiliza o Diga Sade para
recuperar sinais vitais do usurio final, atravs da integrao de sensores com o set-
31
2.2. Ontologias
Na cincia da computao, define-se as ontologias simplesmente como um
processo formal para representar conhecimento. As ontologias nomeiam e definem
tipos, propriedades e relacionamentos de entidades em um domnio especfico.
Considera-se as entidades como conceitualizaes desse domnio.
As ontologias foram desenvolvidas dentro do contexto de Inteligncia Artificial
para facilitar o compartilhamento de conhecimento e seu reuso. Desde ento o
estudo de ontologias vem sendo aplicado em diversos outros campos de estudo
como gerncia de compartilhamento, comrcio eletrnico, recuperao de
35
aos contedos publicados na Internet de modo que seja perceptvel tanto pelo
humano quanto pelo computador.
Neste sentido, diversas ss as tecnologias necessrias para possibilitar que
as mquinas passem a entender o significado das coisas. As ontologias, descritas
na seo anterior, uma delas, possibilitando definir conceitos e relaes
relacionados uma rea de conhecimento especfico.
J o conceito de Linked Data considerado o corao da Web Semntica,
permitindo integrao de dados em larga escala na Web. Mais especificamente,
pode-se definir Linked Data como um termo utilizado para descrever as melhores
prticas para expor, compartilhar e conectar pedaos de dados, informao e
conhecimento na Web, utilizando URIs e Resource Description Framework (RDF).
O RDF a base para a publicao e linkagem de dados. O RDF prov uma
linguagem para modelagem de dados baseado na ideia de construir asseres
sobre recursos na forma de tuplas, sujeito-predicado-objeto. Com isso, todos os
dados da Web Semntica estariam sobre o padro RDF. Para consultar esses
dados em RDF, utiliza-se como ferramenta a linguagem de consulta SPARQL.
2.5. RDF
RDF foi originalmente criado em 1999 pelo W3C como um padro para
codificao de metadados. Com o advento da Web Semntica, em 2004 o W3C
lanou uma nova especificao do RDF ampliando seu significando, passando a
representar qualquer recurso e suas relaes existentes no mundo real.
A ideia bsica do RDF usar um modelo abstrato para decompor
informao/conhecimento em pequenos pedaos, com algumas regras simples
sobre o significado de cada pedao desse, sendo um mtodo simples e flexvel para
representar qualquer fato, no deixando de ser estruturado para que aplicaes
consigam operar esse conhecimento (Yu, 2011).
Esse modelo abstrato possui os seguintes componentes principais: (i)
Assertiva; (ii) Sujeitos e objetos; (iii) predicado. As assertivas podem ser expressas
pela forma Sujeito-Predicado-Objeto, sempre nessa ordem, onde o sujeito e o objeto
so coisas do mundo real, e o predicado o nome de uma relao que conecta
essas duas coisas. Uma assertiva pode ser representada pela estrutura de um grafo,
como representado na Figura 6.
26 2 The Building Block for the Semantic Web: RDF
2.6. SPARQL
SPARQL a linguagem padro da Web Semntica para recuperao de
informaes contidas em grafos RDF, sendo no s uma linguagem de consulta,
mas tambm um protocolo usado para enviar consultas e recuperar resultados
atravs do protocolo HTTP.
SPARQL provides four different forms of query:
SELECT query
ASK query
DESCRIBE query
CONSTRUCT query 40
Among these forms, SELECT query is the most frequently used query form. In
SPARQL addition,
prov quatro
all these diferentes formas
query forms are detwo
based on consulta: (i) SELECT
basic SPARQL query; (ii)
concepts: triple
ASK query; (iii) pattern
DESCRIBEand graphquery;
pattern. Let us understand
e (iv) CONSTRUCT these two concepts
query. first beforeas
Todas weformas
start de
to look at SPARQL queries.
consulta so baseadas em padro de triplas e padro de grafos.
6.3.1.1 Triple Pattern
Assim como o conceito de tripla do RDF, o padro de triplas no SPARQL
As we have learned, RDF model is built on the concept of triple, a three-tuple struc-
segue o mesmo ture
princpio. A ofdiferena
consisting que and
subject, predicate, no object.
padro de triplas
Likewise, do SPARQL
SPARQL is built uponpodem
the concept of triple pattern, which is also written as subject, predicate, and object,
ser inseridas variveis.
and has to Qualquer
be terminatedum
withou todos
a full stop. de
The uma vezbetween
difference s, sujeito, predicado
RDF triple and e
SPARQL triple pattern is that a SPARQL triple pattern can include variables: any or
objeto, podem ser variveis em um padro de tripla SPARQL, que so identificadas
all of the subject, predicate, and object values in a triple pattern can be a variable.
pelo caractere ? Clearly, an RDF
procedido detriple
umisnome
also a SPARQL triple pattern.
de varivel.
The second line in the following example is a SPARQL triple pattern (note that
the Turtle syntax is used here):
@prefix foaf: <http://xmlns.com/foaf/0.1/>.
<http://danbri.org/foaf.rdf#danbri> foaf:name ?name.
ache o valor da propriedade foaf:name definido por um recurso RDF identificado por
http:// danbri.org/foaf.rdf#danbri.
O conceito de padro de grafo SPARQL similar ao padro de triplas visto.
Um grafo SPARQL um conjunto de padres de triplas delimitadas por { e }
utilizadas para selecionar recursos de um dado grafo RDF. Da mesma forma que as
variveis podem se fazer presentes nos padres de triplas SPARQL, elas tambm
podem aparecer nos 6.3 SPARQL
grafos Query Language
SPARQL. 251
Nesse caso, cabe observar que se uma
varivel aparece em mltiplas triplas
First off, SPARQL,
a collection of tripleseus valores
patterns is calleddevero ser os
a graph pattern. mesmos{
In SPARQL,
and } are used to specify a collection of triple patterns. For example, the following
em todas elas. three triple patterns present one graph pattern:
{
?who foaf:name ?name.
?who foaf:interest ?interest.
?who foaf:knows ?others.
}
To understand
Figura 10: Exemplo how graph
de uma padro patternSPARQL.
de grafo is used toFonte:
select resources
(Yu, 2011)from a given RDF
graph, we need to remember one key point about the graph pattern: if a given vari-
O padro de grafo able shows up in multiplena
apresentado tripleFigura
patterns 10,
withintenta
the graph pattern, its qualquer
encontrar value in all
these patterns has to be the same. In other words, each resource returned must be
recurso RDF que possui todas
able as 3 propriedades
to substitute into all occurrences definidas (foaf:name,
of the variable. foaf:interest e
More specifically,
# list of prefixes
PREFIX pref: <URI>
...
6.3 SPARQL Query Language 253
# result description
that the WHERE SELECT...
clause is not optional, although the WHERE keyword itself is optional.
However, for clarity and readability, it is a good idea not to omit WHERE.
The last part
# is generally
graph called query modifiers. The main purpose is to tell
to search
the SPARQL endpoint how to organize the query results. For instance, ORDER
FROM . . .
BY clause and LIMIT clause are examples of query modifiers. Obviously, query
# query pattern
modifiers are also optional.
WHERE {
...
6.3.2.2 Writing}
Basic SELECT Query
As we have discussed, our queries will be issued against Dan Brickleys FOAF
# query modifiers
document. And our first query will accomplish the following: since FOAF ontology
ORDER BY...
has defined a group of properties that one can use to describe a person, it would be
interesting to see which of these properties are actually used by Brickley.
a BASEList 6.3 and a list of
Figura 11: Estrutura As de shown in List
uma SELECT 6.2, a SELECT
Query. query
Fonte: (Yu,starts
2011) with directive
shows the query: PREFIX definitions which may contain an arbitrary number of PREFIX statements.
These two parts are optional and they are used for URI abbreviations. For example,
List 6.3 What FOAF properties did Dan Brickley use to describe himself?
if you assign a label pref to a given URI, then the label can be used anywhere in
1: base <http://danbri.org/foaf.rdf>
a query in place of the URI itself. Also note that pref is simply a label, we can
2: prefix foaf: name it<http://xmlns.com/foaf/0.1/>
anyway we want. This is all quite similar to Turtle language abbreviation
3: select *we have discussed in Chap. 2, and we will see more details about these two parts in
the upcoming query examples.
4: from <http://danbri.org/foaf.rdf>
5: where The SELECT clause comes next. It specifies which variable bindings, or data
6: { items, should be returned from the query. As a result, it picks up what information
7: <#danbri> to return from the query
?property ?value.result.
8: } The FROM clause tells the SPARQL endpoint against which graph the search
should be conducted. As you will see later, this is also an optional item in some
Since this is our first query, let us study it in greater detail. First off, note that
Figura 12: Exemplo cases,
dethere is no need
Consulta to specify the dataset that is being queried against.
SPARQL is not case sensitive, soSPARQL. Fonte:
all the keywords (Yu,be2011)
can either in small letters or
The WHERE clause contains the graph patterns that specify the desired results;
in capital letters.
it tells the SPARQL endpoint what to query for in the underlying data graph. Note
Now, lines 1 and 2 are there for abbreviation purpose. Line 1 uses BASE keyword
to define a base URI against which all relative URIs in the query will be resolved,
including the URIs defined with PREFIX keyword. In this query, PREFIX keyword
specifies that foaf will be the shortcut for an absolute URI (line 2), so the URI
foaf stands for does not have to be resolved against the BASE URI.
Line 3 specifies which data items should be returned by the query. Note that only
variables in the graph pattern (line 68) can be chosen as returned data items. In this
example, we would like to return both the property names and their values, so we
should have written the SELECT clause like this:
select ?property ?value
Since ?property and ?value are the only two variables in the graph pattern,
we do not have to specify them one by one as shown above, we can simply use a
42
2
http://dbpedia.org/sparql
3
environment.data.gov.uk/lab/sparql.html
43
3. TRABALHOS RELACIONADOS
Este captulo tem como objetivo mostrar trabalhos encontrados que focaram
na problemtica da integrao de dados de sade pblica, principalmente no Brasil.
Esses trabalhos resolvem a questo utilizando solues distintas: (i) Integrao de
dados de sade baseada na criao de um novo esquema de dados; (ii) Integrao
de dados de sade baseada na utilizao de Web Services; (iii) Integrao de dados
de sade baseada na abordagem de Data Warehouse; (iv) Integrao de dados de
sade baseada em ontologias. Espera-se com esse estudo, obter subsdios para a
formulao de contribuies relevantes para esta dissertao analisando a
desvantagens de cada abordagem.
4
http://integrador.datasus.gov.br/INTEGRADOR/index.php
44
Figura 13: Arquitetura do Ambiente Computacional do MINERSUS. Fonte: (Santos and Gutierrez,
2008)
5
Protg um editor de ontologies open-source e um framework para manipulao de bases
de conhecimento. Acessvel atravs de http://protege.stanford.edu
49
4. PERCURSO METODOLGICO
4.1. Introduo
Figura 14: Abordagens gerais de integrao em diferentes nveis de arquitetura. Fonte: (Ziegler and
Dittrich, 2007)
ALONSO et al. (2004) conceitua Web Services como uma forma de expor as
funcionalidades de um sistema de informao, fazendo-o disponvel atravs de
padres Web. O uso de padres a chave para a interoperabilidade,
consequentemente facilita a integrao de sistemas. Tais padres so: (i) dados so
trocados entre sistemas utilizando o padro XML; (II) SOAP usado para enviar e
receber documentos XML; (iii) Servios de integrao so especificados utilizando
WSDL; (iv) Um registro de todos os servios publicado utilizando UDDI. Na Figura
15 a seguir, apresentada a arquitetura dos Web Services.
Apesar da frequente utilizao de Web Services na integrao de sistemas no
domnio da sade e das vantagens na utilizao de Web Services como tecnologia
de integrao, h tambm desvantagens, que para as caractersticas de integrao
exigidas pelo LARIISA, podem no ser interessantes. Dentre elas cabe destacar:
Dependncia do provedor de servios: o principal objetivo de se integrar
dados heterogneos ao LARIISA, dar maiores subsdios ao processo de
inferncia da plataforma. Quanto mais acesso a dados o LARIISA possuir,
melhor poder ser a inferncia realizada. A limitao do uso de Web Services,
nesse sentido, que os clientes do servio apenas obtm acesso aquilo que
o provedor do servio pode oferecer. Muito diferente de quando se obtm
dados brutos para integrao, como acontece com outras abordagens. Caso
55
dados de uma determinada fonte de dados. Por exemplo, uma fonte de dados do
SUS pode oferecer como nico mtodo de obteno de dados um Web Service.
Nesse caso, o LARIISA utiliza esse Web Service de terceiro apenas para captar
dados e realiza a integrao de dados com outras abordagens.
Figura 16: Arquitetura bsica de um sistema de propsito geral de integrao de dados. Fonte:
Adaptado de Doan et al. (2012).
para receber as consultas dos usurios (ou aplicaes) empregadas para o sistema
de dados integrados.
Os descritores das fontes de dados (ou transformaes na abordagem
materializada) podem ser considerados os principais elementos da arquitetura de
dados integrados. Eles conectam o esquema mediador aos esquemas de fontes de
dados. Esses descritores especificam as propriedades das fontes que o sistema
precisa saber em ordem para usar esses dados. Os principais elementos desses
descritores so os mapeamentos semnticos realizados entre os dicionrios de
dados das fonte de dados e do esquema mediador.
O processamento de consultas em um sistema integrado de dados difere de
um banco de dados tradicional de duas maneiras: primeiro as consultas que chegam
ao esquema mediador precisam ser reformuladas para que cheguem as fontes de
dados; segundo, a execuo das consultas precisa estar preparada para se adaptar,
j que o plano de execuo da consulta pode mudar medida que a consulta est
sendo executada. A Figura 17 ilustra o processo de consultas em um sistema
integrado de dados.
Figura 18: Processo de Integrao por Criao de um esquema nico de dados. Fonte: Criao do
autor.
60
Figura 19: Componentes Lgicos de um Data Warehouse. Fonte: Adaptado de Doan et al. (2012).
considerado um mtodo muito custoso uma vez que elimina todo o repositrio
e cria um novo;
Manuteno incremental: as alteraes nas fontes de dados so
propagadas incrementalmente para o data warehouse (Batista, 2003).
Figura 20: Arquitetura de Integrao de Dados Baseada em Mediadores. Fonte: (Batista, 2003)
Figura 21: Abordagem de descrio semntica por ontologia nica. Fonte: Adaptado de (Wache et
al.,2001)
65
Figura 22: Abordagem de descrio semntica por mltiplas ontologias. Fonte: Adaptado de (Wache
et al., 2001)
Figura 23: Abordagem hbrida de descrio semntica baseada em ontologias. Fonte: Adaptado de
(Wache et al., 2001)
6
http://lattes.cnpq.br/9431229866203038
7
http://lattes.cnpq.br/9428387943972577
68
Figura 24: Possibilidades de Integrao de fontes abertas no domnio de sade. Fonte: (Roberval,
2012)
A partir dessa nova tica, das possibilidades que o Linked Data apresenta,
essa tecnologia em conjunto com uma abordagem baseada em
69
so na sua maioria banco de dados relacional e planilhas, mas que podem ser de
qualquer tipo, inclusive fontes de dados j no padro Linked Data. Em caso de
fontes de dados que no estejam no padro Linked Data, preciso que exista um
wrapper especfico que traduza esses dados para RDF.
O repositrio RDF representa as ontologias fonte da arquitetura de 3 nveis
apresentada. Ele pode ser referente a dados originalmente j no padro Linked Data
ou ser resultado da traduo de um tipo de fonte para RDF. Existem wrappers que
traduzem um tipo de fonte para RDF on-the-fly, ou seja, os dados so convertidos
apenas quando solicitados, eliminando a necessidade de replicar os dados em um
repositrio RDF dedicado.
A ontologia de domnio descreve conceitualmente o LARIISA e as consultas
direcionadas ao sistema so todas em funo do vocabulrio definido. Criar uma
representao conceitual completa do LARIISA uma tarefa bastante complexa,
isso porque o LARIISA foi pensado para ser uma plataforma totalmente escalvel,
onde os dados vo sendo integrados de acordo com a necessidade. Sendo assim,
como apresentado na Figura 26, considera-se que a ontologia de domnio do
LARIISA construda considerando uma abordagem de subdomnios, isto , a
ontologia de domnio LARIISA definida por sub-ontologias que respondero a
questes especficas.
As ontologias de aplicao, como j mencionado, descrevem as fontes RDF
em funo do vocabulrio da ontologia do LARIISA.
Figura 27: Passo a passo do processo proposto de integrao de dados para o LARIISA. Fonte:
Elaborao prpria
8
http://www.w3.org/wiki/ConverterToRdf
76
Figura 28: Arquitetura que define a relao entre a aplicao, o esquema mediado de dados e as
fontes de dados RDF. Criao do autor.
78
9
http://tc1.sms.fortaleza.ce.gov.br/simda/dengue/mes
10
http://www.fortaleza.ce.gov.br/regionais
81
11
http://www.funceme.br/index.php/areas/tempo/chuvas-diarias-municipios
12
http://www.telessaude.ufrn.br/observatoriodadengue/
82
Figura 31: Dados obtidos do SIMDA, referente ao nmero de casos de dengue registrados por ano,
por ms, por bairro, em formato de planilha. Criao do autor.
# mapping
{ [] a xl:Mapping ;
xl:offline "false"^^xsd:boolean ;
xl:template [
xl:fileName "mappings/files/casos-de-dengue.xls" ;
xl:sheetNumber "0" ;
xl:templateGraph :CasosDengue ;
xl:transform [
a rdf:Seq ;
rdf:_1 [
a xl:RowShift ;
xl:restriction "A2; B2:M2" ;
xl:breakCondition "A2 == 'TOTAL'" ;
xl:steps "1" ;
];
rdf:_2 [
a xl:ColShift ;
xl:restriction "B1; B2:B120"^^xl:Expr ;
xl:breakCondition "B1 == 'TOTAL'" ;
xl:steps "1" ;
];
rdf:_3 [
a xl:SheetShift ;
xl:restriction "#1.*"^^xl:Expr ;
xl:repeat "2"
];
]
].
}
:CasosDengue {
[ xl:uri "'http://example.org/casosDengue_' & URLENCODE(SHEETNAME(A1) & '_' & B1 & '_' &
A2)"^^xl:Expr ] a ex:CasosDengue ;
ex:bairro "URI('http://pt.dbpedia.org/page/' & A2)"^^xl:Expr ;
ex:year "DBP_YEAR(SHEETNAME(A1))"^^xl:Expr ;
ex:mes "B1"^^xl:Expr ;
ex:casosDengue "B2"^^xl:Expr .
}
OF#SIMDA##OA#SIMDA#
Classes:!
sim_oa:Dengue(d) 1simda:CasosDengue(d)1
sim_oa:Bairro(b)11simda:Bairro(b)1
sim_oa:Ano(a)11simda:Ano(a)1
sim_oa:Mes(m)11simda:Mes(m)1
Propriedades:!
sim_oa:mesDengue(d,1m)11simda:mes(d,m)1
sim_oa:anoDengue(d,a)11simda:ano(d,a)1
sim_oa:eRegistradoDengueNoBairro(d,b)11simda:bairro(d,b)1
OF!FUNCEME!!OA!FUNCEME!
Classes:!
fcm_oa:Precipitacao(p)11funceme:RegistroChuva(p)1
fcm_oa:Bairro(b)11funceme:Bairro(b)1
fcm_oa:Ano(a)11funceme:Ano(a)1
fcm_oa:Mes(m)11funceme:Mes(m)1
Propriedades:!
fcm_oa:mesDengue(p,m)1funceme:mes(p,m)1
fcm_oa:anoDengue(p,a)1funceme:ano(p,a)1
fcm_oa:eMedidaPrecipitacaoNo(p,b)1funceme:bairro(p,b)1
OF!BAIRRO!!OA!BAIRRO!
Classes:!
b_oa:DensidadeDemografica(dd)1bairro:1DensidadeDemografica(dd)1
b_oa:IDH(i)1bairro:IDH(i)1
b_oa:Bairro(b)1bairro:Bairro(b)1
Propriedades!
87
b_oa:eMedidoIDHno(b,i)1bairro:idh(b,i)1
b_oa:eMedidaDensidadeNo(b,dd)1bairro:densidadeDemografica(b,dd)1
OF!FOCODENGUE!!OA!FOCODENGUE!
Classes!
fd_oa:FocoAguaParada(fd)1focos:FocoDengue(fd)1
fd_oa:Bairro(b)1focos:Bairro(b)1
fd_oa:Mes(m)1focos:Mes(m)1
fd_oa:Ano(a)1focos:Ano(a)1
Propriedades!
fd_oa:mesFoco(fd,m)11focos:mes(fd,m)1
fd_oa:anoFoco(fd,a)11focos:ano(fd,a)1
fd_oa:eMedidoFocoNo(fd,b)11focos:bairro(fd,b)1
Tabela 1: Exemplo de Mapeamentos Locais
13
https://jena.apache.org/
14
http://rdf4j.org
89
Figura 34: rvore de consulta gerada ao submeter a consulta da Tabela 3 ao processo de traduo.
Figura 35: rvore reformulada aps a etapa de reformulao de consulta. Cada operador Service
contm sub consultas sobre as ontologias de aplicao.
15
Query Engine do framework Jena que suporta a linguagem de consulta RDF, SPARQL
91
6. ANLISES E RESULTADOS
Este captulo apresenta algumas anlises e resultados provenientes da
proposio deste processo de integrao de dados ao LARIISA.
6.1. Introduo
Aps ter finalizado este trabalho, pode-se afirmar que ele ser de grande
contribuio para o projeto LARIISA como um todo. Os conceitos de Web Semntica
e Linked Data j haviam sido questionados a integrar a arquitetura do LARIISA, em
documentos que descreviam futuros problemas e teses a serem abordadas no
projeto, mas at o momento no tinham tido a chance de serem explorados com a
importncia que o assunto merecia.
Com absoluta certeza, a insero desses novos conceitos ao LARIISA faro o
projeto entrar numa nova fase. Como destacado no Captulo 2, a grande maioria dos
trabalhos desenvolvidos no contexto do LARIISA focaram em aplicaes que
captavam informaes de contexto e as entregavam plataforma para realizao de
inferncia. Este trabalho alicerado na inteligncia que a plataforma pode entregar
ao gestor de sade, a partir de uma base de conhecimento criada da integrao de
dados de sade ou relacionados, sejam dados provindos de aplicaes
desenvolvidas a partir do LARIISA, sejam dados provindos de sistemas de
informao de sade j existentes.
Este trabalho tambm se mostra importante por reafirmar a importncia das
ontologias na arquitetura do LARIISA. Antes j importantes por representar as
informaes de contexto, e agora tecnologia essencial para promover a integrao
de dados que a plataforma necessita, e consequentemente enriquecendo a base de
conhecimento do LARIISA.
Outra grande relevncia do trabalho a independncia que se proporciona ao
LARIISA dos dados que podem compor a sua base de conhecimento. Pode-se
afirmar que quaisquer dados/informaes, que estejam dispostas na Web, em forma
de planilhas, arquivos de texto ou qualquer outro formato; que estejam dispostos em
sistemas diretamente ligados sade pblica ou no diretamente ligados sade
pblica; que estejam dispostos em bases de dados relacionais ou no, ou seja,
qualquer informao, pode compor a base de conhecimento do LARIISA.
Isso fica bem mais claro quando se avalia o cenrio da contribuio que o
projeto sempre quis entregar sade pblica. A burocracia e o custo que se teria de
94
REFERNCIAS
ALCNTARA, T. P. D. A. PAOLA: UMA PLATAFORMA PARA O
DESENVOLVIMENTO DE APLICAES BASEADAS EM ONTOLOGIAS PARA O
PROJETO LARIISA. [s.l.] UNIVERSIDADE ESTADUAL DO CEAR, 2012.
BAUER, F.; KALTENBCK, M. Linked Open Data!: The Essentials. [s.l: s.n.].
BERNERS-LEE, T.; HEATH, T.; BIZER, C. Linked Data - The Story So Far.
International Journal on Semantic Web and Information Systems, v. 5, n. 3, p.
122, 2009.
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web - A new form of
Web content that is meaningful to computers will unleash a revolution of new
possibilities. Scientific American, 2001.
DOAN, A.; HALEVY, A.; IVES, Z. Principles of Data Integration. [s.l: s.n.]. p. 497
FLORESCU, D.; LEVY, A.; MENDELZON, A. Database techniques for the World-
Wide Web: A Survey. ACM SIGMOD Record, v. 27, n. 3, p. 5974, 1 set. 1998.
GRAHAM, I. D. et al. Lost in knowledge translation: time for a map? The Journal of
continuing education in the health professions, v. 26, n. 1, p. 1324, jan. 2006.
HYRINEN, K.; SARANTO, K.; NYKNEN, P. Definition, structure, content, use and
impacts of electronic health records: a review of the research literature. International
journal of medical informatics, v. 77, n. 5, p. 291304, maio 2008.
HEATH, T.; BIZER, C. Linked Data: Evolving the Web into a Global Data Space.
1st editio ed. [s.l.] Morgan & Claypool, 2011. p. 136
YU, L. A Developers Guide to the Semantic Web. Springer ed. [s.l: s.n.].