You are on page 1of 104

UNIVERSIDADE ESTADUAL DO CEAR

CENTRO DE CINCIAS TECNOLGICAS - CCT

INSTITUTO FEDERAL DE EDUCAO,


CINCIA E TECNOLOGIA DO CEAR
PR-REITORIA DE PS-GRADUAO - PROPG

MESTRADO PROFISSIONAL EM COMPUTAO APLICADA

ODARA SENA DOS SANTOS FEITOSA

UM PROCESSO DE INTEGRAO DE DADOS PARA UM SISTEMA


INTELIGENTE DE SADE

FORTALEZA

2015
i

ODARA SENA DOS SANTOS FEITOSA

UM PROCESSO DE INTEGRAO DE DADOS PARA UM SISTEMA


INTELIGENTE DE SADE

Dissertao submetida
Coordenao do Curso de Mestrado
Profissional em Computao Aplicada da
Universidade Estadual do Cear e do
Instituto Federal de Educao, Cincia e
Tecnologia do Cear, como requisito
parcial para a obteno do grau de Mestre
em Computao Aplicada.

Orientador: Prof. Dr. Antnio Mauro


Barbosa de Oliveira.

FORTALEZA

2015
ii

(MODELO)
Dados Internacionais de Catalogao na Publicao
Universidade Estadual do Cear
Biblioteca Central Prof. Antnio Martins Filho

C999m Feitosa, Odara Sena dos Santos


Um Processo de Integrao de Dados para um
Sistema Inteligente de Sade / Odara Sena dos Santos
Feitosa - 2015.
99f. : il. color., enc. ; 30cm.

Dissertao (mestrado) Universidade Estadual do


Cear, Centro de Cincias e Tecnologia, Curso de Mestrado
Profissional em Computao Aplicada, Fortaleza, 2015.
rea de concentrao: Redes de Computadores
Orientao: Prof. Dr. Antnio Mauro Barbosa de Oliveira
1. Integrao de Dados. 2. Web Semntica. 3. Linked
Data.

CDD: 001.64
iii

ODARA SENA DOS SANTOS FEITOSA

UM PROCESSO DE INTEGRAO DE DADOS PARA UM SISTEMA


INTELIGENTE DE SADE

Dissertao submetida
Coordenao do Curso de Mestrado
Profissional em Computao Aplicada da
Universidade Estadual do Cear e do
Instituto Federal de Educao, Cincia e
Tecnologia do Cear, como requisito
parcial para a obteno do grau de Mestre
em Computao Aplicada.
Orientador: Prof. Dr. Antnio Mauro
Barbosa de Oliveira.

Aprovada em: ___ / ___ / ______

BANCA EXAMINADORA

__________________________________________________
Prof. Dr. Antnio Mauro Barbosa de Oliveira (IFCE)
Presidente (Orientador)

__________________________________________________
Prof. Dr. Marcos Jos Negreiros Gomes (UECE)
1 Membro Interno

__________________________________________________
Prof. Dr. Anilton Salles Garcia (UFES)
2 Membro Interno

__________________________________________________
Prof. Dr. Luiz Odorico Monteiro de Andrade (UFC)
Membro Externo
iv

Dedico este trabalho minha famlia.


v

AGRADECIMENTOS

minha Tia Antonilda e V Regina, que me tornaram a pessoa que sou hoje.
Ao meu pai, Jorge, que nunca deixou de acreditar no meu sucesso.
Ao meu esposo, Thiago, por toda a pacincia, amor e dedicao.
Ao meu orientador, Prof. Dr. Mauro Oliveira, por nunca duvidar do meu
trabalho e por ser hoje o meu espelho profissional e pessoal.
Ao Prof. Dr. Anilton Garcia, pelas orientaes e disponibilidade, sempre.
Deus, pelos belssimos planos traados para a minha vida.
todos os meus familiares e amigos, em especial aos amigos feitos no
MPCOMP, Evandro, Pablo e Reivel, pelo apoio e unio.
E toda equipe MPCOMP.
vi

Torna-te aquilo que s


Friedrich Nietzsche.
vii

RESUMO

O uso de Tecnologias da Informao e Comunicao (TICs) aplicadas sade vem


despontando nas ltimas dcadas, principalmente por viabilizar uma melhor gesto
do conhecimento e interpretao das informaes integradas, funes fundamentais
para suporte tomada de deciso. Ao encontro dessa tendncia destaca-se o
LARIISA, uma plataforma inteligente que objetiva auxiliar tomada de deciso na
rea de sade, utilizando conceitos de context-aware, ontologias e inteligncias de
governana de sade para apoiar a realizao da inferncia pelo sistema. No intuito
de ampliar o poder de inferncia do LARIISA se faz necessrio um enriquecimento
da base de conhecimento do framework, que pode ser conseguido atravs da
integrao de dados relacionados sade j existentes. Dessa forma, este trabalho
apresenta uma especificao do processo de integrao de dados para o LARIISA,
que permitir plataforma a criao de uma base de conhecimento mais rica, o que
resultar em realizao de inferncias mais eficientes, pois a especificao proposta
considera dados oriundos de fontes heterogneas, independentes e distribudas,
como, por exemplo, dados oriundos dos sistemas mantidos pelo Ministrio da
Sade, ou por outras esferas do governo. O presente trabalho tambm resulta em
uma arquitetura capaz de guiar o desenvolvimento de aplicaes para o LARIISA
que considerem a utilizao de dados integrados. Os resultados deste trabalho so
obtidos atravs da utilizao dos conceitos de dados linkados (Linked Data) e
ontologias, que se destacam no contexto da Web Semntica.

Palavras-chave: Ontologias; Web Semntica; Linked Data; Integrao de


Dados; Sistemas de Sade; LARIISA.
viii

ABSTRACTS

The use of information and communication technologies (ICT's) applied to health has
been rising in recent decades, primarily by enabling better management of
knowledge and interpretation of the integrated information, fundamental functions to
support decision-making. To meet this trend stands out the LARIISA, an intelligent
platform that aims to assist decision making in the area of health, using concepts of
context-aware, ontologies and intelligences of health governance to support the
realization of the inference by the system. In order to enlarge the power of LARIISA
inference is necessary to enrich the knowledge base of the framework, which can be
achieved through the integration of existing health-related data. In this way, this work
presents a specification of the data integration process for the LARIISA, which will
allow the platform to create a richer knowledge base, which will result in making
inferences more efficient, because the proposed specification considers data from
heterogeneous sources, independent and distributed, such as data from the systems
maintained by the Ministry of health, or by other spheres of Government. The present
work also results in an architecture that is able to guide the development of
applications for the LARIISA that will consider the use of integrated data. The results
of this work are obtained through the use of linked data concepts (Linked Data) and
ontologies, which stand out in the context of the Semantic Web.

Key words: Ontology; Semantic Web; Linked Data; Data Integration; Health
Systems; LARIISA
ix

LISTA DE FIGURAS

Figura 1: Sistema de Governana em Sade do LARIISA. ............................ 27!


Figura 2: Arquitetura do LARIISA e Aplicaes de Tomada de Deciso em
Governana. (Oliveira et al., 2010) ............................................................................ 30!
Figura 3: Local Health Context. Fonte: (Oliveira et al., 2010) ......................... 31!
Figura 4: Global Health Context. Fonte: (Oliveira et al., 2010). ...................... 32!
Figura 5: Cenrio de Utilizao do LARIISA. (Gardini et al., 2013) ................ 33!
Figura 6: Representao de um grafo (ou tripla) RDF. Fonte: (Yu, 2011) ...... 38!
Figura 7: Exemplo de um grafo RDF. Fonte: (Pinheiro, 2011) ....................... 39!
Figura 8: Exemplos de implementaes de bancos de dados RDF. Fonte: (Yu,
2011).......................................................................................................................... 39!
Figura 9: Representao de um padro de tripla SPARQL. Fonte: (Yu, 2011)
................................................................................................................................... 40!
Figura 10: Exemplo de uma padro de grafo SPARQL. Fonte: (Yu, 2011) .... 40!
Figura 11: Estrutura de uma SELECT Query. Fonte: (Yu, 2011) ................... 41!
Figura 12: Exemplo de Consulta SPARQL. Fonte: (Yu, 2011) ....................... 41!
Figura 13: Arquitetura do Ambiente Computacional do MINERSUS. Fonte:
(Santos and Gutierrez, 2008) .................................................................................... 47!
Figura 14: Abordagens gerais de integrao em diferentes nveis de
arquitetura. Fonte: (Ziegler and Dittrich, 2007) .......................................................... 53!
Figura 15: Arquitetura dos Web Services. Fonte: (Castaeda, 2011) ............ 55!
Figura 16: Arquitetura bsica de um sistema de propsito geral de integrao
de dados. Fonte: Adaptado de Doan et al. (2012)..................................................... 57!
Figura 17: Processamento de consultas em um sistema integrado de dados.
Fonte: Adaptado de Doan et al. (2012). .................................................................... 58!
Figura 18: Processo de Integrao por Criao de um esquema nico de
dados. Fonte: Criao do autor. ................................................................................ 59!
Figura 19: Componentes Lgicos de um Data Warehouse. Fonte: Adaptado
de Doan et al. (2012). ................................................................................................ 61!
Figura 20: Arquitetura de Integrao de Dados Baseada em Mediadores.
Fonte: (Batista, 2003) ................................................................................................ 63!
x

Figura 21: Abordagem de descrio semntica por ontologia nica. Fonte:


Adaptado de (Wache et al.,2001) .............................................................................. 64!
Figura 22: Abordagem de descrio semntica por mltiplas ontologias.
Fonte: Adaptado de (Wache et al., 2001) .................................................................. 65!
Figura 23: Abordagem hbrida de descrio semntica baseada em
ontologias. Fonte: Adaptado de (Wache et al., 2001) ............................................... 66!
Figura 24: Possibilidades de Integrao de fontes abertas no domnio de
sade. Fonte: (Roberval, 2012) ................................................................................. 68!
Figura 25: Arquitetura de trs nveis baseada em ontologias. (MAGALHES,
2012).......................................................................................................................... 70!
Figura 26: Arquitetura de integrao de 3 nveis aplicada ao LARIISA .......... 71!
Figura 27: Passo a passo do processo proposto de integrao de dados para
o LARIISA. Fonte: Elaborao prpria ...................................................................... 73!
Figura 28: Arquitetura que define a relao entre a aplicao, o esquema
mediado de dados e as fontes de dados RDF. Criao do autor. ............................. 77!
Figura 29: Ontologia de Domnio resultante do Passo 1 do Processo de
Integrao Proposto. ................................................................................................. 80!
Figura 30: Exemplos de ontologias fonte. Criao do autor. .......................... 82!
Figura 31: Dados obtidos do SIMDA, referente ao nmero de casos de
dengue registrados por ano, por ms, por bairro, em formato de planilha. Criao do
autor........................................................................................................................... 83!
Figura 32: Resultado da triplificao dos dados. Criao do autor. ............... 83!
Figura 33: Ontologias de Aplicao resultantes do Passo 4 do processo de
integrao. Fonte do autor......................................................................................... 85!
Figura 34: rvore de consulta gerada ao submeter a consulta da Tabela 3 ao
processo de traduo. ............................................................................................... 89!
Figura 35: rvore reformulada aps a etapa de reformulao de consulta.
Cada operador Service contm sub consultas sobre as ontologias de aplicao. ... 90!
Figura 36: Consulta federada em lgebra SPARQL. ...................................... 92!
xi

LISTA DE TABELAS

Tabela 1: Exemplo de Mapeamentos Locais .................................................. 87!


Tabela 2: Alguns mapeamentos de mediao. ............................................... 87!
Tabela 3: Exemplo de Consulta SPARQL submetida ao Mediador Criado. ... 89!
Tabela 4: Consultas SPARQL sobre as ontologias de aplicao ................... 91!
Tabela 5: Consultas SPARQL sobre as ontologias fontes. ............................ 91!
xii

LISTA DE LISTAGENS

Listagem 1: Exemplo de mapeamento realizado considerando as orientaes


da ferramenta de converso XLWrap da planilha da Figura 27. ............................ 73
xiii

LISTA DE ABREVIATURAS E SIGLAS

ANVISA! Agncia!Nacional!de!Vigilncia!Sanitria!
APAC! Autorizao!de!Procedimentos!Ambulatoriais!
API! Application*Programming*Interface*
ARiDa! Advanced*Research*in*Database*
CNES! Cadastro!Nacional!de!Estabelecimentos!de!Sade!
CSV! Comma:Separated*Values*
DATASUS! Departamento!de!Informtica!do!Sistema!nico!de!Sade!
EHR! Electronic*Health*Record*
ETL! Extract,*Transform,*Load*
FUNCEME! Fundao!Cearense!de!Meteorologia!e!Recursos!Hdricos!
HTML! HyperText*Markup*Language*
HTTP! HypeText*Transfer*Protocol*
IDH! ndice!de!Desenvolvimento!Humano!
KTA! Knowledge:To:Action*
LARIISA! Laboratrio!de!Redes!Inteligentes!e!Integradas!de!Sade!
LIDMS! Linked*Data*Mashup*Services**
OLAP! On:line*Analytical*Processing*
OMS! Organizao!Mundial!da!Sade!
OQL! Object*Query*Language*
OWL! Web*Ontology*Language*
PEP! Pronturio!Eletrnico!do!Paciente!!
PNI! Programa!Nacional!de!Imunizaes!
PNUD! Programa!das!Naes!Unidas!para!o!Desenvolvimento!
QEFULD! Query*Evaluation*Framework*:*Linked*Data*
RDF! Resource*Description*Framework*
RDFS! Resource*Description*Framework*Schema*
SCNS! Sistema!do!Carto!Nacional!de!Sade!
xiv

SGBD! Sistema!de!Gerenciamento!de!Banco!de!Dados!
SIA! Sistema!de!Informaes!Ambulatoriais!
SIAB! Sistema!de!Informao!da!Ateno!Bsica!
SIH! Sistema!de!Internaes!Hospitalares!
SIM! Sistema!de!Informaes!de!Mortalidade!
SIMDA! Sistema!de!Monitoramanto!Dirio!de!Agravos!
SINAC! Sistema!de!Informaes!de!Nascidos!Vivos!
SINAN! Sistema!de!Informao!de!Agravos!de!Notificao!
SIS! Sistemas!de!Informao!de!Sade!
SISA! Sistema(de(Sade(AdaptadoUaoUcontexto'de'Gesto'de'Sade'!
SOA! Service:Oriented*Architecture*
SOAP! Simple*Object*Access*Protocol*
SPARQL! Sparql*Protocol*And*RDF*Query*Language*
SQL! Structured*Query*Language*
SUS! Sistema!nico!de!Sade!
UDDI! Universal*Description,*Discovery*and*Integration*
UFC! Universidade!Federal!do!Cear!
UFRN! Universidade!Federal!do!Rio!Grande!do!Norte!
UNICEF! United*Nations*Children's*Fund**
URI! Uniform*Resource*Identifier*
WSDL! Web*Services*Description*Language*
XML! eXtensible*Markup*Language*

!!
xv

SUMRIO

1.! INTRODUO ......................................................................................... 19!

1.1! Caracterizao do Problema ........................................................................................ 21!

1.2! Objetivos ........................................................................................................................ 22!

1.2.1! Objetivo Geral e Especficos..................................................................................... 23!

1.3! Contribuies ................................................................................................................ 24!

1.4! Organizao da Dissertao ........................................................................................ 25!

2.! FUNDAMENTAO TERICA ............................................................... 26!

2.1.! LARIISA ......................................................................................................................... 26!

2.1.1.! Sistema de Governana em Sade ......................................................................... 28!

2.1.1.1.! Inteligncia de Gesto do Conhecimento............................................................ 28!

2.1.1.2.! Inteligncia Normativa ........................................................................................... 28!

2.1.1.3.! Inteligncia Clnica-Epidemiolgica ..................................................................... 29!

2.1.1.4.! Inteligncia Administrativa ................................................................................... 29!

2.1.1.5.! Inteligncia de Gesto Compartilhada ................................................................. 29!

2.1.2.! Arquitetura do LARIISA ............................................................................................ 30!

2.2.! Ontologias .................................................................................................................... 34!

2.2.1.! Classificao das Ontologias Baseado na Granularidade que Representam .... 35!

2.2.2.! Componentes das Ontologias ................................................................................. 36!

2.3.! Web Semntica............................................................................................................. 36!

2.4.! Linked Data ................................................................................................................... 37!

2.5.! RDF ................................................................................................................................ 38!


xvi

2.6.! SPARQL ........................................................................................................................ 39!

2.6.1.! SPARQL Endpoint..................................................................................................... 42!

2.7.! Consideraes Finais do Captulo ............................................................................. 42!

3.! TRABALHOS RELACIONADOS ............................................................. 43!

3.1.! Integrao de Dados de Sade Baseada na Criao de um Novo Esquema de


Dados 43!

3.2.! Integrao de Dados de Sade Baseada na Utilizao de Web Services .............. 45!

3.3.! Integrao de Dados de Sade Baseada na Abordagem de Data Warehouse ...... 46!

3.4.! Integrao de Dados de Sade Baseada em Ontologias ......................................... 48!

3.5.! Consideraes Finais do Captulo ............................................................................. 49!

4.! PERCURSO METODOLGICO .............................................................. 51!

4.1.! Introduo..................................................................................................................... 51!

4.2.! A Problemtica da Integrao de Informaes ......................................................... 51!

4.3.! Integrao de Sistemas ............................................................................................... 54!

4.4.! Integrao de Dados .................................................................................................... 56!

4.4.1.! Integrao por Criao de um Esquema de Dados nico .................................... 59!

4.4.2.! Integrao por Data Warehouse .............................................................................. 60!

4.4.3.! Integrao Baseada em Mediadores ....................................................................... 63!

4.4.4.! Integrao de Dados e a Representao do Conhecimento Integrao de


Dados baseada em Ontologias .......................................................................................................... 64!

4.5.! A Entrada do Conceito de Linked Data ao LARIISA ................................................. 67!

4.6.! Consideraes Finais do Captulo ............................................................................. 69!

5.! PROCESSO DE INTEGRAO DE DADOS PARA O LARIISA............ 70!


xvii

5.1.! Arquitetura de Mediao de Trs Nveis baseado em Ontologias para Integrao


de Dados no Padro Linked Data ...................................................................................................... 70!

5.2.! Especificao do Processo de Integrao de Dados ............................................... 72!

5.2.1.! Definio da Ontologia de Domnio ........................................................................ 73!

5.2.2.! Seleo das Fontes de Dados ................................................................................. 74!

5.2.3.! Triplificao dos Dados e/ou Converso................................................................ 75!

5.2.4.! Modelagem das Ontologias de Aplicao .............................................................. 76!

5.2.5.! Definio dos Mapeamentos Locais e de Mediao.............................................. 76!

5.2.6.! Processamento de Consultas .................................................................................. 76!

5.3.! Arquitetura para Aplicaes LARIISA ........................................................................ 77!

5.4.! Aplicao do Processo Proposto ............................................................................... 79!

5.4.1.! Definio da Ontologia de Domnio ........................................................................ 79!

5.4.2.! Seleo das Fontes de Dados ................................................................................. 80!

5.4.3.! Triplificao dos Dados............................................................................................ 81!

5.4.4.! Modelagem das Ontologias de Aplicao .............................................................. 85!

5.4.5.! Definio dos Mapeamentos Locais e de Mediao.............................................. 85!

5.4.6.! Processamento das Consultas sob o Esquema Mediado..................................... 88!

5.4.6.1.! Detalhes de implementao .................................................................................. 88!

5.5.! Consideraes Finais do Captulo ............................................................................. 92!

6.! ANLISES E RESULTADOS .................................................................. 93!

6.1.! Introduo..................................................................................................................... 93!

6.2.! Consideraes Finais do Captulo ............................................................................. 94!

7.! CONSIDERAES FINAIS E TRABALHOS FUTUROS........................ 95!

7.1.! Consideraes Finais .................................................................................................. 95!


xviii

7.2.! Trabalhos Futuros........................................................................................................ 95!


19

1. INTRODUO

O uso de Tecnologias da Informao e Comunicao (TICs) aplicadas


sade vem despontando nas ltimas dcadas. O termo e-health est sendo usado
para representar essa integrao das TICs com a sade e medicina. Vrias so as
pesquisas sobre o tema, como evidenciado pelos peridicos dedicados a sua
discusso.
Telemedicina e home care, so algumas subreas que se destacam como
principais tendncias de pesquisa nessa rea. Mas os sistemas de informao
desenvolvidos para sade despontam sobre todas as outras, tendo os sistemas de
EHR (Eletronic Health Records; em portugus, Pronturio Eletrnico do Paciente -
PEP) como os mais significativos (Bath, 2008; Hyrinen, Saranto and Nyknen,
2008).
Os pronturios eletrnicos so focados tanto no paciente, j que podem
sumarizar todo o seu histrico mdico, como alergias, resultados de exames,
tratamentos realizados, doenas crnicas, etc., como podem ser teis para
propsitos de governana em sade, sendo fontes de informaes para um gestor,
com a gerao de informaes agregadas, clnicas e administrativas, promovendo
grande impacto e benefcio na melhoria da eficcia, eficincia, segurana, e
qualidade da prtica de sade (Eduardo Massad, Heimar de Ftima Marin, 2003).
No Brasil, a ineficaz gesto muitas vezes citada como sendo a principal
causa da pssima situao na qual se encontra a sade pblica, onde usurios
podem esperar anos para conseguir uma cirurgia eletiva. A dificuldade de grande
parte dos gestores na tomada de deciso nas trs esferas de governo se deve a
vrios fatores, dos quais se destacam: o baixo nvel de cobertura das informaes; o
retardo entre os eventos de coleta e anlise das informaes; e a baixa
confiabilidade dessas informaes.
Muitos trabalhos reforam que a aplicao de Sistemas de Informao em
Sade (SIS) na rea pblica possibilitam uma gesto de sade mais eficiente, por
conseguir viabilizar uma melhor gesto do conhecimento e interpretao das
informaes integradas, funes fundamentais para suporte tomada de deciso.
20

Pode-se destacar os trabalhos de (Santos and Gutierrez, 2008) e (Montenegro et


al., 2013).
O projeto LARIISA vem ao encontro dessa tendncia, com uma proposta de
realizar inferncia de informaes contextuais de sade e auxiliar a tomada de
deciso do gestor de sade. A plataforma se baseia em aplicaes de sade do tipo
context-aware, ou seja, que levam em considerao informaes que possam ser
usadas para caracterizar a situao de uma entidade (Dey, 2000).
Em termos prticos, ser uma plataforma context-aware significa dizer que as
inferncias realizadas pelo LARIISA podem ser obtidas a partir de informaes
geradas em um curto perodo de tempo e no s a partir de um histrico longo de
informaes. Por exemplo, a partir de uma aplicao mvel, integrada ao LARIISA,
que faa usurios relatarem casos de suspeita de dengue, o LARIISA poder inferir
sobre um possvel foco de dengue em um determinado bairro, fazendo com que o
gestor de posse dessas informaes possa tomar providncias a respeito, como
intensificar as campanhas no local ou aumentar a frequncia de carros fumac1.
Alm de context-aware, o LARIISA baseia sua inteligncia nos 5 domnios do
modelo de inteligncia de governana que, segundo (Andrade, 2012), so
necessrios para um gestor de sade realizar as melhores decises: (i) inteligncia
de gesto do conhecimento; (ii) inteligncia normativa; (iii) inteligncia clnica-
epidemiolgica; (iv) inteligncia administrativa; e (v) inteligncia compartilhada.
Para que o LARIISA possa realizar inferncias relevantes, que possam
contribuir com uma boa governana de sade, defende-se neste trabalho a ideia de
que no s informaes contextuais so necessrias para a construo de uma
base de conhecimento em sade significativa. Para ampliar o poder decisrio do
framework importante que contenha uma base de dados de sade com dados que
representem os 5 domnios de inteligncia citados no pargrafo anterior. Mas como
construir essa base de dados?
No contexto brasileiro, o DATASUS, departamento de informtica do
Ministrio da Sade, responsvel por coletar, processar e disseminar informaes
de sade pblica, tambm poderia ser um fornecedor de informaes para o
LARIISA, j que o departamento mantm diversos sistemas de sade, como o
Sistema de Informaes Ambulatoriais (SIA), Sistema de Informaes Hospitalares

1
Inseticida pulverizado em ultra baixo volume
2
http://dbpedia.org/sparql
3
environment.data.gov.uk/lab/sparql.html
21

(SIH), Cadastro Nacional de Estabelecimentos de Sade (CNES), Sistema de


Informaes sobre Mortalidade (SIM), Sistema de Informaes de Nascidos Vivos
(SINASC), entre outros (DATASUS, 2014).
Trabalhos como (Junior, 2009) e (Leo et al., 2004) mostram que a grande
limitao dos sistemas de informao mantidos pelo DATASUS o fato de suas
bases de dados no se integrarem, resultado de cada sistema ter sido desenvolvido
para atender uma demanda especfica, diminuindo a possibilidade de uma gesto
central e local mais efetiva. O prprio diretor do DATASUS, Augusto Csar Gadelha
Vieira, confirma, como mostrou (Pierro, 2011) em seu artigo:
A sistematizao de dados sobre a sade enfrenta hoje, no Brasil, dois
problemas de organizao. O primeiro a dificuldade para integrar todos os
sistemas do maior banco de dados na rea, o DATASUS, ligado ao
Ministrio da Sade. O segundo, o entrave da redundncia, ou seja, muitas
informaes colhidas pelo governo sendo repetidas em vrios outros
bancos de dados e que poderiam ser enxugadas.

sabido que essa integrao e interoperabilidade so aspectos prioritrios


para o SUS, como demonstra a iniciativa de implantao do Sistema Carto
Nacional de Sade (SCNS) e os SIS advindos com ele, como o e-SUS (E-Sus -
DATASUS, 2014). O SCNS no se trata apenas da distribuio de cartes aos
usurios do SUS. O primeiro aspecto que ele prioriza o da identificao nica
desses usurios, atacando o problema da redundncia de informaes. Aps o
processo de identificao concludo, o projeto do SCNS atuar como um registro
eletrnico do paciente, armazenando todo o seu histrico mdico, podendo ser
acessado em qualquer lugar do planeta.

1.1 Caracterizao do Problema

Considerando o contexto exposto, observa-se o desafio enfrentado. O


LARIISA se prope a fornecer inteligncias de governana na tomada de deciso na
sade considerando sua base de conhecimento construda a partir de informaes
de contexto. Os trabalhos realizados do LARIISA at o momento s apresentaram a
construo dessa base de dados a partir de informaes coletadas de aplicaes
desenvolvidas especificamente para a plataforma (Antunes, 2011; Gardini et al.,
2013; Pinheiro et al., 2011).
No entanto, o LARIISA tambm pode considerar dados outros que possam
contribuir para inferncias mais significativas. Isso significa ter de considerar dados
22

de sistemas de sade j existentes, como os dados oriundos dos sistemas mantidos


pelo Ministrio da Sade, ou por outras esferas do governo.
Na prtica, no s dados de sade que podem ser considerados, mas sim
quaisquer dados que possam se mostrar relevantes para auxiliar a tomada de
deciso. Dados contextuais de uma localidade, como ndices de precipitao,
temperatura, podem se mostrar teis, por exemplo, para identificar possveis reas
endmicas. Cabe ressaltar que no necessrio a construo de provedores de
contexto especficos para coletar essas informaes, muitas delas j esto
disponveis.
Sendo assim, fica claro a necessidade do LARIISA em ser capaz de lidar com
diferentes bases de dados. Para tal deve ter a capacidade de no apenas acessar
esses dados ou consider-los de forma isolada, mas tambm integrando esses
dados, obtendo assim informaes mais ricas e consequentemente possibilitando
tomadas de decises mais eficientes. Este trabalho, portanto, lida diretamente com a
problemtica de integrao de dados heterogneos, independentes e distribudos no
LARIISA.

1.2 Objetivos

Este trabalho apresenta uma especificao de um processo de integrao de


dados de sade para ser utilizado pelo LARIISA, considerando dados oriundos de
fontes heterogneas, independentes e distribudas. Isso possvel com a utilizao
dos conceitos de dados linkados (Linked Data) e ontologias (j considerada na
arquitetura do LARIISA), que se destacam no contexto da Web Semntica. A Web
Semntica considera o conceito de migrar a Web de documentos para uma Web
de Dados, assim, ao invs do aglomerado de pginas e links entre elas que existem
hoje, tem-se um aglomerado de dados, conectados entre si, disponveis da Internet.
A Web semntica possibilita interligar significados de palavras e consegue
atribuir um significado (sentido) aos contedos publicados na Internet, de modo que
seja perceptvel tanto pelo humano como pelo computador. Ela fornece tecnologias
para efetivamente publicar, recuperar e descrever dados distribudos na Web. A
integrao de dados em grande escala provavelmente um dos melhores casos de
uso para as tecnologias de Web semntica, pois h vrios aspectos da Web
23

semntica que a tornam adequada para a integrao de dados de fontes distribudas


e heterogneas (Heath and Bizer, 2011).
Essa integrao de dados na Web Semntica alcanada atravs do uso de
Linked Data. Linked Data refere-se a um conjunto de melhores prticas para publicar
e interligar dados estruturados na Web: (i) Uso de URIs como nome para as coisas,
(ii) Uso de URIs em HTTP, para que as pessoas possam procurar esses nomes, (iii)
Uso de padres como RDF e SPARQL, (iv) Incluso de links para outras URIs, para
que se possa descobrir mais coisas. (Bauer and Kaltenbck, 2012; Berners-Lee,
2006).
Desse modo, Linked Data tem o potencial de facilitar o acesso aos dados
semanticamente relacionados, estabelecendo conexes explcitas entre conjuntos
de dados distintos a fim de facilitar sua integrao e fornecendo, portanto, um novo
cenrio integrao de dados.
utilizado tambm uma modelagem conceitual baseada em ontologias que
permitir criar um nico vocabulrio, considerando os diversos conceitos existentes
das fontes de dados que sero integradas. Essa abordagem se mostra oportuna,
uma vez que diversas pesquisas demonstram a eficincia da utilizao de ontologias
como abordagem de integrao de dados.
Com isso, o processo proposto permite integrar dados, sejam esses dados
provindos de aplicaes construdas exclusivamente para fornecer informaes
plataforma, sejam dados provindos de sistemas de sade j existentes que queiram
fornecer dados para o LARIISA, sejam dados de sade abertos j disponveis no
formato Linked Data.

1.2.1 Objetivo Geral e Especficos


O objetivo geral da dissertao a especificao de um processo de
integrao de dados para o LARIISA, capaz de lidar com fontes de dados
heterogneas, independentes e distribudas, resultando em uma base de
conhecimento mais rica, aumentando assim seu poder de inferncia. O processo
proposto possibilitar a um projetista, a integrao de dados para a plataforma ser
realizada sobre demanda, ou seja, novos dados podero ser integrados ao LARISSA
conforme a necessidade.
Como objetivos especficos tem-se:
24

a) Realizar estudo comparativo das abordagens possveis de integrao


de dados que podem ser consideradas pelo LARIISA;
b) Realizar pesquisa sobre o uso de ontologias e linked data aplicadas
sade;
c) Validar o processo especificado em uma demanda real de integrao
de dados envolvendo a sade, e verificar a qualidade de inferncia do
LARIISA a partir dessa integrao.

1.3 Contribuies

A principal contribuio deste trabalho est na especificao do processo de


integrao de dados para o LARIISA, que permitir plataforma a criao de uma
base de conhecimento mais rica, o que resultar em realizao de inferncias mais
eficientes. Isso se deve ao fato do processo considerar para integrao as mais
diversas fontes de dados, sejam essas fontes oriundas de sistemas legados, sejam
fontes de dados disponveis na Web, fontes de dados disponveis em tabelas, etc.
Outra contribuio importante est na definio de uma arquitetura para as
novas aplicaes que sero desenvolvidas considerando a integrao de dados
utilizando o processo proposto. Assim, os resultados deste trabalho servir tanto o
desenvolvimento de uma aplicao para o LARIISA, que objetiva apenas a
integrao de umas poucas bases de dados, para resolver alguma questo
especfica da sade, quanto para aprimorar a base de conhecimento da plataforma,
que envolve a integrao de um nmero bem maior de bases de dados.
Considera-se tambm como uma contribuio relevante a insero do
conceito de ontologia de domnio ao projeto LARIISA. Neste trabalho, proposta a
modelagem do LARIISA atravs de ontologias que representem subdomnios
especficos. O conjunto dessas ontologias e os mapeamentos entre elas formariam
assim todo o domnio de conhecimento de sade trabalhado pelo LARIISA. A
modelagem da ontologia de domnio do LARIISA atravs de sub ontologias permitir
a insero de conhecimento ao LARIISA sob demanda.
25

1.4 Organizao da Dissertao


Esta dissertao possui seis captulos mais as consideraes finais. No
sendo mais necessrio tratar deste captulo introdutrio, os demais so delineados a
seguir.
O Captulo 2 Fundamentao Terica apresenta uma sntese dos
assuntos mais relevantes que servem de fundamentao para o entendimento dos
demais captulos desta dissertao. Ele expe os principais conceitos e ferramentas
relacionados a integrao de dados, Web Semntica, Ontologias, RDF e SPARQL.
O Captulo 3 Trabalhos Relacionados trata dos principais trabalhos que
abordaram a integrao de dados heterogneos e distribudos. So destacadas
funcionalidades e desvantagens de cada uma delas.
O Capitulo 4 Percurso Metodolgico apresentado o percurso
metodolgico atravs do qual se construiu o presente trabalho: as escolhas, a
definio do objeto de pesquisa e os principais conceitos utilizados..
O Captulo 5 apresenta o processo de integrao de dados proposto para o
LARIISA utilizando a tecnologia de Linked Data, levando em considerao fontes de
dados heterogneas.
O Captulo 6 Anlises e Resultados - apresenta algumas anlises e
resultados provenientes da proposio desse processo de integrao de dados ao
LARIISA.
Por fim, o Captulo 7 tece concluses sobre o trabalho e apresenta possveis
trabalhos futuros para dar prosseguimento ao que foi obtido at aqui.
26

2. FUNDAMENTAO TERICA

A plataforma LARIISA, desde que foi concebida em 2010, j resultou em


diversos trabalhos, desde aplicaes desenvolvidas para captao de informaes
de contexto (como condies de sade de pacientes e nmero de casos
epidemiolgicos detectados por agentes de sade) (Antunes, 2011; Pinheiro et al.,
2011), at outras abordagens conceituais (como a utilizao de redes bayesianas,
como ferramenta de inferncia) (Santos, Teles and Oliveira, 2013)).
Neste trabalho incorporado um novo conceito para o LARIISA. Com a
evoluo da Web atual, onde ela vem deixando de ser um aglomerado de
documentos interligados para se tornar um aglomerado de dados vinculados, dos
mais variados domnios, surge um novo cenrio para a integrao de dados.
Considerando a grande demanda do LARIISA por dados integrados, v-se a
utilizao desses novos conceitos como facilitador do processo de inferncia.
Neste captulo so apresentados esses conceitos, essenciais para o
entendimento do contexto ao qual foi fundamentada esta evoluo do LARIISA,
assim como a teoria necessria para a compreenso dos captulos seguintes.

2.1. LARIISA
O LARIISA foi concebido para ser um sistema capaz de auxiliar na tomada de
deciso em sade a partir da inferncia de informaes obtidas de aplicaes que
interagem com o usurio. Essas aplicaes devem ser desenvolvidas considerando
a obteno de dados de contexto, enriquecendo o poder de inferncia do sistema.
Inicialmente concebido para ter como principal provedor de contexto
softwares desenvolvidos para a TV Digital Brasileira, suportando aplicaes de tele
monitoramento, procedimentos mdicos remotos, etc., trabalhos seguintes
comprovaram que a plataforma LARIISA teria inmeras outras possibilidades de
obter esses dados contextuais.
A exploso dos dispositivos e da Internet mveis cria um ambiente perfeito
para novos provedores de contexto, alm da TV Digital Brasileira anteriormente
definida na plataforma. Os smartphones, com seus sensores j embutidos, podem
ser utilizados para coleta e envio de informaes sobre as condies de sade de
27

seus usurios. Essas informaes seriam encaminhadas para o LARIISA e


posteriormente aos profissionais de sade, com o intuito de oferecer melhorias
coordenao das aes e eficcia dos procedimentos de deteco/tratamento
remoto de doenas.
Alm da vantagem de ser uma plataforma sensvel a contexto, o LARIISA
tambm melhora qualitativamente a tomada de deciso, pois leva em considerao
as inteligncias de governana de sade (Andrade, 2012), sobre o que necessrio
conhecer para se realizar uma boa governana em sade.
A Figura 1 ilustra a modelagem do LARIISA fundamentada nos 5 domnios de
inteligncia em governana de sade: (i) inteligncia de gesto do conhecimento; (ii)
inteligncia normativa; (iii) inteligncia clnica-epidemiolgica; (iv) inteligncia
administrativa; e (v) inteligncia de informaes compartilhadas. Observa-se com a
figura que a plataforma permite obter dados diversos, dados esses que podem
representar um domnio de inteligncia isolado ou permear todos os domnios. Com
a integrao de todos esses dados, o LARIISA poder realizar uma inferncia muito
mais significativa, pois os dados utilizados para a realizao de inferncias so
dados significativos para a governana em sade e, consequentemente resulta
numa boa tomada de deciso do gestor. Nas sees seguintes, so tratados com
mais detalhes esses domnios de inteligncia.

Figura 1: Sistema de Governana em Sade do LARIISA.


28

2.1.1. Sistema de Governana em Sade

2.1.1.1. Inteligncia de Gesto do Conhecimento


A gesto do conhecimento, independente da rea, vem sendo bastante
valorizada, principalmente sendo vista como um diferencial competitivo para uma
gesto institucional de sucesso. Segundo Davenport & Prusak (1998), a gesto do
conhecimento pode ser vista como uma srie de aes gerenciais constantes e
sistemticas que facilitam os processos de criao, registro e compartilhamento do
conhecimento nas organizaes. Nos tempos atuais, com o avano das tecnologias
de informao e comunicao, o conhecimento passou a ser considerado o
diferencial competitivo das organizaes que pretendem ter longevidade e sucesso.
Na rea da sade, a gesto do conhecimento possibilita uma composio de
estratgicas e prticas para identificar, criar e representar experincias de cuidados
de sade, por qualquer que seja o ator envolvido, dos profissionais de sade ao
gestor, passando pelas experincias do prprio paciente.
Nesse contexto, o LARIISA acaba por facilitar essa gesto do conhecimento,
pela grande diversidade de informaes que capaz de reunir. O LARIISA tambm
ter de suportar a insero desse conhecimento de alguma forma.
Tendo claro a importncia da gesto do conhecimento para qualquer tipo de
governana e, principalmente no contexto de governana para a sade, o LARIISA
no poderia deixar de considerar a obteno de dados resultantes da gesto de
conhecimento em sade.

2.1.1.2. Inteligncia Normativa


O LARIISA precisa agregar e considerar as normativas relacionadas sade
que devem ser consideradas por um gestor na tomada de deciso. Por exemplo,
para elaborao de uma estratgia de combate dengue, o gestor no deve ter
cincia apenas da legislao diretamente ligada ao combate dengue, mas ele deve
ter cincia de artigos da constituio federal (como a questo da inviolabilidade da
casa de um indivduo, sobre a admisso de agentes comunitrios de sade,...); de
artigos do cdigo penal referentes crimes contra a sade pblica (como as penas
relacionadas ao causador de epidemias, infrao por impedir medida sanitria
preventiva, etc); e outras mais.
29

Sendo assim, o LARIISA considera em suas inferncias informaes


relacionadas legislao, pertinentes ao domnio de conhecimento em que a
plataforma est inserida.

2.1.1.3. Inteligncia Clnica-Epidemiolgica


A inteligncia clnica-epidemiolgica diz respeito s informaes referentes ao
conhecimento dos processos sade-doena, ao conhecimento dos protocolos
envolvidos em rotinas clnicas, dos processos de investigao de eventos de sade
pblica que possam representar uma ameaa para a sade pblica, ou seja, de uma
forma geral, refere-se s informaes diretamente ligadas ao conhecimento de
sade.
Um exemplo da importncia dessa inteligncia para a governana de sade
pode estar relacionado na atuao do LARIISA provendo ao gestor decises mais
assertivas na conteno de uma situao endmica.

2.1.1.4. Inteligncia Administrativa


Como o prprio nome j sugere, essa inteligncia para a governana
relaciona-se ao conhecimento dos processos de gesto administrativa na rea da
sade. Pode estar relacionado, por exemplo, gesto da alocao de profissionais
de sade para atingir um determinado objetivo, considerando treinamento e o tempo
necessrio para atingir esse objetivo; pode estar relacionado tambm gesto de
recursos de sade considerando perodos endmicos.

2.1.1.5. Inteligncia de Gesto Compartilhada


A gesto compartilhada diz respeito participao social no contexto da
sade. Por exemplo, pode-se citar a atuao da populao no compartilhamento de
informaes nas mdias sociais, como, quando informam que esto com uma
determinada condio clnica, ou quando informam sobre focos de dengue (Silva et
al., 2011).
A inteligncia de gesto compartilhada tambm diz respeito gesto de
sade compartilhada das trs esferas de governo. importante para o gestor ter
plena compreenso sobre as suas competncias frente aos sistema de sade
brasileiro, seja ele de responsabilidade do municpio, estado ou unio.
30

2.1.2. Arquitetura do LARIISA


A arquitetura do LARIISA possui como alicerces os conceitos de context-
aware e de inteligncias de governana em sade. O primeiro grande desafio era
sobre a diferena entre o processo de deteco de contexto (knowledge) e como
esse contexto afetaria as aplicaes relacionadas (Action). Para isso, o framework
se vale do modelo Knowledge-To-Action (KTA) (Graham et al., 2006). A Figura 2 a
seguir ilustra a arquitetura do LARIISA.
54

Figura 2: Arquitetura do LARIISAFigura


e Aplicaes de Framework
9 Lariisa Tomada de Core
Deciso em Governana. (Oliveira et
al., 2010)

Context Provider
possvel observar, atravs da Figura 2, que o conceito de ontologias j era
O CP, ou Provedor de Contexto, o responsvel pela coleta de dados brutos
considerado na arquitetura do LARIISA, mas nunca foi explorado no contexto da
com contexto de um ambiente. Contexto de sensores mveis (ex: dispositivo mvel
integrao de dados, alm da representao por ontologias do conceito de
de agente de sade) e residncias de famlias (usando set-top-box), podem ser
informaes contextuais de sade. Vale destacar aqui o componente da arquitetura
enviados ao CA (ver a seguir). Esses sensores podem estar fisicamente conectados
relacionado com o conceito de ontologias:
ao set-top-box da TV Digital ou podem estabelecer uma conexo externa (ex:
atravs de WiMAX, GSM/GPRS/3G ou similares) com o sistema para transmitir
dados recuperados do contexto. O projeto Lariisa utiliza o Diga Sade para
recuperar sinais vitais do usurio final, atravs da integrao de sensores com o set-
31

Ontology Base: Esse componente prov a gerncia do conhecimento dentro


do LARIISA. Ele armazena ontologias, suas instncias, regras de inferncia e
derivao. Permite manipulao e recuperao do conhecimento pelo Context
Reasoner.
Como dito, as ontologias so utilizadas na arquitetura do LARIISA para
representar o conceito de informaes contextuais em sade. Nesse sentido, so
definidos os conceitos de Local Health Context, que descreve a situao de qualquer
entidade interagindo com o sistema de governana, como pacientes, gestores de
sade, agentes de sade, etc. Essas informaes so utilizadas para definir regras
de decises locais de sade e para compor o Global Health Context. O Global
Health Context descreve informaes de alto nvel geradas a partir das informaes
de contexto local entregues pelo Local Health Context. Por exemplo, o Global Health
Context descreve o nmero de casos de dengue confirmados numa regio, durante
um determinado perodo de tempo. A Figura 3 e a Figura 4 a seguir ilustram as
ontologias de Local Health Context e Global Health Context.

Figura 3: Local Health Context. Fonte: (Oliveira et al., 2010)


32

Figura 4: Global Health Context. Fonte: (Oliveira et al., 2010).

Como j mencionado, alguns trabalhos j foram desenvolvidos referentes ao


projeto LARIISA. Merecem destaque o trabalho de (Pinheiro et al., 2011), tomando
como partida o trabalho do Diga-Sade (SANTOS, 2011), que prope um pronturio
eletrnico capaz de captar informaes de contexto do paciente em sua prpria
casa. O trabalho de (Frota, 2011) construiu uma aplicao para a incluso e
excluso de provedores de contexto ao LARIISA. O trabalho de (Antunes, 2011),
chamado de SISA, apresenta um prottipo de aplicao para o LARIISA no contexto
de agravos de dengue. Esse prottipo possui um mdulo para captar informaes
locais de contexto e um mdulo Web de visualizao das informaes globais de
contexto.
O trabalho de (ALCNTARA, 2012), que apresentou uma ferramenta para
construo de aplicaes para o LARIISA. O trabalho de (Teles, 2013) props uma
nova arquitetura para o LARIISA, onde ele considera a utilizao de redes
bayesianas como motor de inferncia para o framework.
A Figura 5 a seguir, mostra um fluxo de utilizao do LARIISA, em um cenrio
de home care, onde so considerados os resultados dos trabalhos mencionados. Ela
mostra a interao de um usurio com o framework atravs do envio de seus dados
de sade, e suas aes resultantes aps inferncia desses dados pelo LARIISA,
podendo ser o envio de um agente de sade ou de uma ambulncia no contexto de
sade local, e em um contexto de sade global, a compra de mais medicamentos ou
a realocao de agentes de sade para a regio. Tm-se ento os seguintes
passos:
33

Figura 5: Cenrio de Utilizao do LARIISA. (Gardini et al., 2013)

Passo 1 Em verde, tem-se a representao da captura de dados


contextuais de sade do usurio de uma aplicao do LARIISA. V-se a
possibilidade de utilizao de vrios provedores de contexto, como o uso da TV
Digital (Pinheiro et al., 2011; SANTOS, 2011) e do smartphone (Frota, 2011).
Passo 2 Em amarelo, tem-se a viso do framework LARIISA e suas
interaes ao receber as informaes de sade contextuais do usurio. Nesse
cenrio, j observa-se a base de conhecimento do LARIISA (LARIISA Database)
sendo formada por dados integrados (Mashup and Linked Data objeto deste
trabalho), inclusive dados esses provindos de outras fontes, como os bancos de
dados do SUS. Aps inferncias feitas, o framework solicita ao usurio informaes
adicionais.
Observa-se tambm a troca de informaes do LARIISA com suas
aplicaes, como o SISA (Antunes, 2011) e o DIGA-Sade (SANTOS, 2011). Neste
cenrio, O SISA fornece informao contextual dos agentes de sade, a localizao.
O DIGA-Sade apresenta dados de sade global para o gestor considerando os
dados do usurio que o LARIISA acabou de processar.
Passo 3 e 4 Aps o envio das respostas s informaes adicionais
solicitadas pelo LARIISA ao usurio (passo 3), o framework possui 3 possveis
decises a tomar em nvel de sade local (passo 4):
34

a) Deciso 1: enviar uma mensagem ao usurio com as coordenadas da


unidade de sade que ele deve ir, se seu diagnstico for crtico e existir uma
unidade de sade prxima caso do usurio;
b) Deciso 2: enviar um agente de sade especialista casa do paciente, se
seu diagnstico for crtico e no existir uma unidade de sade prxima caso do
usurio (nesse caso, o agente de sade escolhido ser determinado pelas
informaes de contexto providas pelo SISA);
c) Deciso 3: enviar um SAMU (Servio de Atendimento Mdico de Urgncia)
casa do usurio, se o seu diagnstico for crtico e se for necessrio a sua ida a um
hospital.
J em nvel de sade global, o LARIISA possui duas decises a tomar (passo
4):
a) Deciso 1: realocar 5 agentes de sade para a regio no entorno da casa
do usurio, se h vrios diagnsticos na cidade com sinais de dengue e se h mais
de 10 casos confirmados nessa regio;
b) Deciso 2: planejar a compra de mais remdios para atender regio, se
h vrios diagnsticos na cidade com sinais de malria e se h mais de 50 casos
confirmados nessa regio.
Em resumo, consegue-se observar na Figura 5 todo o fluxo de funcionamento
do framework LARIISA, em um contexto de sade local, onde possvel inferir
aes a serem realizadas considerando o estado de sade do usurio e de todo o
seu histrico (atravs de uma base de conhecimento integrada); e em um contexto
de sade global, onde os dados desse usurio influenciam em decises de gesto.

2.2. Ontologias
Na cincia da computao, define-se as ontologias simplesmente como um
processo formal para representar conhecimento. As ontologias nomeiam e definem
tipos, propriedades e relacionamentos de entidades em um domnio especfico.
Considera-se as entidades como conceitualizaes desse domnio.
As ontologias foram desenvolvidas dentro do contexto de Inteligncia Artificial
para facilitar o compartilhamento de conhecimento e seu reuso. Desde ento o
estudo de ontologias vem sendo aplicado em diversos outros campos de estudo
como gerncia de compartilhamento, comrcio eletrnico, recuperao de
35

informaes, sistemas cooperativos de informao, e mais recentemente no


contexto de Web Semntica. Essa popularizao muito se deve ao que as
ontologias prometem fazer: um entendimento comum e compartilhado de algum
domnio que pode ser comunicado entre pessoas e sistemas de aplicao (Fensel,
2001).
Em (Gruber, 1993) apresentada uma definio mais formal e aceita pela
comunidade acadmica: Ontologia uma especificao formal e explcita de uma
conceitualizao compartilhada. Conceitualizao um modelo abstrato
de um fenmeno que identifica conceitos relevantes deste. Explcito significa que as
definies de nomenclaturas so no-ambguas; formal significa passvel de ser
processada automaticamente; e compartilhada' representa o conhecimento
consensual de um domnio.

2.2.1. Classificao das Ontologias Baseado na Granularidade que


Representam
Com relao ao escopo dos objetos descritos pela ontologia, pode-se ter a
seguinte classificao (Roussey et al., 2011):
a) Ontologias de Aplicao: so ontologias de um domnio especfico, que
representa o ponto de vista nico, de um usurio ou desenvolvedor. Podem ser
consideradas como uma especializao das ontologias de domnio.
b) Ontologias de Domnio: representam o ponto de vista de um fenmeno
compartilhado por um grupo de usurios.
c) Ontologias de Referncia: representam um padro utilizado por
diferentes grupos de usurios. Esse tipo de ontologia resultado da integrao de
vrias ontologias de domnio, geralmente construda para captura os conceitos e
relaes centrais do domnio.
d) Ontologias gerais: esse tipo de ontologia no dedicado a um domnio
especfico. Possuem conhecimentos gerais.
e) Ontologias de Alto Nvel: so ontologias genricas aplicveis a vrios
domnios. Definem conceitos bsicos como objetos, processos, relaes, eventos,
etc.
36

2.2.2. Componentes das Ontologias


Uma ontologia consiste de um nmero de diferentes componentes, com seus
nomes podendo variar dependendo da linguagem ontolgica utilizada. Apesar disso,
os componentes bsicos de uma ontologia, listados a seguir, so compartilhados
pela maioria das linguagens:
a) Classe (ou Conceito): descrevem conceitos em um domnio. Um conceito
representa um grupo de diferentes indivduos, que compartilham caractersticas
comuns, podendo ser mais ou menos especficos.
b) Relaes (conhecido tambm como Predicado ou Propriedade): usada
para estabelecer um relacionamento entre dois termos. O primeiro termo deve ser
um conceito que represente o domnio (domain) da relao; e o segundo termo deve
ser um conceito que represente o contradomnio (range) da relao. O
contradomnio de uma propriedade tambm pode ser um tipo de dado primitivo
como string, decimal ou boolean. E uma relao pode ter subrelaes.
c) Instncia (ou Indivduo): unidade materializada de uma classe, como
Maria uma instncia de pessoa, ou um carro especfico que possui uma placa
identificando-o unicamente.
A representao do conhecimento de ontologias deve ser realizada por
linguagens especficas, normalmente variantes da lgica descritiva que provm alta
expressividade e raciocnio. RDFS e OWL so exemplos de linguagens utilizadas.

2.3. Web Semntica


A ideia da Web Semntica surgiu em 2001 da publicao de (Berners-Lee,
Hendler and Lassila, 2001) onde se defendia a extenso da Web atual, baseada em
publicao de documentos, para uma Web baseada na semntica das informaes,
construindo assim uma Web de dados. Os dados podem ser acessados usando
Uniform Resource Identifier (URIs) e estar relacionados uns com os outros da
mesma forma que os documentos j so.
A Web Semntica descreve uma Web qualitativamente diferente da atual,
onde, ao invs de se ter contedos estruturados sendo exibidos e lidos por pessoas,
tem-se informaes semanticamente inteligveis por programas, os chamados
agentes de software. A Web Semntica tem como finalidade atribuir um significado
37

aos contedos publicados na Internet de modo que seja perceptvel tanto pelo
humano quanto pelo computador.
Neste sentido, diversas ss as tecnologias necessrias para possibilitar que
as mquinas passem a entender o significado das coisas. As ontologias, descritas
na seo anterior, uma delas, possibilitando definir conceitos e relaes
relacionados uma rea de conhecimento especfico.
J o conceito de Linked Data considerado o corao da Web Semntica,
permitindo integrao de dados em larga escala na Web. Mais especificamente,
pode-se definir Linked Data como um termo utilizado para descrever as melhores
prticas para expor, compartilhar e conectar pedaos de dados, informao e
conhecimento na Web, utilizando URIs e Resource Description Framework (RDF).
O RDF a base para a publicao e linkagem de dados. O RDF prov uma
linguagem para modelagem de dados baseado na ideia de construir asseres
sobre recursos na forma de tuplas, sujeito-predicado-objeto. Com isso, todos os
dados da Web Semntica estariam sobre o padro RDF. Para consultar esses
dados em RDF, utiliza-se como ferramenta a linguagem de consulta SPARQL.

2.4. Linked Data


Em resumo, Linked Data descreve um mtodo de publicao de dados
estruturados de modo que possam ser interligados e se tornem mais teis. Ele se
baseia em tecnologias padro Web, tais como HTTP e URIs, mas ao invs de us-
las para servir pginas web para leitores humanos, estende-se o compartilhamento
de informaes de uma forma que possa ser lido automaticamente por
computadores. Isso permite que os dados de diferentes fontes sejam conectados e
consultado (Berners-Lee, Heath and Bizer, 2009).
A proposta de dados abertos interligados oferece grande potencial ao
conectar recursos informacionais atravs de links semnticos, links que so
significativos tambm para programas. Ao contrrio, links convencionais nada mais
so (alm de uma eventual etiqueta textual significativa para usurios humanos) que
meios para que programas navegadores, a partir de um recurso, acessem outro,
sem explicitar qual o significado da ligao entre os recursos. Sendo significativos
para programas, links semnticos podem ser processados de forma mais rica por
eles, explorando e enriquecendo cognitivamente o significado (legvel por mquina)
da ligao entre ambos os recursos (Marcondes, 2012).
38

Berners-Lee (2006) delimitou um conjunto de "regras" para a publicao de


dados na Web de forma que todos os dados publicados tornem-se parte de um
espao nico de dados globais que ficaram conhecidos como Princpios Linked
Data. So eles:
1. Usar URIs como nomes para as coisas;
2. Usar URIs de modo que as pessoas possam procurar esses nomes;
3. Quando algum procurar uma URI, fornecer informaes teis, usando os
padres (RDF, SPARQL);
4. Incluir links para outras URIs, para que se possa descobrir mais coisas.
Como visto, o conceito de Linked Data apoia-se em um pequeno conjunto de
padres j bem estabelecidos e amplamente utilizados na Web: um mecanismo de
identificao global e nico (URIs), um mecanismo de acesso universal (HTTP), o
modelo de dados RDF, e a linguagem de consulta SPARQL para acesso aos dados.

2.5. RDF
RDF foi originalmente criado em 1999 pelo W3C como um padro para
codificao de metadados. Com o advento da Web Semntica, em 2004 o W3C
lanou uma nova especificao do RDF ampliando seu significando, passando a
representar qualquer recurso e suas relaes existentes no mundo real.
A ideia bsica do RDF usar um modelo abstrato para decompor
informao/conhecimento em pequenos pedaos, com algumas regras simples
sobre o significado de cada pedao desse, sendo um mtodo simples e flexvel para
representar qualquer fato, no deixando de ser estruturado para que aplicaes
consigam operar esse conhecimento (Yu, 2011).
Esse modelo abstrato possui os seguintes componentes principais: (i)
Assertiva; (ii) Sujeitos e objetos; (iii) predicado. As assertivas podem ser expressas
pela forma Sujeito-Predicado-Objeto, sempre nessa ordem, onde o sujeito e o objeto
so coisas do mundo real, e o predicado o nome de uma relao que conecta
essas duas coisas. Uma assertiva pode ser representada pela estrutura de um grafo,
como representado na Figura 6.
26 2 The Building Block for the Semantic Web: RDF

Fig. 2.3 Graph


Figura structure of RDF statement
6: Representao de um grafo (ou tripla) RDF. Fonte: (Yu, 2011)
Therefore, an RDF statement must have the following format:
subject predicate object
where the subject and object are names for two things in the world, with the
predicate being the name of a relation that connects these two things. Figure 2.3
39

O sujeito pode ser representado por uma URI ou um blank node (n em


branco). O predicado representado apenas por uma URI e o objeto pode ser
representado por uma URI, blank node, ou um dado literal. Na Figura 7 a seguir,
tem-se um exemplo de uma assertiva sendo representada por um grafo. O produto
p1, representando o sujeito da assertiva, que identificado pela URI
http://sales/product/p1, possui uma propriedade data-reviso que possui o valor
15/04/2001. O prefixo am utilizado como sinnimo para o espao de nomes,
identificado na URI http://amazon.com/schema/, no qual o predicado data-reviso
fora definido.

Figura 7: Exemplo de um grafo RDF. Fonte: (Pinheiro, 2011)

Para armazenar as assertivas RDF (tambm podendo ser chamadas de


tuplas RDF) existem os RDF store ou RDF data store, construdos especialmente
para este fim. Bancos de dados relacionais podem ser usados para armazenar
assertivas RDF, possibilitando a execuo das funes bsicas de adicionar,
deletar, atualizar e localizar um registro, mas no obtm um desempenho apropriado
se comparado a um sistema otimizado para operar com RDF. A Figura 8 lista os
principais RDF data store disponveis no mercado atual e a linguagem de
implementao.

Figura 8: Exemplos de implementaes de bancos de dados RDF. Fonte: (Yu, 2011)

2.6. SPARQL
SPARQL a linguagem padro da Web Semntica para recuperao de
informaes contidas em grafos RDF, sendo no s uma linguagem de consulta,
mas tambm um protocolo usado para enviar consultas e recuperar resultados
atravs do protocolo HTTP.
SPARQL provides four different forms of query:

SELECT query
ASK query
DESCRIBE query
CONSTRUCT query 40
Among these forms, SELECT query is the most frequently used query form. In
SPARQL addition,
prov quatro
all these diferentes formas
query forms are detwo
based on consulta: (i) SELECT
basic SPARQL query; (ii)
concepts: triple
ASK query; (iii) pattern
DESCRIBEand graphquery;
pattern. Let us understand
e (iv) CONSTRUCT these two concepts
query. first beforeas
Todas weformas
start de
to look at SPARQL queries.
consulta so baseadas em padro de triplas e padro de grafos.
6.3.1.1 Triple Pattern
Assim como o conceito de tripla do RDF, o padro de triplas no SPARQL
As we have learned, RDF model is built on the concept of triple, a three-tuple struc-
segue o mesmo ture
princpio. A ofdiferena
consisting que and
subject, predicate, no object.
padro de triplas
Likewise, do SPARQL
SPARQL is built uponpodem
the concept of triple pattern, which is also written as subject, predicate, and object,
ser inseridas variveis.
and has to Qualquer
be terminatedum
withou todos
a full stop. de
The uma vezbetween
difference s, sujeito, predicado
RDF triple and e
SPARQL triple pattern is that a SPARQL triple pattern can include variables: any or
objeto, podem ser variveis em um padro de tripla SPARQL, que so identificadas
all of the subject, predicate, and object values in a triple pattern can be a variable.
pelo caractere ? Clearly, an RDF
procedido detriple
umisnome
also a SPARQL triple pattern.
de varivel.
The second line in the following example is a SPARQL triple pattern (note that
the Turtle syntax is used here):
@prefix foaf: <http://xmlns.com/foaf/0.1/>.
<http://danbri.org/foaf.rdf#danbri> foaf:name ?name.

Figura 9: As you can tell, the


Representao desubject of this de
um padro triple pattern
tripla is Dan Brickleys
SPARQL. Fonte: (Yu,URI, the pred-
2011)
icate is foaf:name, and the object component of this triple pattern is a variable,
O padro identified
de triplabyapresentada
the ? character inna Figura
front 9 pode
of a string name.ser lido da seguinte maneira:

ache o valor da propriedade foaf:name definido por um recurso RDF identificado por
http:// danbri.org/foaf.rdf#danbri.
O conceito de padro de grafo SPARQL similar ao padro de triplas visto.
Um grafo SPARQL um conjunto de padres de triplas delimitadas por { e }
utilizadas para selecionar recursos de um dado grafo RDF. Da mesma forma que as
variveis podem se fazer presentes nos padres de triplas SPARQL, elas tambm
podem aparecer nos 6.3 SPARQL
grafos Query Language
SPARQL. 251
Nesse caso, cabe observar que se uma
varivel aparece em mltiplas triplas
First off, SPARQL,
a collection of tripleseus valores
patterns is calleddevero ser os
a graph pattern. mesmos{
In SPARQL,
and } are used to specify a collection of triple patterns. For example, the following
em todas elas. three triple patterns present one graph pattern:
{
?who foaf:name ?name.
?who foaf:interest ?interest.
?who foaf:knows ?others.
}
To understand
Figura 10: Exemplo how graph
de uma padro patternSPARQL.
de grafo is used toFonte:
select resources
(Yu, 2011)from a given RDF
graph, we need to remember one key point about the graph pattern: if a given vari-
O padro de grafo able shows up in multiplena
apresentado tripleFigura
patterns 10,
withintenta
the graph pattern, its qualquer
encontrar value in all
these patterns has to be the same. In other words, each resource returned must be
recurso RDF que possui todas
able as 3 propriedades
to substitute into all occurrences definidas (foaf:name,
of the variable. foaf:interest e
More specifically,

foaf:knows). 0. Create an empty set called resultSet.


1. Get the next resource from the given RDF graph. If there is no more resource
Das formas de consulta SPARQL
left, return resultSetapresentadas,
and stop. a mais comum SELECT
2. Process the first triple pattern:
query. Como visto na Figura 11, uma SELECT query inicia-se com a diretiva BASE
If the current resource does not have a property instance called foaf:name,
seguida de um nmero arbitrrio
go to 6. de assertivas PREFIX. Essas duas partes iniciais
Otherwise, bind the current resource to variable ?who and bind the value of
so opcionais e servem para abreviaes
property foaf:name detoURI.
variable ?name.
3. Process the second triple pattern:
If the current resource (represented by variable ?who) does not have a property
instance called foaf:interest, go to 6.
Otherwise, bind the value of property foaf:interest to variable
?interest.
41

A clusula SELECT especifica quais variveis, ou item de dados, precisam


ser recuperados da consulta e 252
posteriormente exibidos. A clusula6 FROM especifica
SPARQL: Querying the Semantic Web
ao SPARQL contra que grafo a pesquisa deve ser conduzida. A clusula WHERE
6.3.2 SELECT Query
contm o padro de grafo que especifica o resultado desejado. A ltima parte
The SELECT query form is used to construct standard queries, and it is probably the
geralmente chamada de modificadores deamong
most popular form consulta,
the four.que possuimost
In addition, como principal
of its features are shared by
other query forms.
propsito reorganizar as consultas.
A Figura 12 apresenta6.3.2.1
um Structure
exemploof de
a SELECT
uma Query
consulta SPARQL onde
List 6.2da
possvel ver todos os componentes shows the structure
consulta. Essa of aconsulta
SPARQL SELECT query:
resultar em todas as
propriedades com seus respectivos valores
List 6.2 que oofrecurso
The structure Danbri
a SPARQL SELECTpossui.
query
# base directive
BASE <URI>

# list of prefixes
PREFIX pref: <URI>
...
6.3 SPARQL Query Language 253
# result description
that the WHERE SELECT...
clause is not optional, although the WHERE keyword itself is optional.
However, for clarity and readability, it is a good idea not to omit WHERE.
The last part
# is generally
graph called query modifiers. The main purpose is to tell
to search
the SPARQL endpoint how to organize the query results. For instance, ORDER
FROM . . .
BY clause and LIMIT clause are examples of query modifiers. Obviously, query
# query pattern
modifiers are also optional.
WHERE {
...
6.3.2.2 Writing}
Basic SELECT Query
As we have discussed, our queries will be issued against Dan Brickleys FOAF
# query modifiers
document. And our first query will accomplish the following: since FOAF ontology
ORDER BY...
has defined a group of properties that one can use to describe a person, it would be
interesting to see which of these properties are actually used by Brickley.
a BASEList 6.3 and a list of
Figura 11: Estrutura As de shown in List
uma SELECT 6.2, a SELECT
Query. query
Fonte: (Yu,starts
2011) with directive
shows the query: PREFIX definitions which may contain an arbitrary number of PREFIX statements.
These two parts are optional and they are used for URI abbreviations. For example,
List 6.3 What FOAF properties did Dan Brickley use to describe himself?
if you assign a label pref to a given URI, then the label can be used anywhere in
1: base <http://danbri.org/foaf.rdf>
a query in place of the URI itself. Also note that pref is simply a label, we can
2: prefix foaf: name it<http://xmlns.com/foaf/0.1/>
anyway we want. This is all quite similar to Turtle language abbreviation
3: select *we have discussed in Chap. 2, and we will see more details about these two parts in
the upcoming query examples.
4: from <http://danbri.org/foaf.rdf>
5: where The SELECT clause comes next. It specifies which variable bindings, or data
6: { items, should be returned from the query. As a result, it picks up what information
7: <#danbri> to return from the query
?property ?value.result.
8: } The FROM clause tells the SPARQL endpoint against which graph the search
should be conducted. As you will see later, this is also an optional item in some
Since this is our first query, let us study it in greater detail. First off, note that
Figura 12: Exemplo cases,
dethere is no need
Consulta to specify the dataset that is being queried against.
SPARQL is not case sensitive, soSPARQL. Fonte:
all the keywords (Yu,be2011)
can either in small letters or
The WHERE clause contains the graph patterns that specify the desired results;
in capital letters.
it tells the SPARQL endpoint what to query for in the underlying data graph. Note
Now, lines 1 and 2 are there for abbreviation purpose. Line 1 uses BASE keyword
to define a base URI against which all relative URIs in the query will be resolved,
including the URIs defined with PREFIX keyword. In this query, PREFIX keyword
specifies that foaf will be the shortcut for an absolute URI (line 2), so the URI
foaf stands for does not have to be resolved against the BASE URI.
Line 3 specifies which data items should be returned by the query. Note that only
variables in the graph pattern (line 68) can be chosen as returned data items. In this
example, we would like to return both the property names and their values, so we
should have written the SELECT clause like this:
select ?property ?value
Since ?property and ?value are the only two variables in the graph pattern,
we do not have to specify them one by one as shown above, we can simply use a
42

2.6.1. SPARQL Endpoint


Um SPARQL endpoint pode ser entendido como uma interface atravs da
qual usurios, humanos ou aplicaes, realizam consultas a um banco de dados
RDF, utilizando a linguagem SPARQL, obtendo a resposta apropriada.
SPARQL endpoints podem ser classificados como genricos ou especficos.
Os SPARQL endpoints genricos trabalham com qualquer conjunto de dados RDF.
Os especficos, como o prprio nome sugere, apenas com conjuntos de dados RDF
especficos.
Eles tm sido grande aliado para o sucesso e disseminao da utilizao da
linguagem SPARQL, pois possibilitam a execuo de consultas de dados
disponveis no padro de Linked Data na Web. Alguns exemplos so DBpedia2,
Data.Gov3, dentre outros (PINHEIRO, 2011).

2.7. Consideraes Finais do Captulo


Neste captulo, apresentou-se os principais conceitos necessrios para o
completo entendimento deste trabalho. Alm disso, foi descrita uma
contextualizao do LARIISA, destacando os conceitos mais relevantes para o
presente trabalho de sua arquitetura: as inteligncias de governana de sade e a
sua base de dados de ontologias.
Foi apontado tambm conceitos importantes relacionados as tecnologias
envolvidas na abordagem de integrao de dados que utilizaremos na proposta
apresentada neste trabalho, como ontologias, Web semntica, Linked Data, RDF e
SPARQL.

2
http://dbpedia.org/sparql
3
environment.data.gov.uk/lab/sparql.html
43

3. TRABALHOS RELACIONADOS

Este captulo tem como objetivo mostrar trabalhos encontrados que focaram
na problemtica da integrao de dados de sade pblica, principalmente no Brasil.
Esses trabalhos resolvem a questo utilizando solues distintas: (i) Integrao de
dados de sade baseada na criao de um novo esquema de dados; (ii) Integrao
de dados de sade baseada na utilizao de Web Services; (iii) Integrao de dados
de sade baseada na abordagem de Data Warehouse; (iv) Integrao de dados de
sade baseada em ontologias. Espera-se com esse estudo, obter subsdios para a
formulao de contribuies relevantes para esta dissertao analisando a
desvantagens de cada abordagem.

3.1. Integrao de Dados de Sade Baseada na Criao de um


Novo Esquema de Dados
(Junior, 2009) apresenta em seu trabalho uma fundamentao terica para
um sistema de integrao de dados de sade, a nvel municipal, desenvolvido a
partir do ano de 2005 no DATASUS, o Integrador4. O Integrador foi uma iniciativa do
DATASUS de estudar uma possvel padronizao das informaes que eram
capturadas, tratadas e armazenadas nos seus SIS (SIA, SIH, APAC, SIM, SINASC,
SINAN, PNI, entre outros).
O Integrador teve seu desenvolvimento realizado de forma emprica,
utilizando-se dos levantamentos de necessidades junto aos gestores municipais, e
das experincias da equipe de desenvolvimento.
O Integrador tinha como objetivo ser um ponto central onde os gestores
municipais pudessem ter acesso aos dados de sade advindos dos SIS utilizados,
mas dados totalmente integrados, auxiliando esses gestores na tomada de deciso
de sade.
Com isso, a estratgia do Integrador foi construir uma nova base de dados,
construda considerando um novo vocabulrio, fruto de uma operao de avaliao
dos dados dos SIS envolvidos, para se conseguir uma padronizao. O trabalho de
padronizao no se limitou ao banco de dados do prprio sistema, mas tambm a

4
http://integrador.datasus.gov.br/INTEGRADOR/index.php
44

padronizao dos layouts de aquisio de dados dos sistemas envolvidos, a fim de


evitar a despadronizao futura.
(PINTO, 2006) apresentou em seu trabalho estratgias metodolgicas para
utilizao e integrao de bancos de dados e sistemas nacionais de informao em
sade para permitir a anlise de polticas de sade atravs de um observatrio de
sade. defendido o processo de integrao de dados a nvel estrutural como
estratgia de avaliao de sade. Em seu trabalho, ele avalia cada conjunto de
banco de dados a ser integrado, procurando identificar as possibilidades de
integrao e qual o potencial desses bancos integrados em conseguir proporcionar
uma avaliao da poltica de sade.
O trabalho de (Geremias, Jacobsen and Pereira, 2013) faz uma anlise das
dificuldades encontradas na criao de um sistema, no mbito da cidade de
Florianpolis, que integra dados de sade de sistemas locais e dos sistemas
mantidos pelo Ministrio da Sade. Para a criao do sistema, observa-se as
mesmas premissas existentes nos trabalhos anteriores, baseados na criao de
uma nica base de dados, destacando-se: (a) evitar a captao de informaes
duplicadas e o (b) uso de informaes padronizadas, como preconizadas pelo
Ministrio da sade.
Os trabalhos aqui relacionados possuem como desvantagens:
1. Alto custo de implantao e complexidade: criar um novo esquema
de dados, com dados integrados, principalmente se considerado um
quantidade considervel de bases de dados, como visto nos trabalhos
elencados, um processo muito custoso, principalmente de tempo. H
a necessidade de se padronizar o vocabulrio de dados, verificar
duplicidade de dados, fazer carreamento dos dados no novo esquema,
etc.;
2. Pouca escalabilidade: adicionar novos esquemas de dados a um
esquema de dados que j passou por um processo de integrao pode
significar refazer todo o processo;
3. Necessidade de minerao de dados para a descoberta de
conhecimento nos dados: a extrao de conhecimento de um
esquema de dados necessita ser feito em um processo a parte.
45

3.2. Integrao de Dados de Sade Baseada na Utilizao de Web


Services
(Spazziani and Nardon, 2004) propem uma arquitetura com o objetivo de
solucionar a problemtica da integrao de sistemas complexos e de grande porte
na rea de sade. Alm da integrao de dados propriamente dita, defendido que
tarefas que sejam semelhantes ou at mesmo idnticas, no precisam ser
reimplementadas, devem ser desenvolvidas de tal forma que possam se tornar
componentes compartilhados.
As tcnicas apresentadas nesse trabalho foram aplicadas na construo do
sistema de informao da Secretaria Municipal de Sade de So Paulo (SMS-SP),
que integra o sistema de captura do atendimento, com o Carto Nacional de Sade,
o Cadastro Nacional de Estabelecimentos de Sade, o sistema de Autorizao de
Procedimentos de Alta Complexidade e com um sistema de agendamento universal.
A tcnica baseada na identificao das funcionalidades que precisam existir
no sistema construdo e mape-las com os sistemas legados que vo ser
integrados. A integrao de dados que precisa existir entre os componentes e os
sistemas que possuem os dados necessrios para sua execuo realizada via
Web Services.
(Pires and Ruiz, 2010) apresentam em seu trabalho a problemtica da
interoperabilidade terminolgica entre as aplicaes mdicas, apresentando uma
soluo para a interoperabilidade entre sistemas. criado, ento, um Web Services
que utiliza o UMLS MetaThesaurus, um tesauro especfico da rea mdica. Esse
Web Service criado dever ser acessado por aplicaes mdicas que desejem obter
essa interoperabilidade terminolgica.
J a tese de (Hira, 2012) apresenta uma proposta de um arcabouo de Sade
Digital, que possibilita a integrao e interoperabilidade de servios de sade ou
sistemas de informao entre vrias instituies de sade, tendo o registro como
elemento principal de convergncia de informao do paciente, possibilitando aes
de cuidado ao paciente de forma integrada, para efetiva ateno do paciente e de
seu bem-estar. A interoperabilidade do ambiente conseguida tambm via Web
Services.
Os trabalhos aqui relacionados possuem como desvantagens:
46

1. No acesso aos dados brutos: abordagens de integrao baseadas


em Web Services promovem uma interoperabilidade entre sistemas, e
no uma integrao de dados propriamente dita (como mostrado no
Captulo 4). Dessa forma, um servio Web fornecer respostas apenas
quilo para o qual ele foi desenvolvido. O no acesso aos dados brutos
pode impossibilitar o processo de extrao de conhecimento dos
dados.
2. Dependncia do provedor do servio: os clientes dos servio
apenas obtm acesso quilo que o provedor do servio pode oferecer.
Caso o cliente necessite de uma nova informao que o servio
atualmente no oferea, o provedor poder se negar a reescrever o
servio para atender aos requerimentos de um cliente especfico. Outra
desvantagem com relao ao provedor do servio diz respeito a
disponibilidade do servio. Se por algum motivo o servio se tornar
indisponvel, no h como ocorrer o processo de integrao.
3. Semntica: a integrao via web services no garante que diferentes
servios tenham a mesma semntica associada a seus dados.

3.3. Integrao de Dados de Sade Baseada na Abordagem de


Data Warehouse
(Santos and Gutierrez, 2008) apresentam um trabalho de integrao de dados
de sade baseada em Data Warehouse, o MINERSUS. O MINERSUS um
ambiente computacional para a produo de informao analtica por meio da
minerao das bases de dados dos sistemas de informao do SUS, tendo sua
utilidade avaliada por meio de uma pesquisa de campo que permitiu a interao do
usurio com o ambiente.
A Figura 13 apresenta a arquitetura do MINERSUS, que no difere da
arquitetura padro do processo de modelagem de um Data Warehouse. Ela foi
desenhada partindo de algumas premissas que devia partir o sistema, considerando
os desafios encontrados na implantao de uma ferramenta analtica para a rea da
sade pblica (Santos and Gutierrez, 2004; Santos et al., 2006).
(Moraes, 1998) desenvolveu um prottipo de informao ambulatorial para o
SUS, baseado em data warehouse, como parte integrante de uma dissertao de
47

mestrado. Seu trabalho teve como objetivo mostrar as vantagens obtidas no


processo decisrio depois da implantao de um data warehouse.

Figura 13: Arquitetura do Ambiente Computacional do MINERSUS. Fonte: (Santos and Gutierrez,
2008)

Os trabalhos aqui relacionados possuem como desvantagens:


1. Desatualizao dos dados no repositrio: considerando fontes de
dados muito dinmicas, que sofrem atualizaes constantemente, a
abordagem de data warehouse pode no ser a mais indicada. O data
warehouse possibilita uma rpida resposta de consulta, mas as
respostas podem no considerar a situao real das fontes de dados.
2. Alto custo de implantao e manuteno: todo o processo de
extrao de dados das fontes, transformao e carregamento desses
dados para o repositrio demanda tempo e possui um alto custo, tanto
para implementar quanto para manter, principalmente se
considerarmos fontes dinmicas e em grande nmero.
3. Alto custo de escalabilidade: o alto custo de manuteno citado
acima, a grande quantidade de dados de um warehouse so variveis
que tornam a escalabilidade dessa abordagem um processo altamente
custoso.
48

3.4. Integrao de Dados de Sade Baseada em Ontologias


(Medeiros, Oliveira and Sousa, 2011) apresenta uma proposta de um sistema
Web usando ontologias para auxiliar na busca e recuperao de informaes de
sade, a OntS (Ontologia de Sade). O sistema desenvolvido na linguagem
JAVA, baseado em regras e combina o uso de ontologias para facilitar a integrao
de bases de dados heterogneas (SINAN e SIAB), alm de permitir a disseminao
do conhecimento.
Inicialmente a OntS se prope a representar os conceitos relacionados
vigilncia epidemiolgica e os agravos de notificao compulsria, e desenvolver
uma ferramenta para auxiliar aos usurios na busca e recuperao de informaes
com relao aos agravos. Contudo, a tendncia que essa base de conhecimentos
cresa, de forma a abranger novos conceitos j armazenados nas bases de dados
da secretaria de sade.
A OntS foi desenvolvida utilizando a metodologia Methontology (Fernandez,
Gomez-Perez and Juristo, 1997) e a ferramenta Protg5. Os conceitos e as
relaes entre os mesmos foram obtidos atravs de entrevistas com experts no
domnio, de levantamento bibliogrfico e de alguns dados disponveis em portais.
Aps a modelagem dos conceitos e relaes, faz-se a instanciao, realizada de
forma automtica com a gerao de cdigo OWL a partir das bases de dados dos
sistemas de informao em sade.
A ferramenta composta de uma interface de usurio, um mdulo de
inferncias, e um gerador de instncias. A interface de usurio onde o usurio
interage para elaborar sua consulta, exibindo tambm o resultado. O mdulo de
inferncias a parte responsvel por fazer a anlise na base de conhecimento. O
mdulo de instanciao responsvel pela gerao de instncias para a base de
conhecimento, conforme citado anteriormente.
(Gubiani, Port and Ornellas, 2003) apresentaram um ambiente que permite a
interoperabilidade de informaes do Pronturio Eletrnico do Paciente baseada na
interoperabilidade semntica. Metadados descrevem o significado das informaes
heterogneas e distribudas do PEP de acordo com vocabulrios especificos
especialmente para descrever o PEP, e agentes utilizam estas descries para
proporcionar a busca e a manipulao das informaes do PEP.

5
Protg um editor de ontologies open-source e um framework para manipulao de bases
de conhecimento. Acessvel atravs de http://protege.stanford.edu
49

(Nardon and Jr, 2004) demonstraram como a representao do conhecimento


baseado em ontologias pode ser utilizada na integrao de sistemas heterogneos
de sade. Foram usadas as tecnologias RDF e DAML+OIL para representar a
informao e como mecanismo de inferncia foi utilizado um Sistema de Bancos de
Dados Dedutivos.
(Lopes, Andrade and Wangenheim, 2011) desenvolveram uma ontologia
capaz de representar um vocabulrio nico relacionado aos atendimentos de
emergncia. Com essa ontologia, torna-se possvel que diferentes sistemas de
sade conversem entre si com o intuito de levantarem informaes relevantes de
pacientes, possibilitando um atendimento gil e de qualidade.
Os trabalhos aqui relacionados possuem como desvantagens:
1. Necessidade de um especialista para definio semntica: para
cada domnio de conhecimento se faz necessrio a presena de um
especialista para definio dos conceitos da ontologia;
2. Necessidade de relacionamento entre tesauros: na falta de um
tesauro nico que padroniza os conceitos de uma determinada rea de
conhecimento, se faz necessrio fazer um relacionamento entre os
diversos termos.

3.5. Consideraes Finais do Captulo


Este captulo objetivou apresentar os principais trabalhos relacionados
integrao de dados no domnio da sade, utilizando abordagens diferenciadas: (i)
Integrao de dados de sade baseada na criao de um novo esquema de dados;
(ii) Integrao de dados de sade baseada na utilizao de Web Services; (iii)
Integrao de dados de sade baseada na abordagem de Data Warehouse; (iv)
Integrao de dados de sade baseada em ontologias.
Para cada abordagem de integrao, foram relacionadas as suas
desvantagens. A anlise dessas desvantagens crucial para que se possa avaliar a
abordagem de integrao que melhor se encaixa ao LARIISA. Para a realizao de
um trabalho relevante necessrio que sejam apresentadas menores desvantagens
das que foram apresentadas nos trabalhos pesquisados.
Considerando o objetivo deste trabalho, de integrar dados heterogneos,
independentes e distribudos, relacionados sade, para que o LARIISA aumente
50

seu poder de inferncia, a plataforma se torna mais sensvel a determinadas


variveis, que devem ser consideradas e evitadas.
A escalabilidade uma caracterstica forte ao LARIISA. Como a plataforma
deve trabalhar com fontes diversas, o processo de integrao proposto deve permitir
facilmente a integrao por demanda. Abordagens de integrao de difcil
escalabilidade ou difcil manuteno devem ser evitadas.
Outra caracterstica importante so as informaes contextuais com as quais
a plataforma trabalha, ou seja, o LARIISA realiza suas inferncias tanto com dados
histricos, quanto com dados que representem uma situao no tempo real.
Abordagens de integrao que possuem uma logstica frequente de atualizao com
suas fontes, ou em tempo real, so as mais indicadas.
importante observar que os trabalhos aqui relacionados tambm tiveram a
finalidade de reforar a necessidade de integrao de dados no contexto da sade
pblica e das dificuldades encontradas no processo. Com esse estudo prvio,
espera-se obter subsdios para a formulao de contribuies relevantes para o
objeto de estudo deste trabalho.
51

4. PERCURSO METODOLGICO

Neste captulo apresentado o percurso metodolgico atravs do qual


construdo o presente trabalho: as escolhas, a definio do objeto de pesquisa e os
principais conceitos utilizados.

4.1. Introduo

Como visto no Captulo 2, na arquitetura do LARIISA, definida em (Oliveira et


al., 2010), as ontologias so responsveis pela representao das informaes de
contexto, formando uma base ontolgica. Essa abordagem visa facilitar questes de
interoperabilidade, compartilhamento e at mesmo as inferncias do sistema.
Pretende-se demonstrar ao final deste captulo que o uso de Linked Data se
mostra a melhor abordagem de integrao no contexto do LARIISA. A definio do
uso de ontologias na arquitetura do LARIISA para representar as informaes de
contexto, torna-se um dos fatores determinantes para se chegar a essa concluso,
j que a tecnologia de Linked Data baseia-se na representao ontolgica do
conhecimento. No entanto, para se chegar a essa concluso, se fez necessrio uma
intensa investigao sobre as possibilidades tecnolgicas existentes que poderiam
agir sobre a problemtica da integrao de dados no LARIISA com outros sistemas
e/ou outros dados de sade.
Este captulo tambm cita os percalos enfrentados durante a pesquisa, que
motivou a tomada de decises importantes sobre a abordagem que se daria a este
trabalho.

4.2. A Problemtica da Integrao de Informaes


A questo da integrao de informaes um assunto h muito tempo
discutido e pesquisado. um dos principais entraves e desafios para o avano da
cincia em diversos campos, onde grupos de cientistas esto de forma isolada
coletando dados e tentando colaborar uns com os outros, assim como se torna um
desafio e entrave para os governos que desejam, por exemplo, possuir uma gesto
integrada e efetiva entre seus diversos rgos.
52

A problemtica da integrao permeia a integrao de sistemas e a


integrao de dados. Relacionado integrao de sistemas geralmente o que se
busca facilitar o acesso informao, criando um ponto de acesso nico ela. J
com relao integrao de dados, dada uma determinada necessidade de
informao, tal necessidade pode ser melhor satisfeita a partir da combinao de
dados de diferentes sistemas de informao.
(Ziegler and Dittrich, 2007) apresentam 6 abordagens gerais de integrao, a
depender do nvel de arquitetura em que se trabalha essa integrao:
i. a integrao manual, onde os usurios precisam lidar com diferentes
interfaces de usurios e linguagens de consulta para realizar a integrao das
informaes que deseja;
ii. a integrao facilitada por uma interface comum ao usurio: tem-se a
facilidade de se ter uma interface comum para o usurio (como, por exemplo,
um web browser) para que ele possa colher a informao, mas como na
integrao manual, o usurio ser o responsvel pela homogeneizao e
integrao dos dados;
iii. integrao por aplicaes: abordagem que usa aplicaes integradoras que
acessam vrios conjuntos de dados e retornam resultados integrados para o
usurio;
iv. integrao por middleware: aplicaes com funes reutilizveis geralmente
utilizadas para resolver aspectos especficos de integrao;
v. acesso uniforme aos dados: neste caso, tem- se uma integrao lgica dos
dados. Os dados locais distribudos podem manter sua autonomia ;
vi. armazenamento de dados comum: os dados so fisicamente integrados e
armazenados em novo local.
A Figura 14 representa as abordagens de integrao mencionadas.
53

Figura 14: Abordagens gerais de integrao em diferentes nveis de arquitetura. Fonte: (Ziegler and
Dittrich, 2007)

Cada abordagem de integrao mencionada suporta diferentes tcnicas,


como, por exemplo: (i) integrao por esquema nico de dados, que representa
uma soluo de integrao do tipo manual; (ii) integrao baseada em
mediadores, que representa uma soluo do tipo acesso uniforme aos dados,
disponibilizando um ponto nico de consulta a vrias fontes de dados; (iii)
integrao por data warehouses, que realiza um armazenamento de dados
comum; (iv) integrao por web services, que realiza integrao de sistemas
atravs de componentes de softwares na Internet, representando uma abordagem
uniforme de acesso aos dados para a realizao de uma integrao manual ou de
uma integrao por aplicaes;. Pode-se afirmar que (i), (ii) e (iii) envolve a
integrao de dados propriamente dita e (iv) envolve a integrao de sistemas.
Sendo assim, so investigados os dois conceitos de integrao mencionadas:
de sistemas e de dados. Na integrao de sistemas, enfatizado a integrao por
Web Services, e na integrao de dados, destaca-se a integrao por esquema
nico de dados, por data warehouses e a integrao baseada em mediadores. Na
integrao por mediadores, tem-se especificamente a utilizao de ontologias como
forma de mediao. Sequencialmente, avalia-se, ento, as vantagens de utilizao
de tecnologia de Linked Data pelo LARIISA, e sua relao com a abordagem de
integrao baseada em mediadores.
54

4.3. Integrao de Sistemas


A integrao realizada a nvel de aplicao, ou integrao de sistemas, facilita
a comunicao entre sistemas, independente da linguagem de programao
utilizada para desenvolv-lo ou da plataforma sobre a qual o sistema executa. Um
contexto muito comum quando se precisa integrar aplicaes legadas e
autnomas para suportar processos de negcios, e os desenvolvedores no
possuem conhecimento sobre como os aplicativos funcionam ou sobre como usar
tecnologias antigas e/ou proprietrias.
Os trabalhos realizados por (Hansen, Madnick and Siegel, 2003; Umapathy
and Purao, 2010) apresentam uma relao dos Web Services como uma tecnologia
til para superar esses desafios da integrao de sistemas.
Seguindo os princpios SOA, os Web Services provm mecanismos que
possibilitam aplicaes comunicarem umas com as outras independente de
linguagens de programao e plataforma. Eles provm uma interface
padro para aplicativos e protocolos de Internet comunicarem com servios
disponveis (UMAPATHY; PURAO, 2010, traduo nossa).

ALONSO et al. (2004) conceitua Web Services como uma forma de expor as
funcionalidades de um sistema de informao, fazendo-o disponvel atravs de
padres Web. O uso de padres a chave para a interoperabilidade,
consequentemente facilita a integrao de sistemas. Tais padres so: (i) dados so
trocados entre sistemas utilizando o padro XML; (II) SOAP usado para enviar e
receber documentos XML; (iii) Servios de integrao so especificados utilizando
WSDL; (iv) Um registro de todos os servios publicado utilizando UDDI. Na Figura
15 a seguir, apresentada a arquitetura dos Web Services.
Apesar da frequente utilizao de Web Services na integrao de sistemas no
domnio da sade e das vantagens na utilizao de Web Services como tecnologia
de integrao, h tambm desvantagens, que para as caractersticas de integrao
exigidas pelo LARIISA, podem no ser interessantes. Dentre elas cabe destacar:
Dependncia do provedor de servios: o principal objetivo de se integrar
dados heterogneos ao LARIISA, dar maiores subsdios ao processo de
inferncia da plataforma. Quanto mais acesso a dados o LARIISA possuir,
melhor poder ser a inferncia realizada. A limitao do uso de Web Services,
nesse sentido, que os clientes do servio apenas obtm acesso aquilo que
o provedor do servio pode oferecer. Muito diferente de quando se obtm
dados brutos para integrao, como acontece com outras abordagens. Caso
55

o cliente necessite de uma nova informao que o servio atualmente no


oferea, o provedor poder se negar a reescrever o servio para atender aos
requerimentos de um cliente especfico;

Figura 15: Arquitetura dos Web Services. Fonte: (Castaeda, 2011)

Questes semnticas: a integrao via web services no garante que


diferentes servios tenham a mesma semntica associada a seus dados.
Problemas simples de semntica podem estar relacionados a diferentes
padres de unidades numricas utilizadas, como por exemplo, uma empresa
de telecom que requisite de suas filiais a largura de banda consumida por um
determinado cliente. O Web Service de uma das filiais pode responder em
Mbps, outro web service de outra filial pode responder em bps, ou seja no
existe um padro estabelecido. Uma abordagem capaz de resolver essa
questo a utilizao de um mediador de contexto que identificaria e
resolveria potenciais conflitos semnticos entre o cliente e o provedor do
servio Web (Hansen, Madnick and Siegel, 2003).

Mesmo avaliando as desvantagens de utilizao da integrao via Web


Services para o LARIISA, pode haver situaes em que sua utilizao no estaria de
um todo descartado. Web Services pode ser utilizado como forma de obteno de
56

dados de uma determinada fonte de dados. Por exemplo, uma fonte de dados do
SUS pode oferecer como nico mtodo de obteno de dados um Web Service.
Nesse caso, o LARIISA utiliza esse Web Service de terceiro apenas para captar
dados e realiza a integrao de dados com outras abordagens.

4.4. Integrao de Dados


O objetivo da integrao de dados oferecer acesso uniforme para um
conjunto de dados heterogneos e autnomos (Doan, Halevy and Ives, 2012).
Algumas dessas heterogeneidades so:
Modelos de dados: Fontes de dados podem apresentar modelos de dados
distintos: relacional, orientado a objetos, multidimensional, semiestruturado;
Esquema: Um esquema determina relaes, atributos, restries sobre os
dados das fontes. Fontes de dados podem ter esquemas altamente
estruturados e restritivos como podem ter esquemas apenas indicativos;
Codificao dos valores: Valores e itens de dados podem estar codificados de
maneira distinta. Por exemplo, um valor de pedido est em US$ em uma fonte
e em R$ em outra fonte; O item endereo pode ser um string em uma fonte e
uma tupla relacional em outra;
Linguagem de consulta: Algumas fontes podem apresentar linguagens de
consultas nativas (SQL, OQL, etc.) e outras no possuem esse recurso;
SGBD ou sistema de arquivo: Fontes que esto sendo gerenciadas por
SGBDs ou sistemas de arquivos e fontes sem gerenciamento;
Sistema operacional e hardware;
Semntica: Heterogeneidades semnticas esto relacionadas com o
significado da informao (Florescu, Levy and Mendelzon, 1998).

Existem vrias possibilidades de abordagens para integrao de dados, mas


de forma geral, pode-se colocar que a maioria dos sistemas optam pela abordagem
materializada ou virtualizada. Na abordagem materializada os dados so
carregados de fontes individuais e materializados em um banco de dados fsico, os
data warehouses, para onde so direcionadas as consultas. Na abordagem
virtualizada, os dados continuam em suas fontes e so acessados em tempo de
execuo das consultas, atravs de um esquema mediador.
57

Figura 16: Arquitetura bsica de um sistema de propsito geral de integrao de dados. Fonte:
Adaptado de Doan et al. (2012).

A Figura 16 mostra os componentes lgicos de ambas as abordagens de


integrao de dados. Iniciando pela parte inferior da figura, tem-se as fontes de
dados. Essas fontes de dados podem variar desde o tipo de modelo de dados at
ao tipo de consulta que elas suportam. Podem ser, por exemplo, dados do tipo
relacional, XML ou quaisquer outros dados estruturados.
Acima das fontes de dados esto os wrappers para a abordagem
virtualizada, ou extrator na abordagem materializada. Esse elemento est
relacionado programas cujo papel comunicar com as fontes de dados,
mandando consultas, recebendo as respostas e possivelmente aplicando at alguma
transformao nessas respostas.
Os usurios interagem com o sistema integrado de dados atravs de um
nico esquema, chamado de esquema mediador. O esquema mediador
construdo para a aplicao e apenas contm os aspectos de domnio relevantes da
aplicao. Dessa forma, no se faz necessrio conter todos os atributos presentes
nas fontes de dados. Na abordagem virtualizada, o esquema mediador no
armazena nenhum dado, o que no acontece na abordagem materializada. Na
abordagem virtualizada, o esquema mediador puramente lgico, utilizado apenas
58

para receber as consultas dos usurios (ou aplicaes) empregadas para o sistema
de dados integrados.
Os descritores das fontes de dados (ou transformaes na abordagem
materializada) podem ser considerados os principais elementos da arquitetura de
dados integrados. Eles conectam o esquema mediador aos esquemas de fontes de
dados. Esses descritores especificam as propriedades das fontes que o sistema
precisa saber em ordem para usar esses dados. Os principais elementos desses
descritores so os mapeamentos semnticos realizados entre os dicionrios de
dados das fonte de dados e do esquema mediador.
O processamento de consultas em um sistema integrado de dados difere de
um banco de dados tradicional de duas maneiras: primeiro as consultas que chegam
ao esquema mediador precisam ser reformuladas para que cheguem as fontes de
dados; segundo, a execuo das consultas precisa estar preparada para se adaptar,
j que o plano de execuo da consulta pode mudar medida que a consulta est
sendo executada. A Figura 17 ilustra o processo de consultas em um sistema
integrado de dados.

Figura 17: Processamento de consultas em um sistema integrado de dados. Fonte: Adaptado de


Doan et al. (2012).
59

4.4.1. Integrao por Criao de um Esquema de Dados nico


Essa abordagem objetiva, atravs da criao de um nico esquema de dados,
substituir os diversos esquemas existentes que se encontram pulverizados em
sistemas de informao diversos. O esquema de dados resultante da integrao
necessrio, por exemplo, para representar os requerimentos de uma aplicao. Essa
abordagem de integrao de dados foi encontrada principalmente em trabalhos
relacionados ao SUS, que como j citado, possui uma situao peculiar de ter
vrios SIS que no conversam uns com os outros. Essa caracterstica acaba por
resultar em vrios dados duplicados, que foram modelados de uma forma em um
sistema e de outra forma em outro sistema, mas que significam a mesma coisa.
Nessa abordagem, o processo de integrao dos esquemas envolve trs
principais estgios:
Anlise de conflitos: nessa etapa, diferenas entre os esquemas so
identificadas. Por exemplo, conceitos similares que so representados em
diferentes formas;
Resoluo de conflitos: nessa etapa, os conflitos identificados na etapa
anterior so resolvidos. Por exemplo, um mtodo nico de representao de
conceitos semelhantes dever ser decidido. Esse processo pode envolver a
discusso dos problemas com os usurios ou corrigindo erros nos esquemas.
Fuso dos esquemas: nessa etapa, os esquemas so fundidos em um
esquema nico usando as decises feitas durante a etapa de resoluo de
conflitos.
A Figura 18 ilustra o processo.

Figura 18: Processo de Integrao por Criao de um esquema nico de dados. Fonte: Criao do
autor.
60

Como j comentado, foram encontrados alguns trabalhos que utilizaram essa


abordagem para realizar a integrao de informaes na rea da sade, como
tambm j mencionado no captulo 3.
Esse tipo de abordagem de integrao possui um alto custo de implantao,
principalmente se for considerado uma quantidade grande de bases de dados a ser
integrada. Tambm uma abordagem de difcil escalabilidade, em situaes onde
h a previso de integrao constante de outros esquemas de dados. um mtodo
a ser utilizado em situaes onde se j tem definido quais esquemas de dados sero
integrados, sem nenhuma expectativa de integrar esquemas de dados
posteriormente.
Essas caractersticas so totalmente incompatveis para a realidade do
LARIISA, onde espera-se a integrao de diversas fontes de dados, independente
se elas acontecero em um mesmo momento ou de forma escalvel. Integrao por
criao de um esquema nico de dados uma abordagem mais apropriada quando
se tem o objetivo que o esquema de dados integrado sirva de base de dados para
uma aplicao especfica.

4.4.2. Integrao por Data Warehouse


Como citado por (Doan, Halevy and Ives, 2012) data warehouse uma das
arquiteturas de integrao de dados mais utilizadas por empresas que precisam
manter um histrico de seus dados, para auditoria ou anlise, e para auxiliar a
tomada de deciso, atravs de aplicaes Online Analytic Processing (OLAP)
aplicaes que auxiliam a tomada de deciso a partir das caractersticas de dados
integrados -, por exemplo.
Nesse modelo, todos os dados necessrios so traduzidos para um esquema
alvo e copiado para um sistema gerenciador de banco de dados (que pode ser do
tipo paralelo ou distribudo). Os dados passam por uma rotina de atualizao, a
depender de cada estratgia de manuteno. Definir um data warehouse envolve
duas tarefas principais: desenvolver o esquema central de banco de dados e o
designe fsico da arquitetura, e definir o conjunto de operaes de
Extrair/Transformar/Carregar (ETL Extract/Transform/Load). A Figura 19 apresenta
como se estabelece a arquitetura de um data warehouse.
61

Figura 19: Componentes Lgicos de um Data Warehouse. Fonte: Adaptado de Doan et al. (2012).

As fontes de dados podem ser sistemas de arquivos, banco de dados,


documentos HTML, documentos XML, entre outras. Conectado com cada fonte de
dados esto os ETLs, componentes de software cuja funo a extrao de dados
das fontes, transformao desses dados conforme regras de negcios e por fim a
carga dos dados no data warehouse. Os usurios submetem suas consultas
diretamente ao data warehouse e ali so processadas, no havendo nenhuma
interao com as fontes de dados. A depender da implementao do data
warehouse podem haver tambm monitores, que detectam automaticamente
modificaes nas fontes, repassando as alteraes relevantes.
Como citado por (Gupta and Mumick, 1995; Widom, 1995) um dos principais
problemas a ser considerado na arquitetura de data wareshouses diz respeito
manuteno do repositrio de dados, estando sempre consistente com os dados das
fontes, considerando que essas fontes de dados continuem ativas, podendo assim
sofrer alteraes. Neste caso, existem duas abordagens para a manuteno da
consistncia:
Rematerializao de viso: o contedo do data warehouse descartado e a
viso novamente materializada com os novos dados das fontes.
62

considerado um mtodo muito custoso uma vez que elimina todo o repositrio
e cria um novo;
Manuteno incremental: as alteraes nas fontes de dados so
propagadas incrementalmente para o data warehouse (Batista, 2003).

Apesar da existncia de vrios cases de utilizao de data warehouses como


abordagem de integrao de dados na rea da sade, como visto no Captulo 3,
essa abordagem possui caractersticas no muito vantajosas para o contexto do
LARIISA, como descrito a seguir:
Atualizao dos dados no repositrio: como j citado previamente, a
manuteno do repositrio um dos principais problemas na abordagem de
data warehouse. Considerando o dinamismo das fontes de dados que sero
integradas ao LARIISA, assim como o grande nmero de fontes de dados
utilizadas, a abordagem de data warehouse pode no ser a mais indicada. O
data warehouse possibilita uma rpida resposta de consulta, mas as
respostas nunca so condizentes a situao real das fontes de dados. No
contexto onde existem fontes de dados que mudam constantemente com o
tempo e em alto nmero, manter o repositrio de dados sempre atualizado,
torna-se um grande desafio, principalmente porque todo o processo de
extrao de dados das fontes, transformar e carregar para o repositrio
demanda tempo e tambm possui um alto custo, tanto para implementar
quanto para manter;
Essncia da abordagem de data warehouse para dados histricos: como
mencionado no primeiro pargrafo desta seo, a abordagem de integrao
de dados por data warehouse atende, em sua maioria, necessidades
especficas, geralmente de empresas que desejam manter dados histricos
de suas transaes para realizao de anlise. No contexto do LARIISA, as
fontes de dados a serem integradas no necessariamente se constituem de
dados histricos, mas de fontes de dados que armazenem informaes de
contexto, que para a realizao de inferncia pode ser necessrio uma
anlise histrica ou apenas informaes de outros provedores de contexto
integradas.
63

4.4.3. Integrao Baseada em Mediadores


De forma geral a arquitetura baseada em mediadores se assemelha a
arquitetura bsica de um sistema integrador mostrado na Figura 16. No trabalho de
(Wiederhold, 1992), os mediadores so definidos como a interface entre as
aplicaes de usurios e as fontes de dados, tornando as aplicaes independentes
dessas fontes.
Como reforado na Figura 20, o mediador possui uma viso integrada das
fontes de dados, assim como uma descrio dessas fontes. O usurio, a partir de
uma interface, submete consultas ao mediador, que por sua vez decompe essas
consultas em subconsultas menores direcionadas s fontes de dados. Essas
subconsultas devem passar pelos wrappers, que realizam a traduo dessas
subconsultas no formato e linguagem que as fontes individuais suportam. Quando
as fontes individuais respondem s subconsutas, os wrapper tambm possuem a
funo de traduzir tais respostas em um modelo de dados comum, que
compreendido pelo mediador.

Figura 20: Arquitetura de Integrao de Dados Baseada em Mediadores. Fonte: (Batista, 2003)

A arquitetura de mediadores possui como principal problemtica o custo e o


tempo elevados para se processar consultas em tempo real, onde se fixam as
principais pesquisas na rea.
A existncia de trabalhos que realizaram integrao de dados no domnio da
sade utilizando apenas os conceitos clssicos da arquitetura baseada em
mediadores, no foi encontrada. O que est descrito nas sees seguintes que a
arquitetura baseada em mediadores , na maioria das vezes, associada utilizao
64

de tecnologias de representao do conhecimento, em especial, as ontologias. E


nesse caso, sim, observa-se uma quantidade considervel de trabalhos publicados.

4.4.4. Integrao de Dados e a Representao do Conhecimento


Integrao de Dados baseada em Ontologias
Muitos aspectos da integrao de dados tambm podem ser vistos atravs da
lgica da representao do conhecimento, com a modelagem de relacionamentos
entre fontes de dados ou sobre fontes de dados e esquema mediador, tendo as
ontologias como principal ferramenta para realizao dessa modelagem.
Atravs de ontologias possvel descrever explicitamente a semntica das
fontes de informao, possibilitando a identificao e associao dos conceitos
semanticamente correspondentes entre as fontes. Conforme apresentado por
(Wache et al., 2001), existem ainda trs possveis formas diferentes de realizar a
descrio semntica dessas fontes. Como visto a seguir:
Ontologia nica essa abordagem utiliza uma ontologia global que prov
um vocabulrio compartilhado para a especificao da semntica do domnio
que pertencem as fontes. um tipo de abordagem utilizada quando as fontes
de informao compartilham da mesma viso em um domnio, inclusive a
nvel de granularidade. Essa abordagem muito susceptvel a mudanas nas
fontes de dados que afetem a conceitualizao do domnio representado pela
ontologia. Tais mudanas podem significar alteraes na ontologia global,
assim como nos mapeamentos feitos entre as outras fontes de dados. A
Figura 21 apresenta a abordagem de ontologia nica.

Figura 21: Abordagem de descrio semntica por ontologia nica. Fonte: Adaptado de (Wache et
al.,2001)
65

Mltiplas Ontologias nessa abordagem cada fonte de dados descrita por


sua prpria ontologia, o que facilita os casos de mudana, quando h a
necessidade de alterao, adio ou remoo de fontes. Por outro lado, a
falta de um vocabulrio comum torna extremamente difcil a comparao
entre essas ontologias-fonte. Como forma de superar esse problema, h a
necessidade de se especificar tambm mapeamentos entre ontologias, que
identifica termos semanticamente correspondentes entre as ontologias-fonte.
A Figura 22 a seguir, representa a abordagem baseada em mltiplas
ontologias descrita.

Figura 22: Abordagem de descrio semntica por mltiplas ontologias. Fonte: Adaptado de (Wache
et al., 2001)

Abordagem Hbrida essa abordagem intenciona superar os problemas das


duas abordagens anteriores. similar a abordagem de mltiplas ontologias,
onde cada fonte descrita por sua prpria ontologia, mas como na
abordagem de ontologia nica, cada ontologia-fonte construda sob um
vocabulrio nico compartilhado. Esse vocabulrio compartilhado, que
tambm pode ser descrito por uma ontologia, contm vocabulrios primitivos
que definem o domnio. As ontologias-fonte, que possuem termos mais
complexos, so construdas a partir do vocabulrio compartilhado. Como
vantagem dessa abordagem hbrida, destaca-se a possibilidade de facilmente
adicionar novas fontes. A desvantagem que as ontologias preexistentes no
podem ser reutilizadas com facilidade, pois todas as ontologias-fonte devem
referir-se a um vocabulrio comum. A Figura 23 a seguir ilustra essa
abordagem hbrida.
66

As ontologias se destacam no s na descrio semntica de fontes de


dados, mas (Wache et al., 2001) explica que podem ser encontrados outros papis
para as ontologias. Por exemplo, as ontologias podem ser utilizadas como modelo
de consulta e para verificao das descries de integrao, que podem ter sido
definidas tanto por usurios como por algum processo automatizado.

Figura 23: Abordagem hbrida de descrio semntica baseada em ontologias. Fonte: Adaptado de
(Wache et al., 2001)

No contexto do LARIISA, a abordagem de integrao por interoperabilidade


semntica, ou seja, atravs de ontologias, a mais interessante, analisando-se as
abordagens de integrao apresentadas at aqui, e as caractersticas intrnsecas
plataforma. Como j discutido no Captulo 3, o LARIISA exige alta escalabilidade,
baixo custo de manuteno e base de dados integrada sempre atualizada com as
fontes de dados. Alm do fato do LARIISA j utilizar ontologias na modelagem das
informaes de contexto, tem-se nessa abordagem uma ampla utilizao por parte
da comunidade acadmica, at por conta do crescimento dos conceitos da Web
semntica, onde as ontologias so tendncias de uso na hora de modelar os
conceitos de um determinado domnio.
67

4.5. A Entrada do Conceito de Linked Data ao LARIISA


Como parte do processo investigativo, foram realizados encontros ao grupo
de pesquisa ARIDA (Advanced Research in DAtabase), instalado no LIA
(Laboratrios de Pesquisa em Cincia da Computao da UFC). Nas ocasies
fomos apresentados aos trabalhos da Prof. Dra. Vnia Maria Ponte Vidal6, que
possui grande atuao nas reas de integrao semntica, integrao de dados na
web e descoberta de conhecimento em dados de mobilidade.
Nesses encontros, surgiu a oportunidade de conhecer as possibilidades que a
tecnologia de Linked Data pode proporcionar integrao de dados na rea da
sade. Roberval Mariano7, integrante do grupo de pesquisa, e orientando de
doutorado da Prof(a) Vnia, apresentou sua pesquisa, relacionado a integrao de
dados governamentais abertos no domnio de compras municipais com o intuito de
fiscalizar arbitrariedades legais, por exemplo, fornecedores considerados inidneos
fornecendo para a administrao pblica.
Relacionando seu trabalho com os objetivos do LARIISA, Mariano apresentou
um exemplo de integrao de fontes de dados no domnio de sade via Linked Data
obtendo, dessa forma, informaes que poderiam instruir melhor decises do gestor
de sade. Essas fontes de dados poderiam ser: Naes Unidas, OMS, UNICEF,
Ministrio da Sade, Secretarias de Sade (estado e municpio) e outras, que j
fornecem dados abertos. Outras fontes no diretamente ligadas sade tambm
poderiam ser integradas, como a ANVISA, que disponibiliza, para consulta, lista de
preos de medicamentos para compras pblicas, que contm o teto de preo pelo
qual entes da Administrao pblica podem adquirir medicamentos, e a GS1, com
seus padres de identificao de produtos.
A Figura 24, mostra a relao das fontes citadas no exemplo proposto por
Mariano. Nessa integrao, tem-se: as fontes relacionadas diretamente com as
entidades ligadas sade ou ao desenvolvimento humano (UNICEF, UNITED
NATIONS, World Health Organization, PNUD), que pode fornecer parmetros e/ou
indicadores, assim como outras informaes de sade de esfera mundial; uma
modelagem ontolgica que relaciona doenas e suas drogas; a ANVISA que
disponibiliza preos de remdios para a administrao pblica; a GS1, que atravs
de seus cdigos, pode-se identificar o remdio, e suas apresentaes (cartela ou

6
http://lattes.cnpq.br/9431229866203038
7
http://lattes.cnpq.br/9428387943972577
68

caixa, por exemplo); e demais fontes j utilizadas para fiscalizao de compras


municipais.

Figura 24: Possibilidades de Integrao de fontes abertas no domnio de sade. Fonte: (Roberval,
2012)

Nesse cenrio, pode-se obter respostas s questes:


1. A administrao pblica est adquirindo remdios adequados s doenas?
(Atravs da ontologia de drogas e doenas pode-se saber quais drogas ou
medicamentos esto aptos a tratar uma determinada doena);
2. O preo do remdio adquirido pela administrao pblica est condizente com
a sua apresentao? (Atravs das informaes da ANVISA e GS1 pode-se
verificar se a administrao pblica no est comprando uma cartela de
remdios pelo preo de uma caixa);
3. A administrao pblica est adquirindo remdios a um preo adequado?
(Atravs das informaes da ANVISA pode-se verificar se a administrao
pblica no est adquirindo remdios superfaturados).

A partir dessa nova tica, das possibilidades que o Linked Data apresenta,
essa tecnologia em conjunto com uma abordagem baseada em
69

mediadores e ontologias, como a melhor estratgia de integrao de dados para o


LARIISA, mesmo cientes que no contexto do LARIISA as fontes de dados podem
no estar disponibilizadas em um padro aberto, o que no incapacita a utilizao
da tecnologia, como mostrado no Captulo 5.

4.6. Consideraes Finais do Captulo


Este captulo apresentou os caminhos percorridos para se obter os objetivos
definidos por esta dissertao. Primeiramente, foi realizada uma investigao sobre
os principais mtodos de integrao de informaes. Aps anlise das tcnicas
pesquisadas, que envolveram integrao de sistemas via Web Services e a
integrao de dados propriamente dita, atravs das tcnicas de esquema nico de
dados, data warehouse e utilizao de mediadores, conclui-se que a tcnica de
integrao pela utilizao de mediadores a mais adequada considerando o
contexto de aplicao no LARIISA, com destaque para a realizao de mediao
atravs de ontologias.
Considerando a necessidade de se aumentar a expertise na integrao de
dados baseada em ontologias, foram abordadas tambm as visitas realizadas ao
ARIDA como parte do processo investigativo. Atravs do conhecimento de trabalhos
relevantes dentro da rea de integrao semntica, integrao de dados na web e
descoberta de conhecimento em dados de mobilidade, foi possvel conhecer a
tecnologia de Linked Data, que tambm utiliza ontologias para mediar a integrao,
e as vantagens em sua utilizao, atravs de exemplos de aplicabilidade da
tecnologia ao LARIISA.
No prximo captulo apresentada a descrio do modelo de integrao
proposto.
70

5. PROCESSO DE INTEGRAO DE DADOS PARA O LARIISA

Este captulo apresenta a especificao do processo de integrao de dados


proposto para o LARIISA, utilizando uma abordagem baseada em mediadores,
ontologias e Linked Data, levando em considerao fontes de dados heterogneas.

5.1. Arquitetura de Mediao de Trs Nveis baseado em


Ontologias para Integrao de Dados no Padro Linked Data
O processo de integrao proposto adota o framework de mediao de trs
nveis baseado em ontologias, para integrao de dados no padro Linked Data,
proposto em (Pinheiro, 2011). O framework baseia-se na abordagem hbrida de
integrao por ontologias e as utiliza tanto para descrio semntica das fontes de
dados quanto como linguagem para representar o esquema de mediao. A
arquitetura do framework e seus principais componentes apresentada na Figura
25.

Figura 25: Arquitetura de trs nveis baseada em ontologias. (MAGALHES, 2012)

O esquema de mediao, representado na Figura 25 pela ontologia de


domnio, fornece uma representao conceitual do domnio, definindo um
vocabulrio compartilhado com um conjunto de axiomas para descrever o contedo
de todas as fontes de dados, alm de prover ao usurio o acesso aos dados atravs
de uma interface de consulta uniforme para facilitar a formulao da consulta.
A ontologia de aplicao (OA) descreve as fontes de dados atravs de um
subconjunto do vocabulrio da ontologia de domnio. Dessa forma, os processos de
71

reformulao de consultas se tornam mais simples, pois as ontologias de aplicao


so baseadas nas mesmas primitivas, e nenhuma inferncia necessria.
As ontologias fonte representam os dados em formato de Linked Data,
definidos em termos de RDFS e OWL. So acessados pela ontologia de aplicao
via wrappers. Os dados reais no necessariamente precisam estar em um
repositrio RDF, pode-se utilizar um banco de dados relacional com um wrapper que
publica dados de banco de dados relacionais no padro Linked Data, o que condiz
com o contexto do LARIISA.
Os mapeamentos de mediao especificam os conceitos da ontologia de
domnio em termos das ontologias de aplicao, e os mapeamentos locais definem
os conceitos das ontologias de aplicao em termos dos elementos de seu
esquema-fonte correspondente.

Figura 26: Arquitetura de integrao de 3 nveis aplicada ao LARIISA

A Figura 26 apresenta a aplicao desta arquitetura de integrao ao


LARIISA. So destacadas as fontes de dados a serem integradas, que no LARIISA,
72

so na sua maioria banco de dados relacional e planilhas, mas que podem ser de
qualquer tipo, inclusive fontes de dados j no padro Linked Data. Em caso de
fontes de dados que no estejam no padro Linked Data, preciso que exista um
wrapper especfico que traduza esses dados para RDF.
O repositrio RDF representa as ontologias fonte da arquitetura de 3 nveis
apresentada. Ele pode ser referente a dados originalmente j no padro Linked Data
ou ser resultado da traduo de um tipo de fonte para RDF. Existem wrappers que
traduzem um tipo de fonte para RDF on-the-fly, ou seja, os dados so convertidos
apenas quando solicitados, eliminando a necessidade de replicar os dados em um
repositrio RDF dedicado.
A ontologia de domnio descreve conceitualmente o LARIISA e as consultas
direcionadas ao sistema so todas em funo do vocabulrio definido. Criar uma
representao conceitual completa do LARIISA uma tarefa bastante complexa,
isso porque o LARIISA foi pensado para ser uma plataforma totalmente escalvel,
onde os dados vo sendo integrados de acordo com a necessidade. Sendo assim,
como apresentado na Figura 26, considera-se que a ontologia de domnio do
LARIISA construda considerando uma abordagem de subdomnios, isto , a
ontologia de domnio LARIISA definida por sub-ontologias que respondero a
questes especficas.
As ontologias de aplicao, como j mencionado, descrevem as fontes RDF
em funo do vocabulrio da ontologia do LARIISA.

5.2. Especificao do Processo de Integrao de Dados


O processo de integrao de dados de sade para o LARIISA, considerando
fontes heterogneas e distribudas, proposto neste trabalho, composto por 6
passos a saber: (i) Definio da ontologia de domnio; (ii) Seleo das fontes de
dados; (iii) Triplificao dos dados (ou converso); (iv) Modelagem das ontologias de
aplicao; (v) Definio dos mapeamentos locais e de mediao; e o (vi)
Processamento de consultas. A Figura 27 a seguir ilustra o processo.
73

Figura 27: Passo a passo do processo proposto de integrao de dados para o LARIISA. Fonte:
Elaborao prpria

O processo proposto pode ser utilizada em dois cenrios dentro do LARIISA:


Cenrio 1: aplicao do processo para realizar a integrao de bases de
dados definidas, armazenando os dados integrados, ou seja, as tuplas RDF
resultantes dessa integrao, na base de conhecimento do LARIISA, ou seja, no
componente Ontology Base da arquitetura. Sendo assim, a metodologia ser
aplicada sempre que existir a necessidade de aumentar a base de conhecimento do
LARIISA.
Cenrio 2: aplicao do processo para suportar uma demanda especfica,
uma aplicao do LARIISA, que necessite da integrao de uma base de dados
definida para responder esta demanda. Neste caso a aplicao submeter
consultas ao esquema mediado criado, ou seja, submeter consultas ao domnio do
LARIISA.

5.2.1. Definio da Ontologia de Domnio


O primeiro procedimento do processo especificado a construo da
ontologia de domnio que responder as questes demandadas. A ontologia de
domnio pode ser criada por um editor de ontologias, como o protg, seguindo uma
metodologia de construo de ontologias. A construo de ontologias pode
demandar profissionais especficos de projetos, assim como especialistas da rea
de conhecimento para validao. De qualquer forma, so citados a seguir os
princpios norteadores para a construo de ontologias:
74

1. Responder s seguintes perguntas para determinar o escopo da ontologia:


- qual domnio a ontologia cobrir?
- para que ser utilizada a ontologia?
- para que questes a ontologia fornecer respostas?
- quem ir utilizar e manter as ontologias?
2. Utilizar, se possvel, ontologias j existentes;
3. Enumerar os termo importantes;
4. Definir os conceitos e sua hierarquia;
5. Definir as propriedades dos conceitos e os relacionamentos entre eles.
Como mencionado na seo anterior, a ontologia de domnio pode estar
relacionada a uma demanda especfica de integrao de dados para servir uma
aplicao do LARIISA, ou pode estar relacionado a todo o domnio de conhecimento
da plataforma.

5.2.2. Seleo das Fontes de Dados


O prximo passo aps criado a Ontologia de Domnio a seleo de fontes
relevantes para o problema. As fontes de dados podero estar disponveis na Web
de forma aberta, mas no necessariamente publicadas no padro Linked Data.
Sendo assim, temos os seguintes cenrios:
Cenrio 1: fontes de dados no padro Linked Data. Este o melhor
cenrio. As fontes de dados esto disponveis publicamente na Web, no
padro Linked Data. Cada fonte tem associado a ela um SPARQL endpoint.
Cenrio 2: fontes de dados publicadas na Web sem estarem no padro
Linked Data. Neste caso, os dados esto disponveis da Web em outros
formatos, como CSV, XML, planilhas, e outros. Esses dados, depois de
obtidos, devero passar por um wrapper especfico que traduza os dados do
seu formato original para RDF.
Cenrio 3: fontes de dados no publicadas na Web, mas disponveis a
partir de um Web Service. Neste caso, os dados so obtidos a partir de um
Web Service, mas como no cenrio 2 podem estar em diferentes formatos.
Devero passar por um wrapper especfico que traduza os dados do seu
formato original para RDF.
Cenrio 4: fontes de dados no publicadas nem disponveis atravs de
um Web Service. Se os dados no estiverem disponveis publicamente na
75

Web ou a partir de um Web Service, provavelmente ser necessrio a


obteno dos dados diretamente com o mantenedor, o que pode significar a
obteno de um esquema de dados relacional. Como no cenrio 2 e 3, os
dados devem ser submetidos a um wrapper especfico que traduza os dados
relacionais para RDF.

5.2.3. Triplificao dos Dados e/ou Converso


Exceto em fontes de dados do Cenrio 1, discutido na seo anterior, onde os
dados j esto no formato RDF, publicados, todos os outros cenrios exigem que os
dados sejam triplificados. Consequentemente, a triplificao dos dados exigir a
manuteno de componentes que integram a infraestrutura de Web Semntica: o
RDF Store (ou triple store), que como j citado em sees anteriores, um banco de
dados tunado para armazenar e obter dados de triplas; e o RDF Query Engine, o
mecanismo de busca que fornece a capacidade de recuperar informaes de um
RDF Store, utilizando uma linguagem de consulta, o SPARQL.
No trabalho de (Cifuentes-silva, Sifaqui and Labra-gayo, 2011) encontra-se
um processo mais detalhado de como criar e disponibilizar Linked Data. O trabalho
considera os seguintes passos: (i) contextualizao, (ii) projeto da ontologia, (iii)
modelagem do grafo RDF, (iv) implementao dos endpoint SPARQL, (v)
implementao do grafo RDF, (vi) atualizao do servio grfico e (vii) opcional
visualizao dos grafos.
Diversas ferramentas e mtodos tambm so citadas pelo W3C8 capazes de
realizar a triplificao de dados para RDF. Especificamente para converter planilhas
em RDF algumas ferramentas se destacam mais. Para este trabalho considerada
a seguinte sequncia de passos para a converso dos dados:
(i) Projeto de Ontologia das Fontes. As fontes de dados precisam ser
descritas atravs de uma ontologia. So as Ontologias Fonte descritas na
arquitetura de trs nveis (Figura 25). Um ponto importante a criao de uma URI
para a publicao da ontologia.
(ii) Seleo e aplicao de ferramenta de converso de dados para RDF.
(iii) Mecanismo de atualizao das fontes. preciso estabelecer um
processo de atualizao onde os grafos RDF publicados possam refletir as
atualizaes das fontes de dados. Porm, o estabelecimento desse processo ir

8
http://www.w3.org/wiki/ConverterToRdf
76

depender do tipo de ferramenta utilizada para a converso dos dados em RDF. Se a


ferramenta escolhida for baseada em uma abordagem virtualizada, a prpria
ferramenta estar responsvel pela atualizao dos grafos. Porm, se a ferramenta
utilizar uma abordagem materializada, a rotina de atualizao deve ser bem definida.

5.2.4. Modelagem das Ontologias de Aplicao


Aps a triplificao das fontes, hora de gerar as ontologias de aplicao,
que so obtidas aps a realizao dos matchings entre cada ontologia fonte e a
ontologia de domnio. O vocabulrio de uma ontologia de aplicao composto de
classes e propriedades que so o subconjunto da ontologia de domnio combinada
ontologia fonte.

5.2.5. Definio dos Mapeamentos Locais e de Mediao


Aps criada as ontologias de aplicao, passa-se para a etapa de definio
dos mapeamentos locais e de mediao. Os mapeamentos consistem de uma etapa
importante para o esquema de mediao, como citado na seo introdutria deste
captulo, fazendo o papel de cola entre a ontologia de domnio, ontologias de
aplicao e ontologias fonte.

5.2.6. Processamento de Consultas


Depois de definido o esquema conceitual do mtodo de integrao, com a
criao das ontologias de domnio, de aplicao e os mapeamentos locais e de
mediao, deve-se definir como se dar o processo de consulta sob esse esquema
mediado.
O mtodo para o processamento de consultas no framework proposto por
(Pinheiro, 2011) baseado em dois mdulos principais: um mdulo responsvel por
gerar planos de execuo de consultas federadas (consultas que sero realizadas
em mltiplas fontes de dados) e um mdulo responsvel pela execuo desses
planos. A estratgia de gerao dos planos de execuo de consultas federadas
consiste resumidamente de trs passos:
1. Traduo. Uma consulta SPARQL Q submetida ao esquema mediador,
expressada em termos de ontologia de domnio, e transformada numa rvore que
representa a estrutura da consulta.
2. Reformulao. A consulta Q reformulada, baseada nos mapeamentos de
mediao, em um conjunto de sub-consultas sob as ontologias de aplicao. Cada
77

sub-consulta ento reformulada, baseado nos mapeamentos locais, em termos de


consulta sobre as ontologias fonte.
3. Otimizao. Este passo objetiva otimizar ainda mais as sub-consultas que
sero feitas sobre os dados RDF, de forma a reduzir seus custos.
Aps a execuo desses passos as sub-consultas so ento submetidas ao
SPARQL endpoint de cada fonte. Os resultados das sub-consultas so retornados
para o mediador onde o resultado final construdo de acordo com o plano de
execuo otimizada.

5.3. Arquitetura para Aplicaes LARIISA


Nos casos em que os dados integrados pelo processo proposto servir uma
demanda especfica, uma aplicao LARIISA, como descrito no Cenrio 2, seo
5.2, apresentada uma arquitetura que define a relao entre a aplicao, o
esquema mediado de dados e as fontes de dados RDF (Figura 28). O mtodo de
integrao proposto considera a existncia de uma aplicao que submeter ao
esquema mediado uma consulta SPARQL previamente definida. Diferente do
proposto por (Pinheiro, 2011), os planos de execuo de consultas propostos neste
trabalho no sero gerados dinamicamente, mas sero definidos a priori, em tempo
de projeto. As fontes de dados integradas para o LARIISA tero, em sua maioria,
como objetivo resolver necessidades especficas, como no exemplo das informaes
integradas de Bairros, justificando a no necessidade de abrir o esquema mediado
para qualquer consulta posta pelo usurio.
A arquitetura apresentada na Figura 28 baseada na apresentao dos
Linked Data Mashup Services (LIDMS) no trabalho de (MAGALHES, 2012).

Figura 28: Arquitetura que define a relao entre a aplicao, o esquema mediado de dados e as
fontes de dados RDF. Criao do autor.
78

A Aplicao tem como funo enviar parmetros necessrios para o


Processador de Consulta, bem como exibir os resultados quando recebido. A
Aplicao envia os seguintes parmetros ao Processador de Consulta: (i) p1, que
identifica a consulta que ser utilizada e (ii) [p2, p3...pi], lista de parmetros de
entrada que sero necessrios para a execuo dessa consulta.
O Processador de Consulta verifica a conformidade dos parmetros
recebidos pela aplicao. Verifica, por exemplo, se todos os parmetros necessrios
execuo da consulta indicada se fazem presentes. Se algum parmetro no
condizer com o esperado, ou na falta de parmetros, uma mensagem para a
aplicao retornada.
De acordo com a consulta recebida, o Processador de Consulta tambm
identifica qual ser o plano de consulta federada, j armazenada no repositrio, a
ser executada pelo Executor de Consulta e repassa para ele.
O Processador de Consulta tambm responsvel por converter para o
formato de sada esperado pela aplicao os resultados da consulta que vo sendo
obtidos.
O Executor da Consulta o componente mais importante do esquema. Ele
responsvel pela execuo do plano de consulta definido pelo Processador de
Consulta sob as fontes de dados. A escolha do algoritmo do Executor de Consulta,
ou a necessidade de desenvolvimento de um novo, define a performance com que
essas consultas sero executadas. Este algoritmo dever suportar consultas
federadas. Mais detalhes da implementao do Executor de Consulta so
apresentados na prxima seo.
O Repositrio armazena todos os planos de execuo de consultas
federadas, armazenados em XML, que podero ser executados pelo Executor de
Consulta; armazena os mapeamentos locais e de mediao, definidos na seo
5.3.5; e armazena metadados sobre as fontes de dados, uma forma de registrar as
fontes de dados que compem o esquema mediado. Os metadados so
armazenados sob o vocabulrio VoiD (Vocabulary of Interlinked Datasets),
vocabulrio padronizado pelo W3C para publicao de metadados sobre conjunto de
dados disponveis como Linked Data.
79

5.4. Aplicao do Processo Proposto


Considere o seguinte cenrio: a gesto municipal de sade mantm um
sistema de monitoramento de agravos de dengue. A partir de informaes obtidas
dos estabelecimentos de sade, consegue-se realizar um monitoramento semanal,
desde os casos notificados de dengue at os casos mais graves.
Atravs da vigilncia epidemiolgica da doena possvel se fazer uma
avaliao de sua intensidade, colaborando para orientar o gestor na tomada de
aes, assim como avaliar as medidas que vem sendo tomadas, permitindo, por
exemplo, a otimizao do uso dos recursos disponveis para controle da doena.
Apenas a obteno do nmero de casos de dengue no suficiente para uma
gesto eficiente de controle da doena. preciso conhecer os fatores que
influenciam na incidncia de casos, possibilitando, assim, que a gesto possa
trabalhar mais efetivamente com a preveno e combate da doena. Por exemplo,
atravs da vigilncia epidemiolgica constata-se que um determinado bairro
aumentou em 20% os casos notificados de dengue. Mas porque desse aumento?
Houve incidncias de chuva no bairro? Problemas de saneamento? Houveram
denncias de focos de dengue pela populao do bairro? Ou seja, perguntas que
representam a necessidade de investigao do porque do aumento de nmero de
casos no bairro. Para responder a essas perguntas o gestor precisa ter os dados de
contexto da regio integrados aos dados de vigilncia epidemiolgica para
responder a essas perguntas.
Considerando o cenrio descrito, faz-se a aplicao do processo de
integrao definido na seo 5.2. Tem-se, ento, a aplicao do processo na
integrao de dados para servir a uma aplicao especfica.

5.4.1. Definio da Ontologia de Domnio


A Figura 29 apresenta a ontologia de domnio do cenrio. uma ontologia
que relaciona informaes contextuais do bairro (IDH, precipitao, densidade
demogrfica, denncias de focos de dengue) que podem estar relacionados com o
aumento de casos de dengue registrados.
A relao dos conceitos de IDH, precipitao, densidade demogrfica com o
nmero de casos de dengue foi embasada nos trabalhos de (Flauzino, Souza-
Santos and Oliveira, 2011; Mondini and Chiaravalloti Neto, 2007).
80

Figura 29: Ontologia de Domnio resultante do Passo 1 do Processo de Integrao Proposto.

5.4.2. Seleo das Fontes de Dados


Para o cenrio descrito, foram selecionados as seguintes fontes de dados:
Dados do Sistema de Monitoramento Dirio de Agravos (SIMDA9) da
Secretaria Municipal de Sade de Fortaleza. O sistema disponibiliza
semanalmente os casos de dengue notificados e confirmados no nvel de
granularidade por estabelecimento. Os dados podem ser visualizados na
prpria Web, como possvel exportar os dados em formato de planilha ou
documento de texto. Atravs dessa fonte de dados pode-se obter o registro
de dengue de cada bairro.
Dados das Secretarias Regionais de Fortaleza10. Cada secretaria mantm
informaes sobre os bairros que administra como IDH, populao e rea (o
que nos permite obter a densidade demogrfica). Esses dados podem ser
obtidos diretamente da Web, de forma manual, ou diretamente com as
regionais em formado de planilha.

9
http://tc1.sms.fortaleza.ce.gov.br/simda/dengue/mes
10
http://www.fortaleza.ce.gov.br/regionais
81

Dados da Fundao Cearense de Meteorologia e Recursos Hdricos


(Funceme)11. Atravs do site da Funceme possvel ter acesso aos dados
pluviomtricos dirios por municpio. No h registros por bairro. Os dados
podem ser exportados em formato de planilha.
Dados sobre focos de dengue. Infelizmente, no Cear, a populao no tem
acesso a um meio eficaz de denunciar focos de dengue. Em Fortaleza, o
cidado que deseja fazer esse tipo de denncia, deve entrar em contato
diretamente com a regional do bairro, que agenda uma visita para verificao
da rea denunciada. No h registros dessas denncias para formar
indicadores. No Rio Grande do Norte foi desenvolvido pela UFRN o
Observatrio da Dengue12, um aplicativo Web onde moradores podem
denunciar focos de mosquitos. Para os gestores pblicos, o conjunto de
denncias feitas pelos cidados forma um mapa que possibilita visualizar
onde h suspeitas da doena e onde existem mosquitos transmissores. Para
o exemplo utilizado neste trabalho, esse formato de aplicativo forneceria os
dados relativos aos focos de dengue, porm no possvel obter esses
dados em Fortaleza.

5.4.3. Triplificao dos Dados


No caso do cenrio descrito, todas as fontes selecionadas esto no formato
de planilhas, o que significa ser necessrio converter as planilhas em grafos RDF.
Utiliza-se, ento, a ferramenta XLWrap (Langegger and Wo, 2009), por possuir
todos os componentes para a publicao dos dados, e pela sua simplicidade em
realizar os mapeamentos de converso.
Para este trabalho considerada a seguinte sequncia de passos para a
converso dos dados:
(i) Projeto de Ontologia das Fontes. A Figura 30 representa as
ontologias fonte criadas. Na impossibilidade de obter uma URI vlida para o
exemplo, considerado que a ontologia das fontes, assim como suas
instncias, foram publicadas sob o prefixo <http://example.org>. Outro detalhe
importante que as ontologias criadas podem utilizar vocabulrio parecido

11
http://www.funceme.br/index.php/areas/tempo/chuvas-diarias-municipios
12
http://www.telessaude.ufrn.br/observatoriodadengue/
82

com o vocabulrio da ontologia de domnio, visto que, no caso especfico do


exemplo, no utilizada nenhuma ontologia j publicada.

Figura 30: Exemplos de ontologias fonte. Criao do autor.

(ii) Seleo e aplicao de ferramenta de converso de dados para


RDF. No exemplo, como j citado, foi escolhida a ferramenta XLWrap, que
converte dados armazenados em planilhas para grafos RDF. Atravs de um
mapeamento definido entre a planilha e o vocabulrio do passo anterior, os
grafos so criados pelo wrapper tornando-os disponveis em um endpoint
SPARQL.
A Figura 31 apresenta os dados obtidos do SIMDA, em formato de planilha; a
Listagem 1 apresenta o mapeamento feito, de acordo com as orientaes da
ferramenta; e a Figura 32 mostra os dados j convertidos, sendo obtidos
atravs do endpoint SPARQL provido pela ferramenta.
83

Figura 31: Dados obtidos do SIMDA, referente ao nmero de casos de dengue registrados por ano,
por ms, por bairro, em formato de planilha. Criao do autor.

Figura 32: Resultado da triplificao dos dados. Criao do autor.


84

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .


@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix ex: <http://example.org/> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix xl: <http://purl.org/NET/xlwrap#> .
@prefix scv: <http://purl.org/NET/scovo#> .
@prefix : <http://myApplication/configuration#> .

# mapping
{ [] a xl:Mapping ;
xl:offline "false"^^xsd:boolean ;
xl:template [
xl:fileName "mappings/files/casos-de-dengue.xls" ;
xl:sheetNumber "0" ;
xl:templateGraph :CasosDengue ;
xl:transform [
a rdf:Seq ;
rdf:_1 [
a xl:RowShift ;
xl:restriction "A2; B2:M2" ;
xl:breakCondition "A2 == 'TOTAL'" ;
xl:steps "1" ;
];
rdf:_2 [
a xl:ColShift ;
xl:restriction "B1; B2:B120"^^xl:Expr ;
xl:breakCondition "B1 == 'TOTAL'" ;
xl:steps "1" ;
];
rdf:_3 [
a xl:SheetShift ;
xl:restriction "#1.*"^^xl:Expr ;
xl:repeat "2"
];
]
].
}
:CasosDengue {
[ xl:uri "'http://example.org/casosDengue_' & URLENCODE(SHEETNAME(A1) & '_' & B1 & '_' &
A2)"^^xl:Expr ] a ex:CasosDengue ;
ex:bairro "URI('http://pt.dbpedia.org/page/' & A2)"^^xl:Expr ;
ex:year "DBP_YEAR(SHEETNAME(A1))"^^xl:Expr ;
ex:mes "B1"^^xl:Expr ;
ex:casosDengue "B2"^^xl:Expr .
}

Listagem 1: Exemplo de mapeamento realizado considerando as orientaes da ferramenta de


converso XLWrap da planilha da Figura 31.
85

(iii) Mecanismo de atualizao das fontes. No exemplo utilizado,


como grande parte das fontes de dados esto no formato de planilhas, e que
no domnio as demais informaes estaro em funo dos dados de casos de
dengue, que so atualizados semanalmente, as fontes publicadas no formato
RDF devero passar por uma rotina de atualizao semanal.

5.4.4. Modelagem das Ontologias de Aplicao


importante observar que no caso do exemplo utilizado, por se tratar de um
domnio no to complexo, as ontologias de aplicao foram criadas manualmente.
No trabalho de (Sacramento et al., 2010) apresentado uma estratgia para
gerao automtica das ontologias de aplicao, como j citado. A Figura 33 mostra
as ontologias de aplicao obtidas para o nosso exemplo.

Figura 33: Ontologias de Aplicao resultantes do Passo 4 do processo de integrao. Fonte do


autor.

5.4.5. Definio dos Mapeamentos Locais e de Mediao


A Tabela 1 apresenta os mapeamentos locais (define classes e propriedades
da ontologia de aplicao em termos de suas ontologias fonte) e a Tabela 2 alguns
dos mapeamentos de mediao (define classes e propriedades da ontologia de
domnio em termos das ontologias de aplicao).
86

Para distinguir os espaos de nomes usam-se os seguintes prefixos simda:,


funceme:, bairro: e focos: para se referir aos vocabulrios das ontologias fonte;
SIMDA, FUNCEME, BAIRRO e FOCODENGUE, respectivamente; sim_oa:,
fcm_oa:, b_oa: e fd_oa para se referir aos vocabulrios das ontologias de
aplicao SIMDA, FUNCEME, BAIRRO e FOCODENGUE, respectivamente; e
lariisa: para se referir ao vocabulrio da ontologia de domnio LARIISA.

OF#SIMDA##OA#SIMDA#
Classes:!
sim_oa:Dengue(d) 1simda:CasosDengue(d)1
sim_oa:Bairro(b)11simda:Bairro(b)1
sim_oa:Ano(a)11simda:Ano(a)1
sim_oa:Mes(m)11simda:Mes(m)1
Propriedades:!
sim_oa:mesDengue(d,1m)11simda:mes(d,m)1
sim_oa:anoDengue(d,a)11simda:ano(d,a)1
sim_oa:eRegistradoDengueNoBairro(d,b)11simda:bairro(d,b)1
OF!FUNCEME!!OA!FUNCEME!
Classes:!
fcm_oa:Precipitacao(p)11funceme:RegistroChuva(p)1
fcm_oa:Bairro(b)11funceme:Bairro(b)1
fcm_oa:Ano(a)11funceme:Ano(a)1
fcm_oa:Mes(m)11funceme:Mes(m)1
Propriedades:!
fcm_oa:mesDengue(p,m)1funceme:mes(p,m)1
fcm_oa:anoDengue(p,a)1funceme:ano(p,a)1
fcm_oa:eMedidaPrecipitacaoNo(p,b)1funceme:bairro(p,b)1
OF!BAIRRO!!OA!BAIRRO!
Classes:!
b_oa:DensidadeDemografica(dd)1bairro:1DensidadeDemografica(dd)1
b_oa:IDH(i)1bairro:IDH(i)1
b_oa:Bairro(b)1bairro:Bairro(b)1
Propriedades!
87

b_oa:eMedidoIDHno(b,i)1bairro:idh(b,i)1
b_oa:eMedidaDensidadeNo(b,dd)1bairro:densidadeDemografica(b,dd)1
OF!FOCODENGUE!!OA!FOCODENGUE!
Classes!
fd_oa:FocoAguaParada(fd)1focos:FocoDengue(fd)1
fd_oa:Bairro(b)1focos:Bairro(b)1
fd_oa:Mes(m)1focos:Mes(m)1
fd_oa:Ano(a)1focos:Ano(a)1
Propriedades!
fd_oa:mesFoco(fd,m)11focos:mes(fd,m)1
fd_oa:anoFoco(fd,a)11focos:ano(fd,a)1
fd_oa:eMedidoFocoNo(fd,b)11focos:bairro(fd,b)1
Tabela 1: Exemplo de Mapeamentos Locais

Ontologia de Domnio Ontologias de Aplicao


Classes:!
lariisa:Bairro(b)11sim_oa:Bairro(b);fcm_oa:Bairro(b);b_oa:Bairro(b);fd_oa:Bairro(b)1
lariisa:Ano(a)11sim_oa:Ano(b);fcm_oa:Ano(a);b_oa:Ano(a);fd_oa:Ano(a)1
lariisa:Mes(m)11sim_oa:Mes(m);fcm_oa:Mes(m);b_oa:Mes(m);fd_oa:Mes(m)1
...1
Propriedades:!
lariisa:anoDengue(d,a)11sim_oa:anoDengue(d,a)1
lariisa:eMedidaPrecipitacaoNo(p,b)11fcm_oa:eMedidaPrecipitacaoNo(p,b)1
lariisa:eRegistradoDengueNo(d,b)11sim_oa:eRegistradoDengueNoBairro(d,b)1
...
Tabela 2: Alguns mapeamentos de mediao.
88

5.4.6. Processamento das Consultas sob o Esquema Mediado

5.4.6.1. Detalhes de implementao


O Apache Jena13 e Sesame14 so frameworks Java para o desenvolvimento
de aplicaes de Linked Data e Web Semntica. As duas ferramentas possibilitam o
processamento de consultas federadas, necessrio para a implementao do nosso
mediador, mas o Sesame apenas suporta a linguagem RDF, no OWL. Para
implementar o processo proposto utilizou-se o framework Jena, assim como fizeram
(PINHEIRO, 2011) e (MAGALHAES, 2012).
A gerao dos planos de execuo de consulta demonstrada considerando
o trabalho de (PINHEIRO, 2011), como j mencionado. Apesar da arquitetura
mostrada na Figura 28, considerar consultas pr-definidas, ou seja, os planos de
consultas j estaro armazenados no Repositrio, esse passo define a gerao
desses planos de execuo, e ser realizado em tempo de projeto.
Suponha a consulta sobre a ontologia de domnio LARIISA do exemplo
utilizado. Suponha uma consulta que retorne IDH, precipitao, densidade
demogrfica e nmero de casos de dengue, representada na Tabela 3.

PREFIX lariisa: <http://lariisa#>

SELECT ?indiceIdh ?indice_precipitacao ?indice_densidade ?casosDengue


WHERE {
?bairro lariisa:nome_bairro ?:nomeBairro ;
?bairro lariisa:idh ?idh ;
?idh lariisa:ndice_idh ?indiceIdh ;
?bairro lariisa:densidade ?densidade ;
?densidade lariisa:indice_densidade ?indice_densidade
?bairro lariisa:bairroMunicipio ?municipio
?municipio lariisa:registraPrecipitacao ?precipitacao
?precipitacao lariisa:mesPrecipitacao ?:mes
?precipitacao lariisa:anoPrecipitacao ?:ano
?precipitacao lariisa:ndice_precipitacao ?indice_precipitacao

13
https://jena.apache.org/
14
http://rdf4j.org
89

?bairro lariisa:registraDengue ?dengue


?dengue lariisa:mesDengue ?:mes
?dengue lariisa:anoDengue ?:ano
?dengue lariisa:casosDengue ?casosDengue
}
Tabela 3: Exemplo de Consulta SPARQL submetida ao Mediador Criado.

Essa consulta possui como parmetros ?:nomeBairro, ?:mes e ?:ano e


sero enviados pela aplicao ao mediador, assim como a aplicao envia um
parmetro que identifica a consulta da Tabela 3. Em tempo de projeto, submete-se a
consulta ao processo de gerao dos planos de execuo de consultas federadas
detalhado na seo anterior. A consulta ao passar pela etapa de traduo
transformada numa rvore que representa a estrutura da consulta sobre a ontologia
de domnio, conforme a Figura 34.

Figura 34: rvore de consulta gerada ao submeter a consulta da Tabela 3 ao processo de traduo.

Ao passar pela etapa de reformulao da consulta, a rvore gerada na etapa


de traduo reformulada. Para isso, primeiro, selecionam-se as ontologias de
aplicao cujo vocabulrio contm o conceito primrio da consulta, identificadas
como primrio na Figura 35. Para cada novo conceito encontrado nas ontologias
primrias, cria-se uma subconsulta sobre uma ontologia de aplicao, que sero
90

denominadas de secundrias. O plano final da consulta consiste na unio dos


planos de consulta reformulada nas ontologias primrias. Caso tenha sido
identificada mais de uma ontologia primria, o operador Union ser o n-raiz.

Figura 35: rvore reformulada aps a etapa de reformulao de consulta. Cada operador Service
contm sub consultas sobre as ontologias de aplicao.

A Figura 35 mostra a rvore resultante da reformulao de consulta. Para o


cenrio descrito, as ontologias de aplicao Bairro e SIMDA foram as ontologias de
aplicao primrias selecionadas, por conterem em seu vocabulrio o conceito
primrio ?bairro. A ontologia de aplicao Funceme, por conter um novo vocabulrio,
foi definida como sendo a secundria.
O plano de execuo composto por 3 sub consultas Q1, Q2 e Q3 (vide
Tabela 4). Em seguida cada sub consulta reescrita conforme os mapeamentos
locais da Tabela 1, em termos de uma consulta sobre o esquema das fontes de
dados. As sub consultas Q1, Q2 e Q3 so apresentadas na Tabela 5. O plano de
consulta federado em lgebra SPARQL apresentado na Figura 36.
O plano de consulta gerado pode ser executado pela engine de execuo
(Executor de Consulta) do prprio Jena/ARQ15, j que a API suporta consultas
federadas; pode ser executado utilizando a prpria estratgia de execuo de
consultas federadas proposta no trabalho de (PINHEIRO, 2011), que atravs de
resultados experimentais evidenciaram melhor desempenho se comparado a engine
do JENA/ARQ; ou pode ser executado tambm pela mdulo de processamento de

15
Query Engine do framework Jena que suporta a linguagem de consulta RDF, SPARQL
91

consultas federadas QEF-LD (Query Evaluation Framework - Linked Data)


apresentado no trabalho de (MAGALHAES, 2012). Veremos na seo de Trabalhos
Futuros que o algoritmo do Executor de Consulta um campo vasto a ser explorado.

Q1 SELECT ?nomeBairro ?indiceIdh ?indice_densidade Q2 SELECT ?nomeBairro ?casosDengue


?municipio WHERE {
WHERE{ ?bairro sa:nome_bairro ?nomeBairro
?bairro ba:nome_bairro ?nomeBairro ?bairro sa:registraDengue ?dengue
?bairro ba:idh ?idh ?dengue sa:mesDengue ?:mes
?idh ba:ndice_idh ?indiceIdh ?dengue sa:anoDengue ?:ano
?bairro ba:densidade ?densidade ?dengue sa:casosDengue ?casosDengue
?densidade ba:ndice_densidade ?indice_densidade }
?bairro ba:bairroMunicipio ?municipio
}
Q3 SELECT ?indice_precipitacao
WHERE {
?municipio fa:registraPrecipitacao ?precipitacao
?precipitacao fa:mesPrecipitacao ?:mes
?precipitacao fa:anoPrecipitacao ?:ano
?precipitacao fa:ndice_precipitacao ?indice_precipitacao
}

Tabela 4: Consultas SPARQL sobre as ontologias de aplicao

Q1 SELECT ?nomeBairro ?indiceIdh ?indice_densidade Q2 SELECT ?nomeBairro ?casosDengue


?municipio WHERE {
WHERE{ ?casosDengue simda:bairro ?bairro
?bairro bairro:nome ?nomeBairro ?bairro simda:nomeBairro ?nomeBairro
?bairro bairro:idh ?idh ? casosDengue simda:mes ?:mes
?idh bairro:ndice_idh ?indiceIdh ? casosDengue simda:ano ?:ano
?bairro bairro:densidadeDemografica ?densidade ? casosDengue simda:casosDengue
?densidade bairro:ndice_densidade ?indice_densidade ?casosDengue
?bairro bairro:municipio ?municipio }
}
Q3 SELECT ?indice_precipitacao
WHERE {
?precipitacao funceme:municipio ?municipio
?precipitacao funceme:mes ?:mes
?precipitacao funceme:ano ?:ano
?precipitacao funceme:registroChuva ?indice_precipitacao
}

Tabela 5: Consultas SPARQL sobre as ontologias fontes.


92

Figura 36: Consulta federada em lgebra SPARQL.

5.5. Consideraes Finais do Captulo


Neste captulo foi apresentada um processo de integrao de dados no
contexto do projeto LARIISA. Para isso, foi definido um cenrio de uma demanda
submetida ao LARIISA por um gestor de sade, e explicado passo a passo a
aplicao da metodologia para chegar ao resultado esperado.
Foi identificado tambm dois cenrios de aplicao deste processo: um
cenrio que utiliza a metodologia para construir a base de conhecimento ontolgica
do LARIISA; e outro cenrio que utiliza a metodologia para dar suporte a uma
aplicao especfica. Para esse segundo cenrio, definimos tambm uma arquitetura
que relaciona a aplicao, o esquema mediado e as fontes de dados.
No prximo captulo, so discutidos os resultados do desenvolvimento deste
trabalho para o projeto LARIISA.
93

6. ANLISES E RESULTADOS
Este captulo apresenta algumas anlises e resultados provenientes da
proposio deste processo de integrao de dados ao LARIISA.

6.1. Introduo
Aps ter finalizado este trabalho, pode-se afirmar que ele ser de grande
contribuio para o projeto LARIISA como um todo. Os conceitos de Web Semntica
e Linked Data j haviam sido questionados a integrar a arquitetura do LARIISA, em
documentos que descreviam futuros problemas e teses a serem abordadas no
projeto, mas at o momento no tinham tido a chance de serem explorados com a
importncia que o assunto merecia.
Com absoluta certeza, a insero desses novos conceitos ao LARIISA faro o
projeto entrar numa nova fase. Como destacado no Captulo 2, a grande maioria dos
trabalhos desenvolvidos no contexto do LARIISA focaram em aplicaes que
captavam informaes de contexto e as entregavam plataforma para realizao de
inferncia. Este trabalho alicerado na inteligncia que a plataforma pode entregar
ao gestor de sade, a partir de uma base de conhecimento criada da integrao de
dados de sade ou relacionados, sejam dados provindos de aplicaes
desenvolvidas a partir do LARIISA, sejam dados provindos de sistemas de
informao de sade j existentes.
Este trabalho tambm se mostra importante por reafirmar a importncia das
ontologias na arquitetura do LARIISA. Antes j importantes por representar as
informaes de contexto, e agora tecnologia essencial para promover a integrao
de dados que a plataforma necessita, e consequentemente enriquecendo a base de
conhecimento do LARIISA.
Outra grande relevncia do trabalho a independncia que se proporciona ao
LARIISA dos dados que podem compor a sua base de conhecimento. Pode-se
afirmar que quaisquer dados/informaes, que estejam dispostas na Web, em forma
de planilhas, arquivos de texto ou qualquer outro formato; que estejam dispostos em
sistemas diretamente ligados sade pblica ou no diretamente ligados sade
pblica; que estejam dispostos em bases de dados relacionais ou no, ou seja,
qualquer informao, pode compor a base de conhecimento do LARIISA.
Isso fica bem mais claro quando se avalia o cenrio da contribuio que o
projeto sempre quis entregar sade pblica. A burocracia e o custo que se teria de
94

transformar os dados da sade pblica em conhecimento para o LARIISA,


considerando a enorme pulverizao de SIS existentes, e consequentemente
comear a entregar inteligncia de governana de sade, parecia algo muito
distante. A nova cultura de transparncia de informaes, onde mais e mais setores
do governo disponibilizam informaes na Web, facilita muito a utilizao do
processo proposto neste trabalho, fazendo com que o LARIISA consiga entregar
rapidamente a inteligncia que a sade pblica necessita. Isso pode ser constatado
facilmente ao observar que o cenrio onde se aplicou o processo proposto foi
construdo somente com dados disponibilizados em sites oficial na Web, em formato
de planilha. No foi preciso ter acesso diretamente base de dados dos sistemas
que produziam essas informaes, apenas acessar a pgina Web das instituies.
Outra contribuio do trabalho a possiblidade de aplicao imediata do
LARIISA, utilizando essa novo processo, em uma situao real na sade pblica.
Como j mostrado no Captulo 1, e no Captulo 3, nos trabalhos relacionados,
qualquer esfera da sade pblica brasileira, seja ela municipal, estadual ou federal,
sofre com a pulverizao de dados da sade, o que favorece para um gesto pobre
e pouco eficiente. A utilizao do LARIISA como abordagem de integrao de dados
de sade, fugindo de iniciativas isoladas de um municpio ou de um estado, poderia
transformar a sade pblica no pas, no s porque a plataforma poderia realizar a
tarefa de integrao de dados, sem interferir na dinmica de captao de dados j
existente, mas tambm por ter meios da prpria plataforma realizar anlises desses
dados, indicando ao gestor as decises mais acertadas, ou servindo como segunda
opinio frente a um conselho de profissionais especializados.

6.2. Consideraes Finais do Captulo


Este captulo apresentou um conjunto de anlises que refletem os resultados
obtidos com a proposta apresentada neste trabalho, assim como suas contribuies,
tanto para o prprio LARIISA, como para a sade pblica brasileira.
No prximo captulo so feitas as consideraes finais, assim como
expectativas de trabalhos futuros.
95

7. CONSIDERAES FINAIS E TRABALHOS FUTUROS

7.1. Consideraes Finais


A rea de pesquisa deste trabalho o processo de integrao de dados de
sade, no contexto do LARIISA, utilizando tecnologias da Web Semntica, como
Linked Data e Ontologias. Para corroborar a pesquisa foi feito um estudo sobre as
possibilidades tecnolgicas de integrao de dados que poderia ser utilizado pela
plataforma, apontando para um processo de integrao baseado em mediadores
construdos por ontologias.
A grande vantagem do processo proposto a possibilidade de se integrar
dados heterogneos, independentes e distribudos, como analisamos no captulo
anterior, podendo ser desde dados obtidos livremente da Web at bases de dados
de SIS das instituies pblicas de sade.
Foram apontados tambm dois cenrios de utilizao do processo: (i) um
referente ao enriquecimento da base de dados do LARIISA propriamente dito, onde
se aplicaria a metodologia sempre que necessitasse incluir novos conhecimentos
plataforma; (ii) e um segundo cenrio onde a metodologia serviria para responder a
demandas de aplicaes especficas. Para este segundo cenrio, tambm se props
uma arquitetura que relaciona a interao da aplicao, do sistema mediado e das
fontes de dados.
Assim, conclui-se que o presente trabalho conseguiu atingir seus objetivos,
especificando um processo no-intrusivo e de fcil utilizao para o problema de
integrao de dados no LARIISA, possibilitando uma maior qualidade das
inferncias realizadas pelo LARIISA.

7.2. Trabalhos Futuros


Este trabalho, de forma alguma, exauriu as pesquisas a serem realizadas em
torno do assunto, o que demonstra a complexidade do assunto pesquisado. Como
expectativas para trabalhos futuros pode-se citar:
a) Modelagem de uma ontologia de domnio para o LARIISA. A modelagem
do conhecimento de sade dentro do contexto do LARIISA um campo a ser
bastante explorado e bastante complexo. Pela complexidade da rea de
estudo, que envolve a utilizao das melhores tcnicas de criao de
ontologias para a sade, da utilizao de conhecimento especializado, foi
96

definido no Captulo 5 que a ontologia de domnio LARIISA seria o conjunto


de sub-ontologias (e seus reacionamentos) que modelassem um determinado
nvel de conhecimento na rea da sade, como vigilncia epidemiolgica,
home care, doenas e drogas, gesto de recursos, etc. Essa ontologia de
domnio LARIISA pode ser modelada como uma ontologia nica e poderia
ser explorada como trabalho futuro.
b) Definio de um algoritmo para o mdulo Executor de Consulta. Como
destacado no captulo 5 este trabalho no possuiu como objetivo chegar a
esse nvel de profundidade na definio do processo. O plano de execuo de
consultas federadas gerado poderia ser submetido ao prprio JENA/ARQ,
como ao algoritmo proposto por (PINHEIRO, 2011), (MAGALHAES 2012) ou
algum outro. necessrio que como trabalho futuro se possa atestar sobre os
melhores algoritmos de execuo de consultas federadas no contexto do
LARIISA, ou at a proposio ou evoluo dos j existentes.
c) Desenvolvimento de um prottipo completo utilizando o processo
proposto no contexto da sade pblica. Tambm necessrio a
continuidade deste trabalho com o desenvolvimento de um prottipo que se
valha do processo aqui descrito.

Como possvel constatar, so vrias as direes em que se pode expandir e


melhorar o trabalho apresentado, cujos resultados tm possibilidade de aplicao
imediata, o que, por sinal, era um objetivo que, tambm, tinha-se em mente ao
inici-lo.
97

REFERNCIAS
ALCNTARA, T. P. D. A. PAOLA: UMA PLATAFORMA PARA O
DESENVOLVIMENTO DE APLICAES BASEADAS EM ONTOLOGIAS PARA O
PROJETO LARIISA. [s.l.] UNIVERSIDADE ESTADUAL DO CEAR, 2012.

ALONSO, G. et al. Web Services - Concepts, Architectures and Applications.


[s.l.] Springer Berlin Heidelberg, 2004. p. 354

ANDRADE, L. O. M. DE. Inteligncia de Governana para apoio Tomada de


Deciso. Cincia & Sade Coletiva, v. 17, n. 4, p. 829832, abr. 2012.

ANTUNES, F. SISA Uma aplicao sensvel ao contexto para agravos de


Dengue!: uma prova de conceito do projeto Lariisa. [s.l: s.n.].

BATH, P. A. Health informatics: current issues and challenges. Journal of


Information Science, v. 34, n. 4, p. 501518, 13 jun. 2008.

BATISTA, M. DA C. M. Otimizao de acesso em um sistema de integrao de


dados atravs do uso de caching e materializao de dados. [s.l.] Universidade
Federal de Pernambuco, 2003.

BAUER, F.; KALTENBCK, M. Linked Open Data!: The Essentials. [s.l: s.n.].

BERNERS-LEE, T. Linked Data - Design Issues. Disponvel em:


<http://www.w3.org/DesignIssues/LinkedData.html>.

BERNERS-LEE, T.; HEATH, T.; BIZER, C. Linked Data - The Story So Far.
International Journal on Semantic Web and Information Systems, v. 5, n. 3, p.
122, 2009.

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web - A new form of
Web content that is meaningful to computers will unleash a revolution of new
possibilities. Scientific American, 2001.

CASTAEDA, W. A. C. NOVO PARADIGMA DA ENGENHARIA CLNICA NA


INTEGRAO DE TICs PARA CRIAO DE AMBIENTES UBIQUOS E DE
INTEROPERABILIDADE NA SADE. [s.l.] UNIVERSIDADE FEDERAL DE SANTA
CATARINA, 2011.

CIFUENTES-SILVA, F.; SIFAQUI, C.; LABRA-GAYO, J. E. Towards an


architecture and adoption process for Linked Data technologies in Open
Government contexts A case study for the Library of Congress of
ChileProceedings of the 7th International Conference on Semantic Systems.
Anais...2011
98

DATASUS. Departamento de Informtica do SUS. Disponvel em:


<http://datasus.saude.gov.br/>. Acesso em: 13 mar. 2014.

DAVENPORT, T. H.; PRUSAK, L. Conhecimento empresarial: como as


organizaes gerenciam o seu capital intelectual. 4 ed. ed. Rio de Janeiro:
Campus, 1998. p. 237

DEY, A. K. Providing Architectural Support for Building Context-Aware


Applications Providing Architectural Support for Building Context-Aware
Applications. [s.l.] Georgia Institute of Technology, 2000.

DOAN, A.; HALEVY, A.; IVES, Z. Principles of Data Integration. [s.l: s.n.]. p. 497

E-Sus - DATASUS. Disponvel em:


<http://datasus.saude.gov.br/index.php/projetos/50-e-sus>. Acesso em: 18 mar.
2014.

EDUARDO MASSAD, HEIMAR DE FTIMA MARIN, R. S. DE A. (ED.). O


PRONTURIO ELETRNICO DO PACIENTE NA ASSISTNCIA , INFORMAO
E CONHECIMENTO MDICO. So Paulo: H. de F. Marin, 2003. p. 213

FENSEL, D. Ontologies. [s.l.] Springer Berlin Heidelberg, 2001.

FERNANDEZ, M.; GOMEZ-PEREZ, A.; JURISTO, N. METHONTOLOGY!: From


Ontological Art Towards Ontological Engineering. p. 3340, 1997.

FLAUZINO, R. F.; SOUZA-SANTOS, R.; OLIVEIRA, R. M. DE. Indicadores


socioambientais para vigilncia da dengue em nvel local. Sade e Sociedade, v.
20, n. 1, p. 225240, mar. 2011.

FLORESCU, D.; LEVY, A.; MENDELZON, A. Database techniques for the World-
Wide Web: A Survey. ACM SIGMOD Record, v. 27, n. 3, p. 5974, 1 set. 1998.

FROTA, J. B. B. Proposta de soluo de integrao de provedores de contexto


ao sistema lariisa. [s.l: s.n.].

GARDINI, L. M. et al. Clariisa, a context-aware framework based on geolocation for a


health care governance system. 2013 IEEE 15th International Conference on e-
Health Networking, Applications and Services (Healthcom 2013), n. Healthcom,
p. 334339, out. 2013.

GEREMIAS, M. A.; JACOBSEN, A. DE L.; PEREIRA, J. Superao dos Desafios na


Integrao dos Sistemas de Informao em Sade na Secretaria Municipal de
Sade de Florianpolis. In: Coleo Gesto da Sade Pblica - Volume 8.
Florianpolis: [s.n.]. v. 1p. 146160.
99

GRAHAM, I. D. et al. Lost in knowledge translation: time for a map? The Journal of
continuing education in the health professions, v. 26, n. 1, p. 1324, jan. 2006.

GRUBER, T. R. A translation approach to portable ontology specifications.


Knowledge Acquisition, v. 5, n. 2, p. 199220, jun. 1993.

GUBIANI, J. S.; PORT, R.; ORNELLAS, M. C. D. Interoperabilidade Semntica do


Pronturio Eletrnico do PacienteII Simpsio de Informtica da Regio Centro /
RS. Anais...2003

GUPTA, A.; MUMICK, I. S. Maintenance of Materialized Views!: Problems ,


Techniques , and Applications. IEEE Data Eng. Bull., v. 18, n. 2, p. 318, 1995.

HANSEN, M.; MADNICK, S.; SIEGEL, M. Data Integration using Web


ServicesVLDB 2002 Workshop EEXTT and CAiSE 2002 Workshop DTWeb on
Efficiency and Effectiveness of XML Tools and Techniques and Data Integration over
the Web-Revised Papers. Anais...2003Disponvel em:
<http://web.mit.edu/smadnick/www/wp/2002-14.pdf>. Acesso em: 23 ago. 2014

HYRINEN, K.; SARANTO, K.; NYKNEN, P. Definition, structure, content, use and
impacts of electronic health records: a review of the research literature. International
journal of medical informatics, v. 77, n. 5, p. 291304, maio 2008.

HEATH, T.; BIZER, C. Linked Data: Evolving the Web into a Global Data Space.
1st editio ed. [s.l.] Morgan & Claypool, 2011. p. 136

HIRA, A. Y. SADE DIGITAL!: NOVO PARADIGMA DA CONVERGNCIA DAS


TECNOLOGIAS DE INFORMAO PARA A REA DA SADE. [s.l.] Escola
Politcnica da Universidade de So Paulo, 2012.

JUNIOR, W. C. DE S. Integrao de sistemas de informaes em sade. Uma


proposta de soluo para a melhoria da qualidade na gesto do SUS. [s.l.]
Fundao Oswaldo Cruz, 2009.

LANGEGGER, A.; WOS, W. XLWrap Querying and Integrating Arbitrary


Spreadsheets with SPARQL. [s.l: s.n.]. p. 359374

LEO, B. DE F. et al. O Desafio de Integrar os Sistemas de Informao em


SadeIX Congresso Brasileiro de Informtica em Sade. Anais...2004

LOPES, P. M. A.; ANDRADE, R.; WANGENHEIM, A. VON. Uma Ontologia para o


Atendimento Emergencial de PacientesXI Congresso Brasileiro de Informtica em
Sade. Anais...2011

MAGALHES, R. P. UM AMBIENTE PARA PROCESSAMENTO DE CONSULTAS


FEDERADAS EM LINKED DATA MASHUPS. [s.l.] UNIVERSIDADE FEDERAL DO
CEAR, 2012.
100

MARCONDES, C. H. Linked data dados interligados - e interoperabilidade


entre arquivos, bibliotecas e museus na webEncontros Bibli: revista eletrnica
de biblioteconomia e cincia da informao, 9 ago. 2012. Disponvel em:
<http://www.periodicos.ufsc.br/index.php/eb/article/view/24410>. Acesso em: 20 nov.
2012

MEDEIROS, W. M. DA C.; OLIVEIRA, L. A. H. G. DE; SOUSA, L. G. DE. Uso de


Ontologias para Acesso a Informaes de Sade Armazenadas em Bases de
Dados HeterogneasXI Congresso Brasileiro de Informtica em Sade.
Anais...2011

MONDINI, A.; CHIARAVALLOTI NETO, F. Variveis socioeconmicas e a


transmisso de dengue. Revista de Sade Pblica, v. 41, n. 6, p. 923930, dez.
2007.

MONTENEGRO, L. C. et al. Sistema de informao como instrumento de gesto:


perspectivas e desafios em um hospital filantrpico. Journal of Health Informatics,
v. 5, n. 1, 29 mar. 2013.

MORAES, R. L. DE. Sistemas de Data Warehouse: Estudo e Aplicao na rea


da Sade. [s.l.] UFRGS, 1998.

NARDON, F. B.; JR, L. DE A. M. Knowledge Sharing and Information Integration


in Healthcare using Ontologies and Deductive Databases11th World Congress
on Medical Informatics. Anais...2004Disponvel em:
<http://books.google.com.br/books?hl=pt-
BR&lr=&id=bS2xdt7iufgC&oi=fnd&pg=PA62&dq=ontology+integration+health+brazil
&ots=6RvHzEKYSw&sig=s5o2z-X1uJRsGl6GUlylIA68dyk#v=onepage&q=ontology
integration health brazil&f=false>

OLIVEIRA, M. et al. A context-aware framework for health care governance decision-


making systems: A model based on the Brazilian Digital TV. 2010 IEEE International
Symposium on A World of Wireless, Mobile and Multimedia Networks
(WoWMoM), p. 16, jun. 2010.

PIERRO, B. DE. Dados sobre sade precisam de integrao | Brasilianas.Org.


Disponvel em: <http://www.advivo.com.br/materia-artigo/dados-sobre-saude-
precisam-de-integracao>. Acesso em: 18 maio. 2013.

PINHEIRO, J. C. Processamento de Consulta em um Framework baseado em


Mediador para Integrao de Dados no Padro de Linked Data. [s.l.]
Universidade Federal do Cear, 2011.

PINHEIRO, T. et al. PELADA UM PRONTURIO ELETRNICO LARISSA-


DATASUS, PARA UMA PLATAFORMA SENSVEL AO CONTEXTOX Encontro de
Pesquisa e Ps-Graduao do IFCE. Anais...2011
101

PINTO, L. F. D. S. ESTRATGIAS DE INTEGRAO E UTILIZAO DE BANCOS


DE DADOS NACIONAIS PARA AVALIAO DE POLTICAS DE SADE NO
BRASIL. [s.l.] Escola Nacional de Sade Pblica Sergio Arouca, 2006.

PIRES, D. F.; RUIZ, E. E. S. Interoperabilidade terminolgica em sistemas de


informao em sade!: problemas e solues com a UMLS. Journal of Health
Informatics, v. 2, n. 2, p. 3442, 2010.

ROBERVAL, M. Building a Linked Data Mashup for Auditing Municipal


Spending in Cear. [s.l: s.n.].

ROUSSEY, C. et al. An Introduction to Ontologies and Ontology Engineering. In:


Ontologies in Urban Development Projects. Advanced Information and Knowledge
Processing. London: Springer London, 2011. v. 1p. 939.

SACRAMENTO, E. R. et al. Towards Automatic Generation of Application


Ontologies. Journal of Information and Data Management, v. 1, n. 3, p. 535550,
2010.

SANTOS, I.; TELES, G.; OLIVEIRA, M. Interface do mecanismo de apoio


deciso baseado em redes bayesianas para a plataforma LARIISAVI
CONGRESSO TECNOLGICO INFOBRASIL TI & TELECOM. Anais...2013

SANTOS, M. E. D. S. DIGA SADE - UMA PROPOSTA DE SISTEMA DE APOIO A


SERVIOS DE HOME CARE BASEADO NO MODELO BRASILEIRO DE TV
DIGITAL. [s.l: s.n.].

SANTOS, R. DA S.; GUTIERREZ, M. A. MINERSUS Ambiente computacional para


extrao de informaes para a gesto da sade pblica por meio da minerao dos
dados do SUS MINERSUS A computational. Revista Brasileira de Engenharia
Biomdica, v. 24, n. 2, p. 7790, 2008.

SANTOS, R. S. et al. Data Warehouse para a Sade Pblica!: Estudo de Caso


SES-SPX Congresso Brasileiro de Informtica em Sade. Anais...2006

SANTOS, R. S.; GUTIERREZ, M. A. Implementaes de Data Warehouse na rea


da SadeAnais do IX Congresso Brasileiro de Informtica em Sade. Anais...2004

SILVA, I. S. et al. Observatrio da Dengue!: Surveillance based on Twitter


Sentiment Stream Analysis *Simpsio Brasileiro de Bancos de Dados - SBDD
2011. Anais...2011

SPAZZIANI, B. D. O.; NARDON, F. B. Componentizao e Integrao de


Sistemas de Informao em Sade de Grande PorteIX Congresso Brasileiro de
Informtica em Sade. Anais...2004
102

TELES, G. G. DO A. UM MECANISMO DE APOIO TOMADA DE DECISO EM


AGRAVO DE DENGUE BASEADO EM DADOS PROBABILSTICOS. [s.l: s.n.].

UMAPATHY, K.; PURAO, S. Systems Integration and Web Services. IEEE


Computer Society, v. 43, n. 11, p. 9194, 2010.

WACHE, H. et al. Ontology-Based Integration of Information A Survey of


Existing ApproachesIJCAI-01 Workshop: Ontologies and Information. Anais...2001

WIDOM, J. Research Problems in Data WarehousingProceedings of the fourth


international conference on Information and knowledge management.
Anais...1995Disponvel em: <http://ilpubs.stanford.edu:8090/91/1/1995-24.pdf>.
Acesso em: 1 set. 2014

WIEDERHOLD, G. Mediators in the Architecture of Future Information Systems. The


IEEE Computer Magazine, n. September 1991, 1992.

YU, L. A Developers Guide to the Semantic Web. Springer ed. [s.l: s.n.].

ZIEGLER, P.; DITTRICH, K. R. Data Integration Problems, Approaches, and


Perspectives. In: Conceptual Modelling in Information Systems Engineering. [s.l:
s.n.]. p. 3958.
103

You might also like