You are on page 1of 97

PROPOSTA DE MODELO CONCEPTUAL DE TTULO TTULO PROPOSTA DE UMUM MODELO CONCEPTUAL DE DATA WAREHOUSE TTULO DATA WAREHOUSE PARA

DE MOAMBIQUE O INSTITUTO Subttulo Subttulo PARA O INSTITUTO NACIONAL DE ESTATSTICA Subttulo NACIONAL DE ESTATSTICA DE MOAMBIQUE

Nome completo Candidato Nome completo dodo Candidato Nome Calado completo Pereira Fijamo do Candidato Calado Pereira Fijamo Dissertao / Trabalho de Projeto / Relatrio de

Dissertao / apresentada Trabalho decomo Projeto requisito / Relatrio parcial de para Estgio Estgio apresentada(o) como requisito parcial apresentada(o) obteno do grau como de Mestre requisito em parcial Gesto para de obteno Informao para obteno do grau Mestre em Estatstica e Gesto do grau de Mestre emde Estatstica e Gesto de Informao

de Informao

Instituto Superior de Estatstica e Gesto de Informao Universidade Nova de Lisboa

PROPOSTA DE UM MODELO CONCEPTUAL DE DATA WAREHOUSE PARA O INSTITUTO NACIONAL DE ESTATSTICA DE MOAMBIQUE
por

Calado Pereira Fijamo

Dissertao apresentada como requisito parcial para a obteno do grau de Mestre em Gesto de Informao, Especializao em gesto de sistemas e tecnologias de informao

Orientador: Professor Doutor Miguel de Castro Neto

Novembro, 2012

ii

DEDICATRIA
A Deus pela iluminao e orientao quotidiana minha av Madalena Fijamo que infelizmente no se encontra entre ns, pelos ensinamentos e pacincia em me criar. Ao meu tio Oliveira Fijamo que foi um autntico pai. minha esposa Leta Alberto Matola, pela compreenso e pacincia ao longo destes anos. Aos meus filhos Maria da Gloria, Ilton e Calado Jnior, pelo entendimento, pacincia e privaes que passaram ao longo destes anos.

iii

AGRADECIMENTOS
Agradeo em primeiro lugar Deus todo-poderoso, por tudo o que proporcionou at esta data, e o que proporcionar no futuro. Agradeo ao meu orientador, professor Doutor Miguel de Castro Neto, pelos conhecimentos transmitidos neste trabalho e durante toda minha estadia como estudante. Agradecer igualmente pela sua forma especial e incomparvel de lidar com seus estudantes. Ao Instituto Nacional de Estatstica, em particular ao Dr. Joo Dias Loureiro (Presidente do INE) pela confiana e oportunidade depositada. Agradeo ao professor Doutor Pedro Cabral, por todo o apoio que proporcionou durante a minha careira como estudante. Agradeo igualmente a todos professores e funcionrios do ISEGI, pelos ensinamentos e apoio prestado. Ao meu amigo Joo Gabriel Loforte, pelo apoio moral e social. Aos meus colegas da turma, em especial ao Nuno Dionsio e Daniel Heitor. A todos os que direta ou indiretamente contriburam para o desenvolvimento deste trabalho.

iv

RESUMO
O mercado atual bastante competitivo, com constantes exigncias em transformao de dados em informao e esta por sua vez em conhecimento. Uma informao clara e vlida o grande segredo de qualquer ramo de atividade, e por isso que o conhecimento a chave fundamental na tomada de deciso. O Data Warehouse desempenha um papel primordial como ferramenta de apoio na tomada de deciso, apresentando avanos substanciais comparativamente aos sistemas ou bases de dados tradicionais, oferecendo maior fiabilidade aos decisores estratgicos na sua difcil misso de tomar decises rpidas e seguras. O instituto nacional de estatstica de Moambique, abreviadamente designado por INE-M, o responsvel pelas estatsticas oficiais do Pas, e detm um grande volume de dados de interesse nacional e internacional para produo de informao estatstica. Estes dados, encontram-se armazenados e organizados em plataformas tradicionais, dificultando o acesso rpido e eficiente aos decisores quando pretendem tomar alguma deciso com segurana. Neste contexto, torna-se importante a existncia de um repositrio seguro e de acesso rpido, com capacidade de armazenar dados histricos da instituio. Este repositrio facilitar aos dirigentes o cumprimento das suas obrigaes e deveres de tomada de deciso, de forma eficaz e consistente. Um modelo conceptual de Data Warehouse que sirva de apoio estratgico na tomada de deciso ser de certa forma a melhor e mais conceituada contribuio que o INE-M pode oferece aos seus utilizadores e parceiros, visto que, tero sempre resposta segura e em tempo til.

PALAVRAS-CHAVE
Modelo conceptual de Data Warehouse, Data Warehouse, Data Marts, Base de dados.

ABSTRACT
The current markets are very competitive, with constant demands for transforming data into information and turn it into knowledge. Clear and valid information is the great secret of any industry, which is why knowledge is the key decision-making factor. The data warehouse plays a key role as a support tool in decision making, representing a substantial progress, when compared to systems or databases considered traditional, giving more reliability to the strategic decision-makers in their difficult task of making fast and accurate decisions. The national statistical institute of Mozambique, hereinafter called INE-M, manages the official statistics of the country, and holds a large volume of data of national and international interest for the production of statistical information. This data is stored and organized in traditional platforms, making its access difficult quick and efficient decision-makers when you want to make consistent decisions. In this context, it is important the existence of a repository for secure and fast access, capable of storing historical data of the institution. This repository makes it easier for leaders to fulfill their obligations and duties of effective and consistent decision-makinging. A conceptual model of data warehouse that serves to support strategic decision making, is somehow the best and most respected contribution that the INE-M can offer to their users and partners, since they will always respond in a timely and secure manner.

KEYWORDS
Conceptual model Data Warehouse, Data Warehouse, Data Marts, Database.

vi

NDICE
1. Introduo .................................................................................................................... 1 1.1. Definio do Tema ................................................................................................ 2 1.2. Organizao do Trabalho ...................................................................................... 2 1.3. Objetivos do Trabalho ........................................................................................... 3 1.3.1. Objetivo geral ................................................................................................. 3 1.3.2. Objetivos especficos ..................................................................................... 3 1.3.3. Interesse na investigao ............................................................................... 3 1.4. Fases de Elaborao do Trabalho ......................................................................... 4 2. Reviso da Literatura ................................................................................................... 5 2.1. Enquadramento Terico ....................................................................................... 5 2.1.1. Dado ............................................................................................................... 6 2.1.2. Informao ..................................................................................................... 6 2.1.3. Conhecimento ................................................................................................ 7 2.1.4. Sistemas da informao e a evoluo dos sistemas empresariais ................ 7 2.2. Informao nas organizaes ............................................................................. 10 2.3. Sistemas Operacionais (OLTP) e Sistemas de Apoio Deciso (SAD)................. 13 2.4. Caracterizao de Data Warehouse.................................................................... 15 2.5. Modelos e tabelas de Data Warehouse .............................................................. 20 2.6. Modelos de DW................................................................................................... 21 2.6.1. Modelo em Estrela ....................................................................................... 21 2.6.2. Modelo em Floco de Neve ........................................................................... 22 2.6.3. Modelo em Constelao .............................................................................. 23 2.7. Processo de Modelao ...................................................................................... 24 2.8. Erros mais frequentes na modelao. ................................................................ 25 2.9. Ferramentas de Busca, Transformao e Acesso ............................................... 27 2.9.1. ETL ................................................................................................................ 28 2.9.2. Ferramenta OLAP ......................................................................................... 30 2.10. Business Intelligence (BI) e Data Mining ........................................................... 32 2.11. Custos e Benefcios do DW ............................................................................... 34 2.11.1. Custos ........................................................................................................ 34 2.11.2. Benefcios .................................................................................................. 35

vii

2.12. Fatores crticos de Sucesso do DW ................................................................... 36 3. metodologia ............................................................................................................... 38 3.1. Metodologia de Pesquisa .................................................................................... 38 3.2. Metodologia conceptual de DW ......................................................................... 41 3.2.1. Metodologia de INMON............................................................................... 42 3.2.2. Metodologia de Kimball ............................................................................... 43 3.2.3. Comparao das Metodologias do INMON e KIMBALL ............................... 45 3.3. Requisitos do Data Warehouse........................................................................... 46 4. Instituto Nacional de Estatstica de Moambique ..................................................... 47 4.1. O INE M como Organizao. ............................................................................ 47 4.2. Misso do INE M .............................................................................................. 49 4.3. Viso do INE M ................................................................................................. 49 4.4. Valores do INE M .............................................................................................. 49 4.5. Desafios do INE M ............................................................................................ 49 4.6. Necessidade de Informao ................................................................................ 51 4.7. Gesto Estratgica .............................................................................................. 52 4.8. Requisitos do projeto .......................................................................................... 53 5. Modelao do Data Warehouse para o INE-M .......................................................... 56 5.1. Modelo Proposto ................................................................................................ 56 5.2. Modelo E-R de sistemas operacionais ................................................................ 58 5.3. Modelo dimensional de DW ............................................................................... 61 6. Data Mart ................................................................................................................... 64 6.1. Caraterizao ...................................................................................................... 64 6.2. Criao de DM ..................................................................................................... 64 6.2.1. Seleo do processo de Negcio ................................................................. 65 6.2.2. Definio da Granularidade ......................................................................... 65 6.2.3. Escolha das Dimenses ................................................................................ 66 6.2.4. Identificao de factos ................................................................................. 67 6.3. Modelao .......................................................................................................... 67 6.3.1. Modelo conceptual ...................................................................................... 67 6.3.2. Modelo lgico .............................................................................................. 68 6.3.3. Projeto fsico ................................................................................................ 70 7. Discusso de resultados ............................................................................................. 72 7.1. Projeto do Sistema de DW no INE-M .................................................................. 72

viii

7.2. Participao, Localizao e carga ........................................................................ 72 7.3. Atualizao e manuteno do DW...................................................................... 73 7.4. Considerao final ............................................................................................... 73 8. Concluses ................................................................................................................. 74 9. Limitaes e Recomendaes para Trabalhos Futuros ............................................. 75 9.1. Limitaes no estudo .......................................................................................... 75 9.2. Recomendaes para trabalhos futuros ............................................................. 75 10. Bibliografia ................................................................................................................ 76 11. Anexos ....................................................................................................................... 79

ix

NDICE DE FIGURAS
Figura 2.1.3 - Etapas do processo de conhecimento ........................................................ 7 Figura 2.2.1 - Tipos de SI ................................................................................................. 11 Figura 2.2.2 - Caractersticas da deciso......................................................................... 12 Figura 2.4.1 - Processo de data warehouse .................................................................... 17 Figura 2.4.2 - Arquitetura de Data Warehouse .............................................................. 17 Figura 2.4.3 - Elementos bsicos de DW ........................................................................ 19 Figura 2.5 - Dimenses e de facto com os seus atributos .............................................. 21 Figura 2.6.1 - Modelo estrela .......................................................................................... 22 Figura 2.6.2 - Modelo Floco de Neve .............................................................................. 23 Figura 2.6.3 - Modelo em constelao ........................................................................... 23 Figura 2.9.1 - Processo ETL ............................................................................................. 29 Figura 2.9.2 Carregamento e transformao de dados ............................................... 30 Figura 3.2.2.2 Arquitetura bottom-up ......................................................................... 44 Figura 4.1.1 - Organograma do INE M ......................................................................... 48 Figura 4.1.2 - Estrutura organizacional do INE ............................................................... 49 Figura 4.7.1 - Perspetivas estratgicos ........................................................................... 53 Figura 5.1.1 - DW para INE-M. ........................................................................................ 57 Figura. 5.1.2 - Modelo dimensional do DW em estrela para o INE-M ........................... 58 Figura 5.2.1 - Atributos e caracterizao de cada entidade ........................................... 59 Figura 5.2.2 - E-R, cardinalidade e hierarquia da produo Industrial ........................... 59 Figura 5.2.3 - E-R, cardinalidade e hierarquia de comrcio e servios ........................... 60 Figura 5.2.4 Diagrama E R Comrcio e Servios........................................................ 60 Figura 5.2.5 Diagrama E R de estatsticas de Produo Industrial............................ 61 Figura 5.2.6 - Exemplo de transformao e aglomerao de dados. ............................. 61 Figura 5.3.1 Categorias de entidades ............................................................................. 62 Figura 5.3.2 - Hierarquia de um modelo conceptual ...................................................... 63 Figura 6.1.1 - Constituio de DM com Tabelas de facto e dimensionais ...................... 64 Figura 6.3.1.1 - Modelo conceitual das Estatsticas Empresariais .................................. 68 Figura 6.3.1.2 - Modelo conceptual com os atributos .................................................... 68 Figura 6.3.2.1 - Modelo lgico das estatsticas Econmicas e Empresariais .................. 69 Figura 6.3.2.2 - Esquema do modelo lgico em Access .................................................. 69 Figura 6.3.2.3 - Esquema do modelo lgico em SQL. ..................................................... 70

NDICE DE TABELAS
Tabela 2.1.1 - Nveis de Informao ................................................................................. 5 Tabela 2.1.2 Caracterizao da Qualidade de Informao ............................................ 6 Tabela 2.1.4 - Evoluo histrica ...................................................................................... 9 Tabela 2.3.1 - Limitao de dados OLTP ......................................................................... 15 Tabela 2.7 - Aspetos no Processo de Modelao ........................................................... 25 Tabela 2.9.1 - Ferramentas de DW ................................................................................. 28 Tabela 2.9.2 - Ferramentas OLTP e OLAP ....................................................................... 32 Tabela 3.1.1 - Amostra de recolha de dados. ................................................................. 40 Tabela 4.7.1 - Anlise SWOT ........................................................................................... 52

xi

NDICE DE ANEXOS
Anexo 11.1 - Ficha de dados rea de Comrcio e Servios. ........................................... 79 Anexo 11.2 - Ficha de dados de rea industrial ............................................................. 80 Anexo 11.3 - Guio de apoio na recolha de requisitos (gesto de topo) ....................... 81 Anexo 11.4 - Guio de apoio na recolha de requisitos (gesto intermdia) .................. 82 Anexo 11.5 - Guio de apoio na recolha de requisitos (Departamento de Informtica)83

xii

LISTA DE SIGLAS E ABREVIATURAS


BD Base de Dados

BDMD Base de Dados Multidimensionais DARH DB DCI Departamento de Administrao e Recursos Humanos Database Departamento de Censos e Inquritos

DCNIG Departamento de Contas Nacionais e Indicadores Globais DEBA Departamento de Estatsticas de Bens e Agrcolas

DEMOVIS Departamento de Estatsticas Vitais e Sociais DESC DIPC DISI DM DMs dmg DSS DW EDW E-R ERP ETC ETL GC IBGE Departamento de Estatsticas Sectrias e Comrcio Departamento de ndice de Preo e Conjuntura Departamento de Informtica e Sistemas de Informao Data Mart Data Marts data mining Decision Support Systems Data Warehouse Enterprise Data Warehouse Entidade Relacionamento Enterprise Resource Planning Extrao transformao e Carga Extract Transform Load Gesto de conhecimento Instituto Brasileiro de Geografia e Estatstica

INE-M Instituto Nacional de Estatstica de Moambique INE-PT Instituto Nacional de Estatstica de Portugal IT KM MD Information Technology Knowledge Management Meta dados

xiii

MER MIS

Modelagem Entidade-Relacionamento Management Information Systems

MOLAP Multidimensional OLAP MRP Material Requirements Planning

MRP II Manufacturing Resources Planning OLAP OLTP Online Analytical Processing Online transaction Processing

PARPA Plano de Ao de Reduo da Pobreza Absoluta ROLAP Relational OLAP SAD SEN SGBD SI SIE SO SSD TI TIC Sistemas de Apoio Deciso Sistema Estatstico Nacional Sistema de Gesto de Bases de Dados Sistemas de informao Sistemas de Informao e Estatsticas Sistemas Operacionais Sistemas de Suporte a Deciso Tecnologias de Informao Tecnologias de Informao e Comunicao

xiv

1. INTRODUO
Este estudo tem como finalidade a dissertao de mestrado, e ter um papel preponderante para propor a criao de um repositrio de dados que apoie a tomada de deciso no Instituto Nacional de Estatstica de Moambique (INE M). Atualmente as empresas ou instituies credveis apostam em metodologias de gesto empresarial de dados. Consequentemente depara-se com um grande crescimento do volume de dados. Para atender a esse crescimento, necessrio que a empresa ou organizao crie um ambiente informatizado slido, com boa capacidade de armazenamento e gesto de dados. O sistema de gesto de dados empresarial deve garantir a segurana, coeso, interatividade e acima de tudo, deve apoiar com eficincia os decisores na sua complexa misso de tomada de deciso. Sendo o Instituto Nacional de Estatstica de Moambique, o responsvel pela produo e coordenao das estatsticas oficiais do Pas, este que responde s necessidades estatsticas dos utilizadores. Por isso, detentor de grandes volumes de dados. Nesta fase da globalizao, para uma organizao poder servir melhor os seus clientes, deve contar como aliados indispensveis os sistemas e tecnologias de informao. S assim, poder enfrentar (ou promover, no caso do INE M) a competitividade no mercado modernizado. As organizaes que no introduziram na sua cultura conceitos de excelncia nos seus produtos e servios, incluindo o atendimento ao cliente, podem estar a comprometer a sua sobrevivncia (Santos, 2008). O INE M na qualidade de promotor da utilizao da informao estatstica oficial no Pas, deve possuir uma base de dados de alta qualidade, que garanta confiana e segurana, de forma a nunca comprometer a eficincia e imagem da instituio assim como os que dela dependem.

1.1. DEFINIO DO TEMA


Proposta de um modelo conceptual de Data Warehouse (DW). Este o tema avanado como ferramenta de apoio na tomada de deciso para o INE-M. Pretende-se com o DW integrar todas fontes e suportes de informao dispersas pelos pelouros, num nico repositrio que proporcione o fcil e rpida resposta a questes de deciso.

1.2. ORGANIZAO DO TRABALHO


A organizao deste trabalho obedece na primeira parte seguinte ordem: dedicatria, agradecimentos, resumo, ndice geral, ndice de figuras, ndice de tabelas, ndice de anexos, lista de siglas e abreviaturas. A segunda parte composta por uma estrutura de 9 captulos numerados sequencialmente de 1 a 9. O primeiro captulo compreende a introduo, definio do tema, organizao do trabalho, objetivos e as fases de elaborao da dissertao. O segundo captulo constitudo pela reviso de literatura, que conta com o enquadramento terico do tema, informao nas organizaes, comparao dos sistemas tradicionais e de suporte a deciso, caracterizao de um data warehouse, modelos de data warehouse, tabelas de (facto e dimenso), processos de modelao, erros frequentes na modelao, principais ferramentas de data warehouse (DW), business intelligence (BI) e data mining (DMg), custos e benefcios, e fatores crticos de sucesso. O terceiro captulo apresenta a metodologia do trabalho, que consiste na metodologia da pesquisa, metodologias de DW, descrio das metodologias de Inmon e de Kimball, comparao das diferentes abordagens destes dois autores e requisitos de DW. O quarto captulo aborda a instituio do estudo de caso, O INE-M, como organizao, a sua viso, misso, desafios, necessidades de informao e fatores de sucesso. O quinto captulo contm a definio terica do modelo conceptual de DW, apresenta o conceito do modelo dimensional e descreve o modelo proposto para o INE-M. O sexto captulo a conceo dimensional. O stimo captulo a discusso de resultados O oitavo captulo de concluses. O Nono captulo de limitaes e recomendaes.

1.3. OBJETIVOS DO TRABALHO


1.3.1. Objetivo geral Propor ao INE M um modelo conceptual de Data Warehouse, que sirva de apoio na tomada de deciso rpida e segura. Este objetivo surge como forma de resolver ou minimizar o problema que o Instituto Nacional de Estatstica de Moambique, vem enfrentando para responder atempadamente aos pedidos dos seus utilizadores. 1.3.2. Objetivos especficos Este trabalho tem como objetivos especficos: Propor um modelo que apoie os utilizadores da informao estatstica em Moambique. Aumentar a capacidade de resposta dos tcnicos do INE-M, na gesto dos dados estatsticos. 1.3.3. Interesse na investigao Elevar o nvel acadmico e competncias de investigao. Apoiar o INE M com uma metodologia adequada para o apoio na tomada de deciso. Atualmente as organizaes governamentais ou no governamentais recorrem aos sistemas de informao, como forma de enfrentar o mercado competitivo. Assim, minimizam os possveis erros da informao disponibilizada para o pblico. Numa instituio quanto mais dados e informao existirem, mais dificuldades surgem no manuseio da mesma, piorando quando esses dados estiverem completamente dispersos na organizao. Normalmente estas organizaes recebem dados vindos de diversos locais ou fontes externos, com formataes diversificadas e por vezes incompatveis com a tecnologia existente na instituio. Uma das alternativas de integrao e uso desses dados o DW, que um repositrio de dados fortemente normalizado.

Sendo o INE M uma instituio do aparelho de estado com muitos dados da natureza acima referida, aconselha-se a existncia de um DW capaz de extrair, integrar, tratar e guardar dados ou informao de forma segura e que possibilite um posterior uso no apoio s tomadas de deciso.

1.4. FASES DE ELABORAO DO TRABALHO


Fase 1 - Pesquisa bibliogrfica / reviso da literatura sobre o tema, bem como anlise de modelos conceptuais. Fase 2 - Anlise e especificao de requisitos funcionais do DW. a fase de conhecimento da informao dos utilizadores finais. Ser em funo destes requisitos, e da anlise dos sistemas operacionais existentes na empresa, que serviro de base conceo do modelo de DW. Fase 3 - Metodologia do trabalho, consiste na definio dos mtodos utilizados na pesquisa, e a metodologia a usar na construo deste projeto de DW. Ainda nesta fase vai-se descrever as teorias e prticas das metodologias defendidas quer por Inmon quer por Kimball, prosseguindo com a comparao destas diferentes abordagens. Esta fase termina com a descrio dos requisitos bsicos de DW. Fase 4 Descreve a instituio de estudo de caso, descreve igualmente a infraestrutura tecnolgica existente na instituio, assim como, os requisitos bsicos para implementar o sistema multidimensional a propor. nesta fase, que se procede anlise das fontes de dados que iro alimentar o DW, tanto ao nvel dos sistemas que os originam como dos prprios dados em si. Esta anlise deve ser feita tendo em conta a facilidade de transformao e carregamento dos dados para o repositrio a propor. Fase 5 Modelao de DW para o INE M, a definio do modelo conceptual e escolha do modelo dimensional para o estudo de caso. Fase 6 Data Mart, a conceo de um dos DM do modelo de DW proposto. Fase 7 Discusso de resultados. Fase 8 Concluses. Fase 9 Limitaes e Recomendaes.

2. REVISO DA LITERATURA
Esta reviso da literatura tem como propsito fundamental encontrar material que sirva de base sustentao terica da pesquisa para realizao do trabalho de dissertao de mestrado. Fazer um enquadramento terico, histrico, e caracterizar o DW, com base no levantamento bibliogrfico, com maior incidncia em Inmon e Kimball, por serem os pioneiros neste tipo de modelo de armazenamento de dados. Data Warehouse como grande repositrio de dados, um instrumento muito importante e indispensvel nos negcios da empresa, num mercado moderno e competitivo onde os gestores devem ser geis e seguros na tomada de deciso.

2.1. ENQUADRAMENTO TERICO


Para um melhor enquadramento do que na essncia o data warehouse, comease por definir genericamente dados, informao, conhecimento e Sistemas de Informao (SI). E em seguida, falar da evoluo histrica dos SI. Para se cumprir com xito os objetivos preconizados numa instituio, necessria a existncia de uma informao muito bem organizada, com especial cuidado na qualidade da mesma. Qualquer informao tem o seu valor e importncia consoante o nvel de empregabilidade, seja operacional, ttico e estratgico. Cada nvel tem as suas necessidades de informao, para poder cumprir as diretrizes planificadas na organizao. A tabela 2.1.1 mostra os nveis bsicos da informao.

Nvel Dados Informao Conhecimento

Descrio Elementos atmicos que qualificam, referenciam e descrevem todos os passos necessrios operao do sistema de informao. Dados agregados por meios de relaes de complementaridade entre eles. a forma ou mecanismo de como os dados e informao so transmitidos de maneira organizada e estruturada para o uso futuro.

Tabela 2.1.1- Nveis de Informao; Fonte: Adaptado de Gouveia (2004)

2.1.1. Dado Considera-se como dado qualquer elemento ou smbolo que por si s no possui nenhum significado. Factos que descrevem os objetos de informao (eventos e entidades). Os dados referem-se a mais de um facto. Um determinado facto referido como item (Gouveia, L. M. B., 1996, p.17). 2.1.2. Informao um conjunto de dados processados e com um significado ou sentido.
As palavras informao e dados, so ambas intercambiveis em muitos contextos. Todavia, no so sinnimos. Por exemplo, de acordo com a observao de Adam M. Gadomski (1993), dados tudo que pode ser processado e as informaes so dados que descrevem um domnio fsico ou abstrato. Knuth aponta que o termo dado se refere representao do valor ou quantidade medida ao passo que informao, quando usada em um sentido tcnico, o significado daquele dado (Wikipdia, a enciclopdia livre, (consultada em 02/04/2012))

Informao um conjunto especfico de dados com caractersticas prprias, isto , conjunto de dados significativos e relevantes para o sistema a quem se destinam (Gouveia, L. M. B., 1996, p.17). Com as definies acima fica claro que, para ter informao preciso necessariamente que se tenha dados. com bons dados que se pode ter boa informao, por isso, a provenincia dos mesmos deve ser de confiana. A tabela 2.1.2 ilustra caractersticas de qualidade da informao obtida atravs de dados.

Caracterstica Precisa Oportuna Completa Concisa

Qualidade da Informao Informao com grau de rigor que revela uma caracterizao real, fivel, possvel, correta e verdadeira. A presena do fluxo de informao apropriado, contribui na velocidade de reao da organizao. A informao na organizao tem valor quando disponvel, e no quando esta dispersa. Informao pormenorizada ou muito extensa, no utilizada por contrariar dois princpios bsicos de comunicao: fcil de descodificar e fcil de difundir.

Tabela 2.1.2 Caracterizao da Qualidade de Informao; Fonte: Adaptado de Gouveia (2004)

2.1.3. Conhecimento O conhecimento complexo, cada autor tem perspetiva diferente sobre o assunto. O conhecimento pode ser encontrado em dois nveis, tcito e explcito. Tcito conhecimento pessoal, que no facilmente formulado e expresso. Explicito conhecimento formalizado e codificado. Conhecimento um processo, composto de vrias etapas, no trivial, interativo e iterativo, para identificao de padres compreensveis, vlidos, novos e potencialmente teis a partir de grandes conjuntos de dados (Fayyad et al, 1996). Este autor faz entender que o conhecimento til deve ser extrado e derivado de padres de dados, inter-relacionados por tarefas funcionais, com a finalidade de auxiliar nas tomadas de deciso. O interativo diz respeito ao controle humano sobre um processo de conhecimento no sentido de analisar e interpretar os dados e padres, e o iterativo significa a possibilidade de repeties integrais ou parciais do processo, a fim de aperfeioar e alcanar os resultados satisfatrios Carvalho, I. M.; Muhoz, D. L.C.; Ferreira, M. V. A. S.; Santos, P. M.; Rover, A. J.; Fialho, F. A. P. (ND). A figura 2.1.3 mostra fases do processo do conhecimento.

Figura 2.1.3 - Etapas do processo de conhecimento. Fonte: Adaptado de Fayyad (1996).

2.1.4. Sistemas da informao e a evoluo dos sistemas empresariais Sistema de informao (SI) o elemento chave para o desenvolvimento de uma organizao no mundo do mercado competitivo e inteligente. A teoria de sistemas de

informao a base de trabalho para os analistas de sistemas e um bom suporte para a compreenso duma rea de negcio, para auditores, consultores e os prprios agentes decisores (Gouveia, L. M. B., 1996, p.10). Sistema de informao um conjunto de aplicaes que partilham dados entre si (Silva, M. M. da, 2003, p.2). Pode-se observar que atualmente os sistemas de informao desempenham um papel de relevo no mundo empresarial, em outras palavras, uma empresa no poder adquirir vantagens competitivas se no usar como suporte os sistemas de informao. Com a modernizao os sistemas passaram a estar diretamente relacionados com a vida da organizao, quer no controlo quer nas atividades. A necessidade das organizaes de possurem dados integrados, histricos e geis, contribuiu positivamente para implementao e uso de DW. Ao longo do tempo, os sistemas foram evoluindo atravs das crescentes necessidades dos utilizadores, isso fez com que existisse a preocupao da busca de tecnologias cada vez mais avanadas para o alcance dos objetivos da organizao. por isso que, considera-se tecnologia da informao a base de recurso estratgico para o desenvolvimento contnuo de vantagem competitiva. Com a base das definies acima, pode-se fazer um breve historial da evoluo dos SI empresarial ao longo das ltimas dcadas. Os sistemas empresariais desenvolveram na mesma conformidade do desenvolvimento do hardware e do software. Fazendo uma perspetiva de SI pode-se considerar em desenvolvimento bastante acelerado (Hossain, L.; Patrick, J. D. & Rashid, M. A., 2002). Na dcada 60, muitos sistemas informticos centralizados foram desenvolvidos e implementados pelas organizaes, com o intuito de efetuar o controlo no armazenamento de mercadorias, inventrios e para clculos contabilsticos da empresa. Nesta dcada, guardavam-se grandes volumes de mercadorias nos armazns como forma de colmatar a demora na entrega de mercadoria ao cliente.

Nos anos 70, percebem que manter grandes volumes de mercadorias nos armazns implicava maiores custos de manuteno dessas mercadorias, bem como a imobilizao de uma quantidade importante de capital. Como forma de minimizar custos, houve a necessidade de repensar a gesto do armazenamento de matriaprima e do produto acabado. Neste contexto, os programadores e consultores comearam a pesquisar uma melhor forma de rentabilizar o seu trabalho. As empresas comearam a desenvolver seus prprios pacotes, que posteriormente foram adaptados realidade de outras empresas, tendo culminado com o aparecimento dos Material Requirements Planning Systems (MRP). Estes sistemas permitiam gerir o produto ou os seus componentes de acordo com o programa da produo (Hossain, L.; Patrick, J. D. & Rashid, M. A., 2002). Esta gerao de software chegou at aos meados dos anos 80, sucedido pelo Manufacturing Resources Planning (MRP II), que no seu funcionamento era muito semelhante ao seu predecessor, com a diferena de colocar maior nfase no controlo de inventrios, repercutindo-se diretamente na contabilidade e finanas. Nos anos 90 deu-se o aparecimento dos sistemas ERP, que forneciam informao mais precisa que os MRP e MRPII. No sistema ERP as atividades do negcio da empresa eram todas concentradas no mesmo pacote, sendo registadas todas as transaes efetuadas, enquanto que nas anteriores cada pacote poderia significar uma tarefa ou atividade. A tabela 2.1.4 mostra a evoluo histrica dos sistemas empresariais.

Tabela 2.1.4 - Evoluo histrica; Fonte: Adaptado de Hossain, L.; & Rashid, M. A., (2002)

Do ano 2000 para c, houve um impacto tecnolgico muito progressivo, com a maior contribuio da internet, possibilitando o acesso aos sistemas a qualquer hora e em qualquer lugar. O que encurtou a distncia entre fornecedor, produtor, revendedor e consumidor.

2.2. INFORMAO NAS ORGANIZAES


A existncia de qualquer organizao tem como misso a evoluo, quando essa misso for bem acompanhada e monitorada com os sistemas de informao, o seu crescimento ser rpido e progressivo. As organizaes dependem da utilizao da informao, principalmente para apoio tomada de decises. O processo de tomada de deciso consiste na escolha de uma opo, entre diversas alternativas existentes, seguindo determinados passos previamente estabelecidos que culminam na resoluo de um problema (Carlos, F. M. M., 2008, p.17). De um modo geral, o ser humano, enquanto indivduo, consome informao para tomar decises e, desta forma concretizar em ao as suas intenes (Gouveia, 2004). O dia-a-dia das organizaes tambm moldado em funo da tecnologia disponvel. Ao pensar nas organizaes necessrio de alguma forma, ter em linha de conta esta realidade (Teixeira, P. A. M.S., 2005, p.5). Computador insere um novo elemento na relao do indivduo com a informao. Funciona como um dispositivo de mediao de comunicao qual o indivduo recorre para lidar com a informao quer para seu prprio uso, quer para interagir com outros indivduos (Carlos, F. M. M., 2008, p.18). A forma como esta informao tratada na organizao, um dos fatores determinantes para o correto funcionamento (Carlos, F. M. M., 2008, p.18). O autor Laudon (2003) no livro Management Information Systems divide SI em quatro nveis, como mostra a figura 2.2.1, os quatro nveis esto atribudos em seis tipos de acordo com a funo de cada grupo dentro da organizao. Nvel estratgico, Executive Support Systems (ESS) Sistemas personalizados dirigidos gesto de topo, bastante interativos e flexveis que recebem

10

informao agregada e permitem realizar projees para suporte gesto da organizao. Nvel intermdio ou de Gesto, Management Information Systems (MIS) Sistemas direcionados para gestores intermdios que utilizam modelos simples para o tratamento de grandes volumes de informao, resultado das transaes, e produzem relatrios sntese para a gesto da organizao. Decision Support Systems (DSS) sistemas que ajudam os utilizadores na tomada de decises no estruturveis atravs de um processo interativo onde o sistema fornece informao, modelos e ferramentas para analisar a informao. Nvel do conhecimento, Knowledge Work Systems (KWS) Sistemas utilizados por pessoal tcnico, que incorporam modelos especficos de apoio ao diagnstico e avaliao de situaes complexas que requerem conhecimento especializado em reas definidas. Office Systems Sistemas de suporte s atividades de comunicao e administrativas caractersticas de um ambiente de escritrio. Nvel operacional, Transaction Processing Systems (TPS) Sistemas informticos que se caracterizam por desempenhar e registar as transaes de rotina dirias necessrias prossecuo da atividade da organizao, processam grandes quantidades de dados. A figura 2.2.1 ilustra estes tipos de sistemas da informao e sua hierarquia por nvel organizacional.

Figura 2.2.1 - Tipos de SI. Fonte: Adaptado de Laudon & Laudon, (2003)

11

O sistema organizacional e os SI so indissociveis. O conhecimento e compreenso de um deles em toda sua abrangncia, implica intrinsecamente conhecer e entender completamente o outro (Varajo, 2005). A figura 2.1.2 refora as caractersticas da informao de tomada de deciso nas organizaes. A informao, bem como a sua recolha, tratamento e apresentao tem como objetivo final facilitar a tomada de decises no negcio quer seja de nvel operacional, quer ttico, quer mesmo estratgico (Carlos, F. M. M., 2008, p. 20). A informao pode ser estruturada quando usada no nvel operacional, semiestruturada quando usada no nvel ttico e no estruturada quando usada na tomada de deciso ao nvel estratgico ou topo da organizao. As organizaes que recorrem o uso de sistemas de informao e tecnologias de comunicao devem considerar cinco elementos bsicos: objetivos de negcio, hardware, software, procedimentos e pessoas (Gouveia, 2004). A garantia de um bom enquadramento dos cinco elementos na organizao, assegurada pelo fluxo de dados, pela informao e pelo conhecimento dos indivduos envolvidos na tomada de deciso na organizao.

Figura 2.2.2 - Caractersticas da deciso; Fonte: Adaptado de Kimball (2002)

Um sistema empresarial melhora o funcionamento interno da organizao, o relacionamento com os clientes, o bom desempenho, e alcance de grandes descidas nos custos, e tudo isto, depende de como implementado e adequado na organizao (Kimball, 2002). Pode-se observar que os mritos dos sistemas no so adquiridos por si s, mas tambm como so implementados na organizao.

12

Uma informao considerada til e valiosa, quando responde atempadamente e de maneira segura aos objetivos para a qual foi concebida.

2.3. SISTEMAS OPERACIONAIS (OLTP) E SISTEMAS DE APOIO DECISO (SAD).


Os sistemas operacionais so aqueles que so concebidos para otimizar a entrada de dados com estruturas complexas, enquanto os Decision Support Systems (DSS), ou sistemas de apoio deciso (SAD) so utilizados na resoluo de problemas complexos e no estruturados. O funcionamento dos SAD combina tcnicas analticas com funes consideradas tradicionais no processamento de dados, como forma de recuperao da informao com interface interativo. O modelo dos sistemas de suporte a deciso, e o de entidade-relacionamento, procura eliminar a redundncia dos dados e facilitar a entrada dos mesmos. Mas cria muitas tabelas, que por vezes so difceis de compreender por apresentarem diagramas muito grandes, o que tambm dificulta a navegao dos utilizadores de dados (Kimball, 2002). Dado que normalmente existe uma BD operacional que suporta a atividade operacional da organizao, podia colocar-se a hiptese de efetuar as pesquisas analticas sobre esta mesma BD Carlos, F. M. M. (2008, p.25). Segundo este mesmo autor, as pesquisas so feitas atravs de sistemas Online Transaction Processing (OLTP), ou seja Sistemas de Processamento de Transaes Online, que poder no ter o resultado mais desejado e originar uma das seguintes situaes: 1 - Incapacidade de integrao - O sistema estar definido a um nvel de detalhe diferente daquele que requerido para a plataforma analtica. 2 - Comprometimento do desempenho do sistema - Otimizado para dar resposta a um conjunto de interrogaes e que passa a ter de lidar com questes analticas ad hoc. 3 - Incapacidade No conseguir lidar com informaes provenientes de outras fontes de dados. Devido aos fatores acima referidos, antes da proliferao de computadores nas organizaes, a anlise de dados nos sistemas operacionais passava pelo sector informtico que criava relatrios de auxlio. Com a proliferao de computadores a

13

anlise passou a ser feita diretamente pelo utilizador que toma a deciso, correndo maior risco de duplicao e fraca qualidade de dados. Os dados podem no ser extrados no mesmo instante, e os algoritmos usados podem ser diferentes e os nomes de atributos podem tambm ter significados diferentes (Kimball, 2002). Mesmo que uma organizao detenha uma estrutura que contenha informao relevante no contexto da organizao, existem vrias razes que demonstram a dificuldade em efetuar uma soluo analtica sobre esta estrutura (Carlos, F. M. M., 2008, p.26). Ao tomar em considerao as afirmaes acima citadas, a tabela 2.3.1 mostra o comportamento dos dados para a tomada de deciso usando OLTP, na viso de Cortes e Kimball.

CORTES Por norma a informao

KIMBALL Os sistemas operacionais

operacional est muito mais detalhada do geralmente esto dispersos por toda a que a utilizada para as funes analticas. organizao e foram desenvolvidos ou adquiridos de forma independente ao longo do tempo, no possuindo a integrao desejada. A informao atualizada vrias Os dados sofrem tornando alteraes difcil a vezes num sistema operacional o que constantemente,

dificulta que os dados funcionem de repetio de uma operao que fornea forma imutvel num dado perodo de as mesmas informaes. tempo como seria desejado para um sistema analtico. Enquanto operacionais basicamente limitadas analtico no esto os nos tcnicos mbito os com das sistemas Tentar extrair informaes com utilizadores so base no mesmo sistema, degrada a suas com

funes performance das aplicaes rotineiras.

competncias profissionais, no sistema gestores permisso para cruzar vrios sectores operacionais. Enquanto no sistema operacional A discrepncia entre as informaes

14

predominam analticos as

as

instrues no

de provenientes de dois sistemas que usam sendo tomada de deciso baseada em factos

modificao de dados, nos sistemas aplicaes diferentes pode levar a uma consultas, eficiente um sistema que contemple os no reais. dois tipos de operaes. Normalmente os sistemas analticos Os mesmos dados esto em operam sobre uma maior quantidade de inmeras BD diferentes, isto significa que dados face aos sistemas operacionais que os mesmos dados so mantidos por originam uma diferente necessidade de diversas pessoas, sistemas e processos, requisitos. consumindo recursos.
Tabela 2.3.1- Limitao de dados OLTP; Fonte: Adaptado Cortes e Kimball, em Carlos (2008)

Os dados transacionais so usados pelos usurios em geral no dia-a-dia em seus processos e transaes, gravao e leitura. Ex: consulta de estoque, registo de vendas (Vaisman, 1998, p. 5). Uma das grandes vantagens desta ferramenta a de reduzir ao mnimo o grau de redundncia, mas complexo para o utilizador final, na formulao de consultas devido fragmentao dos dados em diversas tabelas. Aps a verificao destes pontos, de compreender a importncia e necessidade da informao na organizao assim como, a forma de armazenamento e manuseio da mesma.

2.4. CARACTERIZAO DE DATA WAREHOUSE


Caracterizar DW descrever acima de tudo as propriedades que o constituem. Define-se um DW como sendo um repositrio de dados, destinado a apoiar os gestores na tomada de deciso segura e inteligente. William H. Inmon (2002,p.31), considerado um dos pioneiros deste tipo tridimensional de armazenamento de dados, definiu DW como sendo uma base de dados orientado por assunto, integrado, no voltil e histrico, concebida para suportar o processo de tomada de deciso1. O contedo do DW deve ser compreensvel. Os dados devem ser intuitivos e evidentes para o utilizador empresarial, no apenas o desenvolvedor2 (Kimball, R. & Ross, M., 2002, p.2). Com a base das definies dos considerados pioneiros em
1 A Data Warehouse is subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of managements decisions. 2 The contents of the data warehouse must be understandable. The data must be intuitive and obvious to the business user, no t merely the developer.

15

sistemas de armazenamento desta natureza, e com as realidades dos que j usam ou implementaram este tipo de repositrio nas suas organizaes, pode-se considerar DW como um instrumento chave na tomada de deciso segura e gil. DW uma ferramenta que oferece aos decisores de uma instituio ou empresa, o acesso a qualquer nvel de informao, que possa apoiar na sobrevivncia num mercado competitivo (Singh, 2001, p.14). Ainda este autor, considera Data Mart como subconjunto do DW que desempenha o papel de um DW departamental, regional ou funcional, podendo-se construir uma srie deles ao longo do tempo e eventualmente vincul-los atravs de um DW lgico para uma empresa completa3. DW so aplicaes construdas de raiz com o nico propsito de servirem como base, ou como instrumento de apoio, anlise dos dados sobre os quais uma organizao desenvolve as suas atividades (Caldeira, C. P., 2008, p.19). Ao fazer sntese das diversas definies e consideraes dos autores de renome neste tipo de repositrio de dados, verifica-se que a finalidade principal o suporte estratgico no apoio tomada de deciso. DW um sistema de armazenamento de dados muito complexo, que na sua conceo integra muitos componentes do tipo hardware, redes de computadores, software, sistemas e tecnologias de comunicao, servidores, bases de dados e sistemas operacionais. Para o bom funcionamento deste repositrio, devem reunir-se todos os dados ou toda a informao dispersa em sistemas operacionais da empresa, assim como, dados externos empresa, mesmo em formatos diferentes. A figura 2.4.1 ilustra um modelo de Inmon de processo de dados de DW.

3 Plays the role of a DW (departmental, regional or functional), and we could build a series of them over time and eventually link them through a company-whole logic DW

16

Figura 2.4.1 - Processo de data warehouse. Fonte: Adaptado de Inmon (1997).

Para melhor sustentabilidade dos dados, o DW necessita de uma boa arquitetura, hoje em dia, existem vrias dessas arquiteturas, a figura 2.4.2 ilustra uma delas na viso de Inmon.

Figura 2.4.2 - Arquitetura de Data Warehouse; Fonte: Adaptado de Inmon (1997)

O processo de gerao de informao para auxiliar na tomada de decises no uma atividade nova. No incio de dcada 60, consistia na criao de aplicaes individuais executadas sobre arquivos ou ficheiros mestres, o que criava redundncias

17

nos dados, tornava difcil o controlo e originava problemas de baixa produtividade, falta de credibilidade dos dados e a impossibilidade de transformar dados em informaes. Com a aplicao de Sistemas de Gesto de Bases de Dados (SGBD), os dados passaram a ser integrados numa nica fonte para todo o processamento, permitindo assim o aparecimento dos primeiros Sistemas de Apoio Deciso (SAD). O novo e crescente ambiente de negcio obrigavam cada vez mais necessidade de separao do ambiente de processamento operacional do analtico (Inmon, 1997). Com esta separao de ambientes, em 1992 surgiu o conceito de Data Warehouse. Numa organizao, o DW afasta-se dos planos estritamente operacionais e logsticos, porque este situa-se no plano mais elevado da ao estratgica e apresenta caractersticas especficas no mundo dos sistemas de informao. Facundes, E. M. (SD) considera:
A principal proposta do data warehouse pr nas mos dos gestores de negcios dados estratgicos propcios para as tomadas de decises baseadas em fatos verdicos e no por intuio. A produtividade oferecida pelo data warehouse traduzida em ganho de tempo e dinheiro. Com o cruzamento de dados, seleciona-se informao que os sistemas tradicionais ou leigos no conseguem identificar. Em determinadas empresas quando um gestor estratgico faz uma pergunta sobre o perfil dos seus negcios fora de um padro definido pelos analistas de sistemas o tempo e o esforo para responder longo. Porque vrias bases de dados devem ser consultadas para manipulao dos dados e gerar relatrios e grficos. Se uma deciso deve ser tomada acompanhando a velocidade do mercado competitivo, o executivo acaba tomando a deciso por meios alternativos no podendo esperar o resultado da rea de sistemas. Quando o assunto simulao de cenrios de negcios o processo ainda mais traumtico. Os sistemas estruturados atuais no so suficientemente flexveis para traar cenrios complexos usando cruzamento de vrios componentes.

Como se pode verificar, o intuito no o DW tomar decises, mas sim proporcionar uma boa informao que informe melhor e apoie os decisores nas suas funes. Em DW os utilizadores so considerados apenas como consumidores da informao e conhecimentos. Face interao homem sistema mquina, das ferramentas que potenciam o processamento analtico dos dados, o mais comum o Online Analytic Processing (OLAP).

18

Os sistemas de DW assumem o papel de concentradores dos vrios dados dispersos pela organizao, armazenando de uma forma integrada e homogeneizada. As principais caractersticas de um Data Warehouse/Data Mart so: facilidades de consulta da informao e consistncia, adaptabilidade e flexibilidade s mudanas, proteo destas informaes e utilizao da informao como base de tomada de deciso (Kimball, R.; Ross, M., 2002, p. 494). A figura 2.4.3 mostra os quatro componentes distintos e separados Sistemas operacionais, data staging area, rea de apresentao de dados e Ferramentas de acesso a dados existentes no ambiente DW.

Figura 2.4.3 - Elementos bsicos de DW; Fonte: Kimball, R., Ross, M. (2002, p. 494)

Cada um dos quatro elementos da figura 2.4.3 tem um papel determinante no bom funcionamento de DW, como se pode ver a seguir: 1 - Sistemas operacionais de origem desempenham o papel de captura das transaes da instituio. 2 - Data staging area local destinado a preparar dados e processos de origem que sero utilizados. 3 - rea de apresentao de dados onde ficam armazenados os dados disponibilizados ao utilizador final.

19

4 - Ferramentas de acesso aos dados ferramentas OLAP e de minerao de dados que facultam ao utilizador o manuseio e uso de dados de forma mais rpida, interativa, para executar anlises mensurveis. So estas que asseguram a consistncia, integrao e preciso, usando os Data Marts como fonte de dados. Independentemente do suporte fsico dos dados, (em estruturas relacionais para microdados e multidimensionais para macrodados agregados) vrias so as potenciais formas de visualizao da informao contida no DW (Quaresma, S., 2004).

2.5. MODELOS E TABELAS DE DATA WAREHOUSE


Ao falar dos modelos de um DW, necessrio ter-se em considerao antes de tudo, os elementos bsicos que compem esses modelos. Por isso, de forma resumida vai-se descrever os dois formatos de tabelas de DW. Tabelas de facto So normalmente usadas em modelo estrela, so normalizadas, no contm redundncias, e neste tipo de tabela que so representados os eventos de negcio da empresa, permitindo a anlise dos processos desses eventos. Tabelas de Dimenso So as que rodeiam ou alimentam a tabela de facto, geralmente so no normalizadas, contendo por vezes muita redundncia nos dados. So responsveis pela visualizao de dados, classificao e descrio dos elementos participativos nas tabelas de facto por isso que se considera no possuir atributos numricos. No basta falar de tabelas e no focar o que as caracteriza. As tabelas so constitudas por variveis. Variveis so atributos numricos que representam um acontecimento ou evento, pela combinao das participaes de tabelas dimensionais (Machado, 2006), como pode-se ver na figura 2.5, a tabela de facto Vendas acumuladas com atributos e em sua volta as tabelas de dimenso.

20

Figura 2.5 - Dimenses e de facto com os seus atributos. Fonte: Scalabrin, E. E. (ND)

2.6. MODELOS DE DW
Existem vrios modelos em DW, mas na essncia os principais so trs estrela, floco de neve, e constelao. Na generalidade basta que se opte por um destes trs esquemas de BD, para que se configure um DW. 2.6.1. Modelo em Estrela Este modelo vulgarmente conhecido como Star Schema. assim denominado devido a sua constituio em forma de estrela, estando ao centro a tabela de facto e rodeada por tabelas de dimenso, como ilustra a figura 2.5 acima. As tabelas dimensionais podem ser normalizadas ou no, mas o mais prtico no serem, visto que recebem dados vindos de muitos pontos diferentes. Cada tabela de dimenso tem apenas uma ligao com a tabela de facto fortemente normalizada. A tabela de facto pode estar ligada a vrias tabelas de dimenso. Este modelo em estrela foi criado pelo americano Ralph Kimball em 1998 e caracterizado pela presena considervel de dados redundantes nas tabelas dimensionais. O melhor funcionamento e rapidez deste modelo assegurado na medida em que as pesquisas so feitas primeiramente nas tabelas dimensionais, por intermdio de uma estrutura de chaves, para que no seja necessrio percorrerem todas as tabelas. A principal propriedade deste modelo de possuir uma nica tabela de facto contendo dados no redundantes. Cada chave primria na tabela de facto corresponde a uma de dimenso.

21

Tem como vantagem, o fato de disponibilizar ao utilizador final toda a informao necessria para a sua tomada de deciso segura e rpida, facilitar a incorporao de novos mdulos e respetiva manuteno. A desvantagem da tabela de facto depender das tabelas de dimenso. Como se viu anteriormente as tabelas de dimenso no so normalizadas, o que permite repeties de informao. As tabelas de dimenso por no serem normalizadas, ao alterar um determinado dado numa das tabelas, o sistema no atualiza automaticamente em todas as outras tabelas onde este dado mencionado. A figura 2.6.1 representa um modelo em estrela.

Figura 2.6.1 - Modelo estrela; Fonte: Adaptado de Machado (2006)

2.6.2. Modelo em Floco de Neve Este modelo tem uma estrutura semelhante ao modelo em estrela, e muito comum a sua aplicao. Possui a tabela de facto e tabelas dimensionais, com a particularidade do terminal ou extremidade de cada tabela dimensional, poder constituir o centro de outras estrelas. este ponto que diferencia o modelo em estrela. A figura 2.6.2 com a tabela de facto Vendas, esquematiza a estrutura deste modelo.

22

Figura 2.6.2 - Modelo Floco de Neve

No aconselhvel a transio do modelo em estrela para este tipo, devido grande complexidade no uso final para o utilizador. Oferece vantagens em consultas nas estrelas com mais de uma dimenso em comum e conformes. um modelo normalizado, evita assim logo de princpio as redundncias nos valores em tabelas (Machado, 2006). 2.6.3. Modelo em Constelao um modelo que pode ser visto como uma juno de muitos modelos em estrela, por terem muitas tabelas de facto e dimensionais que partilham entre si. Alguns projetistas consideram que os Data Marts utilizam o modelo em estrela enquanto os Data warehouses utilizam o modelo em constelao. A figura 2.6.3 representa este modelo.

Figura 2.6.3 - Modelo em constelao; Fonte: Carlos, F. M. M. (2008)

23

2.7. PROCESSO DE MODELAO


uma ao onde se define as tabelas de facto e dimenso, atributos, relacionamento e hierarquia. Processo de modelao dimensional adapta-se na perspetiva do utilizador final, escolher as dimenses e os factos a incluir no DW (Carlos, F. M. M., 2008, p.40). Considera-se ainda que o processo de modelao top down e que se deve ter em conta os aspetos mencionados na tabela 2.7 Processo de negcio Granularidade necessrio responder questo: onde e como so recolhidos os dados? A granularidade determina a dimensionalidade do DW e tem impacto no seu tamanho. Quase sempre faz sentido guardar os dados acerca das dimenses com a maior granularidade possvel. O objetivo no ver cada registo individualmente, mas permitir que as pesquisas sejam mais precisas. Dimenses da tabela de factos Geralmente possvel acrescentar outras dimenses, desde que exista apenas um valor dessas dimenses para cada combinao de valores das dimenses j existentes. Se isso no acontecer, necessrio rever a granularidade do modelo. Medidas na tabela de factos Na maioria dos casos uma perda de tempo tentar normalizar as tabelas de dimenso pois iria dificultar a atividade em que o utilizador explora uma nica dimenso com o objetivo de definir colunas e restries para uma pesquisa posterior que consiste em verificar o valor de determinados atributos quando se restringe o valor de outros atributos. Dimenso tempo A dimenso tempo, presente em quase todos os DW apresenta vantagens em relao data em SQL como: permitir anlise de dias da semana/fins-de-semana; facilita a diviso em perodos fiscais; permite anlise de vendas em feriados e datas especiais; cada registo na tabela representa um dia; a tabela no construda a partir dos sistemas fonte/operacionais; pode conter dias que ainda no aconteceram e conter campos que permitem anlise de dados em perodos temporais. Hierarquias explcitas A definio de hierarquias explcitas facilita as operaes de drill-down e rollup, ou seja, em aumentar e diminuir o nvel de

24

detalhe de uma consulta. Tabela de factos sem factos Existem no entanto, alguns processos de negcio suscetveis de serem modelados num DW, aos quais no existem factos associados. Nestas situaes utilizam-se tabelas de factos sem factos. Dimenses muito grandes Este tipo de dimenses necessita de um tratamento diferente de forma a acelerar as pesquisas e a facilitar alteraes. Algumas das solues apontadas passam pela criao de ndices apenas nos campos utilizados para fazer pesquisas e na criao de mini dimenses com campos que mudam com frequncia. Os campos demogrficos so bastante utilizados, quer individualmente, quer em conjunto, para restringir as consultas num DW. A forma mais eficaz de utilizar estes atributos consiste em coloc-los numa mini-dimenso separada. Para atributos com carcter contnuo devem utilizar-se gama de valores e para dimenses muito grandes, as minidimenses permitem poupar espao e acelerar as consultas.
Tabela 2.7 - Aspetos no Processo de Modelao; Fonte: Adaptado de Kimball (2002)

2.8. ERROS MAIS FREQUENTES NA MODELAO.


Em qualquer modelao de dados existem erros, sendo este trabalho um modelo conceptual, logicamente exigir modelao de dados, sendo assim, sempre bom precaver os possveis erros que surgem com maior frequncia e que facilmente so cometidos com maior incidncia. Kimball (2002), citado em Carlos, F. M. M. (2008, p.42) considera de relevo os seguintes erros:
1- Tabelas de facto com atributos de texto

Os atributos de texto no podem estar na tabela de factos, esta tabela deve conter apenas as medidas numricas. As descries dos atributos devem ser colocadas nas tabelas de dimenso.
2- Atributos com descrio limitada

Geralmente a tabela de factos maior em relao as dimensionais, o que leva muitas vezes limitao na descrio dos contextos nestas tabelas. de salientar que necessria a descrio completa por cada cdigo da tabela dimenso.

25

3- Hierarquias em mltiplas dimenses

As hierarquias devem estar em forma de cascata de relacionamento de muitos para 1, pertencendo a uma nica tabela de dimenso.
4- Alteraes nas dimenses

As alteraes dos atributos nas dimenses no podem ser ignoradas, devido dinmica constante do mercado.
5- Problemas com hardware

Faz parte do programa de manuteno e evoluo dos sistemas de suporte deciso, ao adicionar mais hardware para o melhoramento do desempenho.
6- Chaves operacionais e primrias

As chaves operacionais no podem e nem devem ser usadas como chaves primrias em tabelas de dimenso, porque pode trazer srios problemas no Data Warehouse.
7- Granularidade da tabela de factos

No se deve negligenciar a granularidade da tabela de factos, o passo primrio a seleo dos processos para a tabela de factos. Em seguida, definir com exatido a granularidade dos dados, para construo da tabela de factos e escolha das dimenses validas para a granularidade desejada.
8- Modelo dimensional com base num relatrio

A tabela de factos deve representar os processos de negcio da empresa e no apenas para satisfazer um determinado requisito, por isso, as tabelas dimensionais no devem constituir um determinado relatrio de negcios.
9- Pesquisa de dados atmicos num formato normalizado

Os modelos normalizados so teis de certa forma, mas no devem ser usados para fornecer dados aos utilizadores, com isto, significa que os utilizadores nunca devem pesquisar dados atmicos num formato de modelo normalizado, visto que, dados atmicos so a fundao do modelo dimensional.
10- Conformidade nas tabelas de factos e dimenses

Em processos diferentes de negcios, quanto menos Data Marts isolados melhor. Se as tabelas de facto associadas so da mesma dimenso ento as tabelas de dimenso devem ser idnticas. O segredo na construo de Data Marts distribudos

26

est nas tabelas dimensionais, o que permite a incluso de novas fontes e funcionamento de mltiplas tecnologias no compatveis.

2.9. FERRAMENTAS DE BUSCA, TRANSFORMAO E ACESSO


Para que se possa ter um bom repositrio de dados com qualidade desejvel num mercado competitivo, necessrio que o DW esteja provido de ferramentas tecnicamente aceitveis em ambientes multidimensionais. No se ir descrever na ntegra todas as ferramentas disponveis no mercado, apenas referenciar e descrever de forma sumarizada a ETL e OLAP, uma vez que, OLTP j foi referenciada acima nos sistemas operacionais. A tabela 2.9.1 referencia as ferramentas e sua finalidade.

Ferramenta Armazenamento de dados. Extrao de dados

Finalidade e breve descrio Considerada como tendo grande potencial, por ser este um dos grandes objetivos da existncia do DW. Responsvel pela busca nas bases de dados operacionais, os dados que sero armazenados em DW. Esta ferramenta est diretamente relacionada com os metadados (MD) por estes permitirem saber a origem da informao, as alteraes, tendo como funo principal, manter a consistncia dos dados.

Transferncia de dados e replicao

Considerado subconjunto das ferramentas de extrao. No transforma nem processa dados, apenas muda os dados de um lugar para outro, usada geralmente na consulta ou pesquisa, para facilitar ou dar resposta s buscas de uma forma mais rpida, agilizando o servio solicitado.

Transformao

atravs desta que os dados em formatos diferentes, so ajustados e transformados para o formato do DW. Estando j em formato de DW, as pesquisas ou consultas ficam facilitadas.

Limpeza de dados Gesto

Como prprio nome diz, limpa os dados, ajusta-os, faz as devidas correes e fuses de dados quando necessrio. Monitoriza a performance e segurana do sistema

27

Consultas

Usadas para consultas ou gerar relatrios com os dados retirados de DW, apresentando em formato apropriado

Gesto de relatrios

Esta ferramenta semelhante de consultas, s que ela direcionada para os relatrios mais complexos, por exemplo aqueles que contm grficos, sejam eles relatrios sintticos ou analticos.

Data mining

utilizada na descoberta de novas tendncias entre as informaes da empresa, novos padres e novas correlaes, atravs da anlise de grandes quantidades de dados armazenados em DW usando tcnicas estatsticas e matemticas apropriadas.

Simulao OLAP

Simula cenrios respondendo a perguntas do tipo e se. a parte mais visvel do DW, e faz a anlise dos dados. Auxiliam os gestores a sintetizarem as informaes das organizaes por meio de comparaes, anlise histrica e projees.

Tabela 2.9.1 - Ferramentas de DW; Fonte: Adaptado de Dill, S. L. (2002)

2.9.1. ETL uma ferramenta com a funo de extrair dados heterogneos na base de dados operacionais ou outras fontes, transformar, limpar e carregar no DW ou DM segundo as necessidades da empresa no mercado. Muitos autores consideram esta como sendo a fase mais crtica e demorada na construo de DW ou do posterior DM. A tomada de decises com apoio nos dados armazenados em DW provm da informao fornecida pelas ferramentas de tipo front-end, se estes dados no forem corretamente trabalhados no processo de extrao, as informaes geradas atravs deles faro com que decises sejam tomadas erroneamente, podendo afetar diretamente os negcios da organizao (Abreu, F. S. G.G., 2008). A extrao de dados pode levar aproximadamente 60% de horas de construo de DW (Kimball, 1998). Este processo deve basear-se na busca em bases tradicionais ou externos, informao importante que esteja de acordo com a

28

modelagem do sistema. No momento de criao do DW normal uma carga inicial de dados que faa com que a extrao v buscar todos os dados dos sistemas fontes em uso na organizao ou especficos de determinados assuntos. Mas com o andar do tempo a extrao deve estar preparada para fazer somente carregamentos incrementais. A carga incremental que carregue somente os registros que foram alterados ou inseridos desde a carga inicial muito mais eficiente (Kimball, 1998, citado em Abreu, F. S. G. G., 2008). A transformao dos dados a fase subsequente sua extrao. Esta fase no s transforma os dados, mas tambm realiza a limpeza dos mesmos. A correo de erros de digitao, a descoberta de violaes de integridade, a substituio de caracteres (Gonalves, 2003) citado em (Abreu, F. S. G. G., 2008). As afirmaes destes autores confirmam claramente que a fase de ETL a mais crtica na implementao de DW. Um exemplo bem comum de utilizao do ETL para sistemas transacionais o uso de informaes de bases corporativas para estes sistemas (Abreu, F. S. G. G., 2008).

Figura 2.9.1 - Processo ETL; fonte: Abreu, F. S. G. G. (2008)

29

OLTP 1 OLTP 2 OLTP 3 OLTP n

Dados 1

Dados 2

Repositrio central

ETL

Dados 3

Dados n

Outras Fontes

Dados de outras fontes

Figura 2.9.2 Carregamento e transformao de dados

2.9.2. Ferramenta OLAP Esta a ferramenta mais popular em termos de uso na explorao em tempo real de um DW. uma ferramenta de Business Intelligence, muito utilizada principalmente em modelos de DW em estrela, e tambm se presta a anlises ad hoc. Possui uma grande capacidade para efetuar clculos considerados complexos e para a converso de volumosas bases de dados em informao. O termo OLAP sinnimo de conjunto de ferramentas direcionadas ao acesso e anlise ad hoc, com a finalidade de transformar dados em informaes capazes de apoiar aos gestores na tomada de decises de forma amigvel e flexvel em tempo hbil (Arajo, E. M. T., SD). As ferramentas OLAP proporcionam condies de
anlise de dados on-line necessrios para responder as possveis perguntas dos analistas, gerentes e executivos (Machado, 2004) citado em Arajo, E. M. T. (ND).

Ferramentas OLAP so aplicaes de apoio ao utilizador final, para conceber ou consultar relatrios com a informao extrada em DW, para apoio tomada de deciso. Em DWBRASIL OLAP (2005) citado em Arajo, E. M. T. (SD) no seu artigo um estudo sobre as ferramentas OLAP, afirma que as caractersticas desta ferramenta a capacidade de efetuar algumas operaes tais como:

30

Drill Across: ocorre quando o usurio salta um nvel intermedirio dentro de uma mesma dimenso. Por exemplo, a dimenso tempo composta por ano, semestre, trimestre, ms e dia. A operao Drill Across executada quando o usurio passa de ano direto para trimestre ou ms. Drill Down: acontece quando o utilizador aumenta o nvel de detalhe da informao, diminuindo a granularidade. Drill Up: o contrrio do Drill Down, ocorre quando o usurio aumenta a granularidade, diminuindo o nvel de detalhe da informao; Drill Through: ocorre quando o usurio passa de uma informao contida numa dimenso para uma outra. Por exemplo: Inicia na dimenso do tempo e no prximo passo analisa a informao por regio; Slice and Dice: uma das principais caractersticas de uma ferramenta OLAP. Como a ferramenta OLAP recupera o microcubo (No OLAP, as informaes so armazenadas em cubos multidimensionais, que gravam valores quantitativos e medidas, permitindo visualizao atravs de diversos ngulos. Estas medidas so organizadas em categorias descritivas, chamadas de dimenses e formam, assim, a estrutura do cubo), surgiu a necessidade de criar um mdulo, que se convencionou de Slice and Dice, para ficar responsvel por trabalhar esta informao. Serve para modificar a posio de uma informao, trocar linhas por colunas de maneira a facilitar a compreenso dos utilizadores e girar o cubo sempre que houver necessidade.

As

ferramentas

OLAP

obedecem

uma

estrutura

cliente

/Servidor

multiutilizadores e podem ser classificadas em cinco seguintes tipos (Inmon, 1997): MOLAP (Multidimensional Online Analytical processing); ROLAP (Relational Online Processing); HOLAP (Hybrid Online Analytical Processing); DOLAP (Desktop Online Analytical Processing); WOLAP (Web Online Analytical Processing). Para armazenamento de dados esta ferramenta obedece a vrios ambientes, no caso de Rolap e Molap obedece ao ambiente de dados multidimensional, enquanto que Holap, Dolap e Wolap podem estar em ambientes locais de bases de dados,

31

ficheiros ou em memrias de workstations. Claramente se v que a principal caracterstica de OLAP facilitar ao utilizador final as consultas e construo de relatrios, mesmo que o utilizador no tenha bases slidas em anlises apoiadas nos sistemas e tecnologias da informao. A tabela 2.9.2 faz uma breve comparao das ferramentas OLTP e OLAP.

Tabela 2.9.2 - Ferramentas OLTP e OLAP; Fonte: Silva, C. I. M. e (2011)

2.10.

BUSINESS INTELLIGENCE (BI) E DATA MINING

BI aqui descrito, o incorporado na ferramenta SQL server 2008 da Microsoft, porque esta ferramenta a proposta para construo do DW para INE-M. O Business Intelligence consiste num conjunto vasto de aplicaes e tecnologias para recolha, armazenamento, anlise e acesso a dados que ajudem os gestores a tomar melhores decises. Inclui, entre outros, sistemas para apoio deciso, anlise estatstica e o Data Mining (dmg) (Crisp, 2007). Tomando como base a estrutura organizacional de um SI, o BI comporta os nveis: Operacional, destinada automao das decises; Ttico, direcionado ao apoio na tomada de deciso e nvel Estratgico, ao apoio deciso operacional e sistemas de apoio ao executivo de topo.

32

Data Mining o uso de muitos mtodos de aprendizagem e anlise para extrao de conhecimentos atravs de dados, passando por diversas fases como: preparao dos dados, compreenso do processo do negcio, avaliao dos modelos, modelao dos algoritmos, modelao das tcnicas e disponibilizao na produo (Crisp, 2007). Com vista a solucionar problemas e tarefas em Data Mining, so utilizados algoritmos especficos como: a) Mtodos estatsticos destinados a problemas de predio e classificao. b) rvores de deciso aplicadas em tarefas de classificao. c) Regras de associao usadas em Market Baskett Analysis. d) Clustering aplica-se no agrupamento de dados. e) Tcnicas de Visualizao usadas em 4D ou mais dimenses com coordenadas paralelas e grficos de disperso. No mbito do BI para este estudo, a ferramenta SQL server 2008 possui muita potencialidade para conceo do projeto de DW. Na viso de Silva, C. I. M e (2011, p.60) destaca Analysis Services, Business Intelligence Development Studio, Integration Services e Reporting Services como pontos fortes de SQL server 2008 na construo de DW. Ainda segundo Silva, C. I. M e (2011, p. 60) para alm destes recursos, o Microsoft SQL Server 2008, fornece ainda dois ambientes distintos para a construo, implementao e gesto do recurso de Analysis Services: O Business Intelligence Development Studio e o SQL Server Management Studio. Na utilizao desta ferramenta, o autor aconselha sempre que possvel acoplar na mesma plataforma de BI duas ferramentas de construo de relatrios, o Excel Services e o Report Builder 2.0 para apoiar o utilizador final no manuseio de relatrios existentes, ou ter permisso para elaborar novos relatrios. O Excel Services pertence ao Microsoft Office SharePoint Server 2007, usa folhas de clculo do Microsoft Excel 2007. A sua funo simplificar, partilhar, garantir a segurana e gesto dos relatrios interativos de forma consistente. A interao com o DW nesta plataforma feita atravs da ferramenta colaborativa considerada frontend, denominada Windows SharePoint Services 3.0.

33

2.11.

CUSTOS E BENEFCIOS DO DW

A construo ou montagem de qualquer estrutura envolve custos e benefcios, assim acontece com o DW. aconselhvel analisar os custos e benefcios muito antes de o construir, de forma que a organizao ou empresa possa se organizar e prever os investimentos possveis para que haja satisfao no uso de DW nos seus negcios. 2.11.1. Custos necessrio organizar e prever quanto antes, os custos para implementar DW numa organizao, para que possa atingir os objetivos para os quais concebido. Caso contrrio, podero surgir problemas srios que at possam impedir a sua construo. A classificao dos custos decorrentes da implantao do DW consiste na diviso do investimento, entre custo inicial e custo peridico. Tambm pode ser dividido, quanto ao tipo de investimento, em custos capitais e custos operacionais (Carlos, F. M. M., 2008, p.53). Os custos capitais so referentes compra de equipamentos, servios e estrutura. Enquanto os custos operacionais esto relacionados com pessoal, no necessariamente gastos financeiros, mas sim gastos de tempo para o desenvolvimento de solues (Inmon, 2002, p.66). Nesta tica os custos podem ser divididos em inicial e peridicos, consoante a sua aplicabilidade e destino. Custo Inicial corresponde ao investimento efetuado com o hardware, software e pessoal, aquando a implantao do DW. O custo peridico aquele que oriundo do uso de DW, atualizao e manuteno. Pode igualmente corresponder ao hardware, software e pessoal. Os fatores que podem influir nos custos segundo Carlos, F. M. M. (2008, p.55) podem ser: 1- A quantidade de dados gerados pelo dia-a-dia operacional determina o crescimento do equipamento e do software do DW. 2- O histrico que deve ser armazenado no DW a quantidade de dados que poder ser armazenada. 3- O necessrio nvel de detalhe dos dados quanto maior o detalhe contido nos dados, mais espao de armazenamento necessrio.

34

4- O nvel de formao que os utilizadores necessitam para se adaptarem ao DW. 5- Se est num mercado competitivo ou no que tipo de anlise deve ser feita pelos programas que trabalham sobre o DW. 6- A velocidade com que o DW precisa ser construdo quanto mais rpido, mais profissionais trabalham e consomem tempo a desenvolv-lo, e como consequncia, maior deve ser o investimento. 7- Se o DW ser construdo manualmente ou atravs de ferramentas automticas o processo manual requer menos gasto com software, mas muito mais gastos com pessoal, tanto no custo inicial quanto no custo peridico. 8- O nmero de Data Marts a construir quantos departamentos necessitam da sua prpria visualizao dos dados analticos, tendo a necessidade de construir os seus prprios Data Marts. 9- A quantidade de sumrios e dados sumariados a ser mantido quanto mais sumrios, menor a quantidade de acesso aos dados detalhados, que podem estar armazenados em dispositivos de armazenamento de massa. 10- A escolha do SGBD correto, que contenha o maior nmero de ferramentas de ETL e administrao nativas. 11- A escolha do hardware correto, de acordo com as necessidades de processamento e armazenamento. 12- A contratao de bons profissionais para realizar cada tipo de servio 13- Erros na implementao devido a economias na hora de fazer o projeto do DW. 2.11.2. Benefcios Os benefcios de um DW na organizao podem ser medidos de diversas formas, como por exemplo, um grande retorno com menor investimento, d vantagens nos negcios, aumenta os lucros e a competitividade da organizao. O investimento num DW no compensa se o custo no for pago gradualmente com o uso

35

dele. Assim, para que o DW se pague mais facilmente, preciso encontrar o equilbrio entre o custo do DW e o benefcio para a organizao (Carlos, F. M. M., 2008, p. 55). Dos vrios benefcios que o DW traz ao quotidiano de uma organizao, o mais simples de se ver a facilidade de extrao de relatrios integrados e sua diminuio de custo ao extrair relatrios sem um DW (Carlos, F. M. M., 2008, p.55). Na viso do autor Inmon (2008), uma organizao que possui vrias aplicaes operacionais precisa de: 1. Localizar em que sistemas esto os dados; 2. Recuperar os dados; 3. Extrair dados de cada um dos sistemas operacionais; 4. Integrar/transformar os dados; 5. Padronizar os dados; 6. Reconciliar os dados; 7. Modificar as estruturas de dados; 8. Reunir os dados; 9. Construir o relatrio. Numa viso geral pode-se observar que o esforo na produo de relatrios operacionais envolve muitos custos e um tempo muito longo, com a particularidade de no se reaproveitar, visto que, as necessidades mudam consoante o tipo de relatrio. Usando DW, os relatrios que demoravam semanas e meses para estarem prontos, podem levar apenas horas ou alguns dias, porque alguns dos passos do modelo operacional, no DW so feitos num nico passo.

2.12.

FATORES CRTICOS DE SUCESSO DO DW

Consideram-se fatores crticos de sucesso do DW, os que determinam o xito da sua implementao na organizao. Perkins, A. (2000) indica alguns fatores crticos de sucesso: 1. Definio do projeto 2. Administrao de expectativas 3. Patrocinador forte 4. Envolvimento dos utilizadores

36

5. Pessoal qualificado no projeto 6. Estratgia de implementao da arquitetura 7. Extrao, transformao e carga dos dados 8. Modelo dos dados 9. Metadados 10. Conceo da Arquitetura e Infraestrutura Tecnolgica 11. Ferramentas dos utilizadores finais 12. Acompanhamento

37

3. METODOLOGIA
Uma pesquisa uma atividade sistemtica realizada com base em certos mtodos e tcnicas, com o intuito de atingir um objetivo cientfico. Para o alcance desses objetivos no basta efetuar simplesmente a quantificao de fenmenos. Precisa de descrever e demonstrar tudo o que estiver em redor do cenrio. O objetivo de estudar detalhadamente a complexidade do mundo cotidiano pode ser alcanado atravs de uma variedade de mtodos. A atividade bsica da cincia a pesquisa, inserida como atividade crtica e criativa de questionamento sistemtico (Lustosa, R. B., 2009, p.92). Ainda este mesmo autor refere que a cincia um processo racional e permanente de busca da verdade ou de respostas a questes propostas. Para atingir uma verdade, preciso seguir formalidades orientadas por princpios cientficos estabelecidos com o objetivo de criar formas para validar o estudo cientfico. Com isto reala-se que s com pesquisa cientfica podem atingir-se os resultados preconizados nos objetivos da investigao.

3.1. METODOLOGIA DE PESQUISA


Sendo primordial a escolha da metodologia a seguir neste estudo, importante a definio da natureza da pesquisa a usar. O estudo tem por finalidade produzir conhecimentos de aplicao real na soluo de problemas especficos e globais, por isso, carateriza-se como uma pesquisa de carter aplicada. Nesta pesquisa aplicou-se uma metodologia qualitativa, porque permitiu interlocuo direta entre o utilizador e o pesquisador. aconselhvel dar maior relevncia ao aspeto subjetivo da ao social. Ao contrrio da abordagem clssica ou positivista, que estabelece como regra a impessoalidade do pesquisador na investigao do fenmeno, existe um vnculo indissocivel entre o mundo objetivo e a subjetividade do sujeito (Lustosa, R. B., 2009, p.93). A metodologia por outro lado pode ser vista como um guia de orientao seguro para o pesquisador nas suas atividades de investigao e tomada de decises pontuais. Flick (2004) citado em Lustosa, R. B. (2009, p. 93) afirma que a pesquisa qualitativa no se baseia em um conceito terico e metodolgico unificado. Ao tomar

esta citao como base de sustentao, leva a crer que vrios mtodos tericos e discusso prtica na pesquisa conduzem aos resultados mais precisos e com qualidade desejvel. Os mtodos qualitativos consideram a comunicao do pesquisador com o campo e seus membros como parte explcita da produo de conhecimento (Lustosa, R. B., 2009, p. 93). O conhecimento criado com base em observaes, erros, aes, sentimentos e mais fenmenos interpretveis. Assim, a pesquisa qualitativa aplicada, obedecendo os dois critrios exploratria e descritiva constitui igualmente um conhecimento. Para Verga (2004) citado em Lustosa, R. B. (2009, p.94), a investigao exploratria deve ser realizada em rea na qual haja pouco conhecimento acumulado e sistematizado. Nos primeiros momentos de estudo desta natureza, esta metodologia a mais aconselhvel porque permite uma melhor busca do tema em estudo, correlacionando de forma participativa, tendo em conta de que o produto se destina a um setor pblico, neste caso da realidade moambicana. A abordagem exploratria ajuda ao pesquisador a conhecer melhor o tema em estudo, permitindo-lhe maior contribuio nas propostas de solues. A metodologia qualitativa descritiva ajuda a descrever as caractersticas ou fenmenos do processo em estudo. Para este caso, a primeira fase exploratria foi para melhor conhecer o ambiente do tema escolhido: modelo conceptual de Data Warehouse. A segunda fase que a descritiva, dedicou-se a descrever o ambiente da instituio do estudo do caso. Nisto, para reforar que o meio onde acontece a investigao cientfica tambm pode ser classificado.
De modo diferente da pesquisa quantitativa, os mtodos qualitativos consideram a comunicao do pesquisador com o campo e seus membros como parte explcita da produo de conhecimento, ao invs de exclu-la ao mximo como uma varivel intermdia. As subjetividades do pesquisador e daqueles que esto sendo estudados so parte do processo de pesquisa. As reflexes dos pesquisadores sobre suas aes e observaes no campo, suas impresses, irritaes, sentimentos, e assim por diante, tornam-se dados em si mesmos, constituindo parte da interpretao, sendo documentadas em dirios de pesquisa ou em protocolos de contexto (Flick, 2004, citado em Lustosa, R. B., 2009, p.

95).

39

de considerar que a metodologia qualitativa capaz de resolver os problemas de pesquisa acadmica, transformando-a em realidade para a utilizao da sociedade. Com esta metodologia o papel do pesquisador participativo, no ser o de relator de acontecimentos como um mero observador que no estivesse envolvido. O pesquisador ir interagir com os envolvidos na pesquisa, seja nos seus postos de trabalho, convivncia, lazer ou onde melhor convm para o participante. Como afirma Lustosa, R. B. (2009, p. 97) Cada momento possui um objetivo especfico, que ao mesmo tempo pode promover ou sofrer alterao pela reflexo da pesquisa. O uso de uma metodologia qualitativa descritiva num estudo conceptual de DW permite uma anlise mais profunda. Sendo o INE M o estudo de caso, o universo da pesquisa concentrou-se numa populao alvo que a amostra dos funcionrios capacitados desta instituio pblica. A pesquisa no INE M contou na sua globalidade com a participao ativa de todos os funcionrios, mas na essncia de recolha de dados usou-se uma pequena amostra constituda pelos gestores de topo, gestores intermdios e responsveis seniores do departamento de informtica e sistemas de informao da instituio. Utilizou-se como instrumento de pesquisa a entrevista presencial assistida por um guio. A tabela 3.1.1 ilustra a amostra envolvida no levantamento de dados. Considerou-se satisfatria pelo n dos elementos da instituio envolvidos. Presidncia Diretores Total Homens entrevistados Mulheres entrevistadas Totais entrevistados 2 4 3 2 1 1 3 2 6 3 Dir. Adjuntos Informtica 5 3 10 1

Tabela 3.1.1 - Amostra de recolha de dados.

40

3.2. METODOLOGIA CONCEPTUAL DE DW


Esta pesquisa, visa encontrar uma forma melhorada de suporte tomada de deciso, atravs da gesto da informao estatstica produzida pelo INE M. Para melhor atendimento ao mercado interno ou externo, a produo de informao de qualidade e atempada indispensvel numa instituio como do INE Moambique. Para melhor entender este tipo de base de dados necessrio tomar em considerao as metodologias dos autores considerados pioneiros deste tipo de repositrio, Inmon e Kimball. A escolha de uma das metodologias de Inmon ou Kimball apenas uma opo de arquitetura, porque nem todas as ferramentas usuais so compatveis entre si. Por isso, cada organizao deve optar pelo modelo que mais lhe convm para sua maior eficincia e desafios operacionais. Assim, entender os conceitos bsicos da arquitetura e da metodologia de ambos os modelos proporciona um bom conhecimento acerca de Data Warehousing. Alm de permitir adquirir conhecimentos especficos acerca das necessidades especficas de cada organizao (Carlos, F. M. M., 2008, p.62). Inmon e Kimball so considerados os pioneiros em Data Warehouse, cada um com a sua metodologia. Inmon defende a metodologia top-down enquanto Kimball defende a metodologia bottom-up. A figura 3.2 ilustra as fases de qualquer uma das metodologias (Inmon ou Kimball) na conceo de DW. importante o registo do desenvolvimento das atividades por cada fase, assim como os responsveis de cada tarefa. Esta prtica facilita a entrega do DW por fases, que vo ficando concludas, enquanto trabalham noutras.

41

Figura 3.4 - Fases da Metodologia; fonte: Carlos, F. M. M. (2008, p.96)

3.2.1. Metodologia de INMON Inmon sugere que o projeto deve iniciar com um plano de migrao de dados do sistema operacional para o DW. Esta operao envolve inmeras atividades ou tarefas, desde a limpeza de dados at ao mapeamento. O plano deve contemplar os principais assuntos ou processos, de negcio existentes na instituio. Deve tambm definir os relacionamentos, identificar as chaves e atributos de cada tabela. Este tipo de plano denominado modelo de dados corporativos. DW no deve ser construdo como uma nica tarefa, porque implica riscos na sua aplicao, o que pode levar a no ter sucesso no seu funcionamento. Na sua conceo deve inicialmente elaborar-se um plano interativo que permitir o acrscimo de novos requisitos (Inmon, 2002). Esta metodologia define primeiro o modelo de dados corporativos, em seguida constri-se o modelo de dados especfico de cada negcio que determina os requisitos da empresa. A fase de negcios especficos seguida pela identificao das fontes que iro alimentar de dados os modelos concebidos. Deve escolher-se as fontes de informao, avaliando-as segundo um conjunto de critrios especficos. Como exemplos destes critrios temos: disponibilidade, qualidade, acessibilidade ou desempenho dos sistemas. Esta avaliao dever ser realizada com rigor e anlise

42

detalhada sobre os dados que esto disponveis, tendo em considerao aspetos como a sua correo, redundncia, acesso e a sua caracterizao (metadados) (Carlos, F. M. M., 2008). O passo seguinte o desenho propriamente dito do DW e a respetiva definio dos processos que tero a misso de transformar os dados de sistemas operacionais, para esta nova ferramenta. A primeira fase de construo do DW conclui-se com o povoamento deste, e com as primeiras interaes com o utilizador final. Estes utilizadores devem informar todas reaes que detetarem durante o uso do sistema. atravs dessa informao que a equipa que desenvolveu o DW faz os reajustes e correes no sistema. Para melhorar o funcionamento, todos os elementos que participaram na elaborao devem fazer parte da equipe de reviso. O chefe da equipe deve ser um elemento externo ao projeto, com o intuito de dar novas perspetivas (Inmon, 2002). A tabela 3.4.1 mostra quatro fases especficas de desenvolvimento de DW, como prope e defende autor Inmon.

Fases Meth1 Meth2 Meth3 Meth4

Descrio Dedica-se ao processo de desenvolvimento operacionais. Cuida da implementao do DW. dos sistemas

Descreve o desenho e especificao dos processos de acesso ao contedo do DW. a fase que aborda as tarefas de desenvolvimento dos processos de acesso ao contedo do DW.

Tabela 3.4.1 - Fases da metodologia de desenvolvimento; Fonte: adaptado de Inmon (2002)

3.2.2. Metodologia de Kimball A metodologia de Kimball de ciclo de vida dimensional do negcio, que consiste na criao de conceitos corporativos que possam atender todas necessidades das reas de negcio da empresa. Para que isto seja alcanado, exigido o comprometimento do topo organizacional, no sentido de conduzir o esforo de integrao de conceitos.

43

A sugesto de Kimball de escolha de um patrocinador, sendo este preferencialmente um membro da alta gerncia da organizao, como um diretor ou vice-presidente. Este patrocinador, por fazer uso de informaes estratgicas e ser beneficiado diretamente pela aplicao OLAP, dever conduzir o levantamento dos conceitos corporativos (Lustosa, R. B., 2009, p. 85).

Sendo este um ciclo de vida dimensional de negcios, incorpora trs partes fundamentais: definio / planeamento do projeto, gesto do projeto e explicao detalhada das tarefas a realizar. A figura 3.4.2.1 mostra a interligao das trs partes que formam o ciclo de vida da metodologia bottom-up.

Figura 3.4.2.1 - Ciclo de vida dimensional do negcio; Adaptado de Kimball (2008)

Kimball (2002) defende uma arquitetura do tipo representado na figura 3.4.2.2 da metodologia bottom-up.

Figura 3.2.2.2 Arquitetura bottom-up; Fonte: Adaptado de Kimball (2002)

44

Ao criar o DW, deve comear-se sempre pelo plano de projeto. atravs deste plano, que se vai avaliar se a empresa ou organizao est preparada para aderir a este tipo de ferramenta. Em seguida estudar a finalidade do projeto, em que aconselhvel a realizao conjunta entre o departamento de informtica e a administrao, para identificar um requisito de negcio que corresponda a um s processo que tenha o maior impacto na organizao. Identifica-se igualmente um nmero limitado de utilizadores para esta primeira fase, os utilizadores desta fase devem ser limitados para evitar dificuldades na gesto dos requisitos. Aps a fase anterior, segue-se a fase de justificao dos requisitos, os parceiros devem recorrer anlise custo-benefcio, assim como confrontar o retorno e o investimento, para justificar os requisitos (Carlos, F. M. M., 2008, p. 67). 3.2.3. Comparao das Metodologias do INMON e KIMBALL Nas duas metodologias de conceo de DW, cada uma possui os seus pontos positivos assim como de discrdia. A tabela 3.4.3 mostra os pontos de concordncia e discordncia entre os modelos de (Inmon e Kimball).

Tabela 3.4.3 Comparao das Metodologias de Inmon e Kimball; Fonte: Breslin, M. (2004)

45

3.3. REQUISITOS DO DATA WAREHOUSE


Teoricamente no aconselhvel no levantamento de requisitos optar por um nico mtodo, porque as duas metodologias vistas anteriormente tm vantagens assim como possuem igualmente pontos de discrdias. necessrio ter em mente as necessidades dos diferentes utilizadores e das caractersticas dos sistemas atualmente a operar na organizao. A informao dos requisitos nesta fase pode ser funcional ou no funcional, mas deve estar na tabela de anlise de requisitos. Kimball sugere a identificao, separao e classificao dos requisitos funcionais e no funcionais. Sugere igualmente que seja feita de forma conjunta entre os tcnicos de informtica e os utilizadores, para melhor identificar as responsabilidades. Os critrios de identificao de requisitos definidos nesta fase permitem capturar atributos para cada tipo de requisito, a partir dos quais possvel gerir a incluso desses requisitos no sistema (Carlos, F. M. M., 2008, p.78). Os principais pontos que devem constar no plano geral de requisitos so: Projeto; Funes/Responsabilidades; Procedimentos; Requisitos funcionais e no funcionais. Projeto identifica o projeto em estudo Funes e responsabilidades identifica a funo e a responsabilidade de cada indivduo que faa parte da gesto dos requisitos do projeto. Procedimentos descreve as regras de como ser a gesto dos requisitos do sistema, tais como, mudanas de contedo; testes dos requisitos; validaes, assim como especificaes de novos requisitos. Requisitos (Funcionais e no Funcionais) para funcionais, a equipa deve enumerar todos levantamentos efectuados, enquanto no funcionais, deve existir uma lista predefinida. Ambos os requisitos devem ser classificados e em seguida dever ser elaborada uma lista de regras para a seleo dos mesmos (Kimball, 2008).

46

4. INSTITUTO NACIONAL DE ESTATSTICA DE MOAMBIQUE


Este captulo tem como teor a descrio sumarizada do que o Instituto nacional de Estatstica de Moambique (INE M), sua misso, viso, valores, desafios e necessidades de informao como produtora da informao estatstica oficial do Pas.

4.1. O INE M COMO ORGANIZAO


O Instituto Nacional de Estatstica de Moambique foi criado pelo Decreto Presidencial, de 28 de Agosto de 1996. uma instituio coletiva de direito pblico, dotada de personalidade jurdica, autonomia tcnica, administrativa e financeira, tutelado pelo Conselho de Ministros. Independentemente das esferas de atividade particulares, a maior parte das organizaes apresenta estruturas de organizao semelhantes, cuja estrutura tpica apresenta-se normalmente em forma de tringulo (Julio, 2009). Segundo o mesmo autor, na base do tringulo encontra-se o nvel Operacional onde se processa a produo. O nvel intermdio constitui-se pelos gestores, investigadores e administradores cujas tarefas incluem a monitorizao do desempenho do nvel da base (Operacional), a pesquisa do ambiente externo organizao e a preparao de opes de poltica para o nvel de topo. O nvel executivo constitui o topo do tringulo onde so determinadas, atravs de um pequeno grupo de decisores, as orientaes estratgicas da organizao. Segundo Mintzberg, referido em Julio (2009), o tringulo organizacional , normalmente, referido em organizaes industriais. Contudo, o tringulo pode ser facilmente traduzido para considerar servios e organizaes pblicas onde produtos e servios so fornecidos aos clientes e cidados. De facto, o INE-Moambique uma organizao pblica e apresenta estrutura organizacional semelhante ao observado pelo autor. composto por trs nveis nomeadamente, presidncia, direes dos servios centrais e departamentos dos servios centrais (figura 4.1.1 e 4.1.2).

47

Figura 4.1.1 - Organograma do INE M; fonte: INE Moambique

Ao nvel do topo, o INE M constitudo pela presidncia que um rgo consultivo do presidente para a gesto estratgica e operacional da instituio. Ela composta pelo Presidente que o dirige, e por dois vice-presidentes nomeadamente, o Vice-Presidente para o Pelouro Econmico e o Vice-Presidente para o Pelouro Demogrfico. As direes, num total de seis, constituem a parte intermdia do tringulo cujas funes so as de planeamento, coordenao das relaes inter e intrainstitucionais, gesto, difuso e marketing de informao, anlise e investigao demogrfica e social, proviso de servios gerais de administrao, gesto e desenvolvimento dos recursos humanos e formao de quadros. Os departamentos dos servios centrais so a base do tringulo (nvel operacional) onde so exercidas todas as tarefas relacionadas com a produo das estatsticas.

48

Topo Estratgico Nvel Intermdio Nvel Operacional

Figura 4.1.2 - Estrutura organizacional do INE; adaptado de Mintzberg em Julio (2009)

4.2. MISSO DO INE M


A misso do INE segundo Joo Dias Loureiro (Presidente do INE-M) a de responder em tempo oportuno s necessidades de informao dos utilizadores e promover a cultura estatstica nacional.

4.3. VISO DO INE M


Ser a principal referncia estatstica para o desenvolvimento nacional, segundo o Presidente da instituio.

4.4. VALORES DO INE M


Para esta instituio de aparelho do estado, o seu valor acrescentado est direcionado aos utilizadores, o profissionalismo e as sinergias.

4.5. DESAFIOS DO INE M


O INE de Moambique, segundo o seu dirigente mximo, Joo Dias Loureiro, tem como desafio principal os seguintes pontos:
Monitoria do Plano de Ao para a Reduo da Pobreza Absoluta (PARPA) e dos planos do Governo Exigncia de mensurao da evoluo dos nveis da pobreza, da economia, da produtividade que implicam uma vasta utilizao de estatsticas multidisciplinares, para as quais o Sistema Nacional de Estatstica (SEN) deve desempenhar um papel ativo. Deve-se ainda aperfeioar o quadro do planeamento estratgico, ttico e operacional do SEN e seu alinhamento com o quadro geral do sistema de planeamento pblico.

49

Descentralizao Fortalecer a capacidade de produo estatstica ao nvel das provncias e dos distritos e municpios que respondam a necessidades do processo de governao e desenvolvimento local e nacional. Consolidar a produo de estatstica prioritria Racionalizar as funes dos rgos produtores de estatsticas para responder aos objetivos do PARPA II, melhorar a coordenao intersectorial, e evitar redundncias. Assegurar que os processos de reforma das instituies da funo pblica ao nvel central e local acautelem devidamente a funo estatstica de modo a que deles resultem designadamente, registos administrativos que possam servir de fontes de informao para o Sistema Estatstico Nacional. Parcerias Formar parcerias de modo a assegurar um financiamento apropriado para as atividades estatsticas face a um eventual cenrio restritivo do Oramento do Estado, tirando vantagens da abertura a fluxos adicionais de ajuda externa, desde que alinhados com as atividades e planos do Governo. Fortalecer os Recursos Humanos Criar um quadro atraente de desenvolvimento, gesto e reteno dos seus quadros designadamente da massa critica. Desenhar aes de formao para o nvel central e nvel local para garantir as capacidades necessrias para a implementao do Plano Estratgico. Novas tecnologias Tirar vantagens dos novos desenvolvimentos das tecnologias de informao e comunicao, estabelecendo um quadro apropriado no qual estas impulsionem a produo, troca e disseminao das estatsticas de forma integrada e atempada nos nveis multi-institucionais, nacional, provincial e distrital. No plano nacional, haver que considerar as oportunidades oferecidas pelo GovNet. Reviso do quadro legal (lei do Sistema Estatstico Nacional) No quadro geral do desenvolvimento socioeconmico do Pas a atual lei do SEN mostra-se inadequada para responder aos desafios que se apresentam no mbito da necessidade da informao estatstica. Pelo facto urge a necessidade da reviso do quadro legal que a lei do Sistema Estatstico Nacional. A construo de um edifcio prprio O presidente do INE assim como os funcionrios contactados sentem grande alvio e satisfao por este ponto ter sido satisfeito desde Agosto de 2011. A qualidade da informao estatstica tem muito a ver com o meio e condies na sua produo. O melhoramento das Estatsticas Econmicas Especificamente as relativas a dados empresariais, estabelecimento duma base de dados do SEN compreensiva e consolidada, e desenvolvimento de uma estratgia de comunicao e disseminao de informao estatstica mais efetiva.

50

4.6. NECESSIDADE DE INFORMAO


Por falta de uma metodologia uniformizada de armazenamento e gesto de dados na instituio, tem sido difcil o nvel operacional responder com eficincia e eficcia aos intermedirios, assim como os intermedirios ao topo. Sendo o topo o nvel decisor, este tem enfrentado imensas dificuldades em tomar uma deciso segura, confiante e rpida. Segundo Joo Loureiro, com uma boa informao, segura e eficiente pode-se:
Responder s necessidades estatsticas dos utilizadores sobre a estrutura e tendncia da populao, economia, sociedade, governao, gnero e ambiente e promoo na utilizao da informao estatstica oficial. Criar progressivamente uma capacidade de produo estatstica ao nvel dos distritos e municpios que respondam s necessidades do processo de governao e desenvolvimento local e nacional. Capitalizar a produo das estatsticas com recurso a novas tecnologias e metodologias, inovao, coordenao interinstitucional, apropriao de registos administrativos e reduo da carga de respostas da origem de dados. Aprimorar a capacidade institucional face aos novos desafios impostos pelos utilizadores.

Face a estes pontos, fica claro que DW ir ajudar de forma significativa na supresso de alguns pontos focados pelo presidente do Instituto Nacional de Estatstica de Moambique (Joo Dias Loureiro), e no s, o DW permitir conservar dados histricos que posteriormente podero ser usados para vrios fins.

51

4.7. GESTO ESTRATGICA


O INE-M uma instituio de aparelho do estado, e para o seu funcionamento normal depende de vrios fatores (humano, financeiro, parcerias e tecnolgico). Para uma melhor gesto estratgica, de conciliar atravs de uma anlise SWOT, de forma a identificar os pontos fortes, oportunidades, fraquezas e ameaas.

Foras Grande produo de

Fraquezas informao - Muitos dados de produo estatstica dispersos.

estatstica de qualidade.

- Partilha com eficcia e coeso da - Quadros ou tcnicos qualificados ainda informao produzida. - Boa eficincia nos servios prestados. em nmero muito reduzido. - Infraestrutura tecnolgica ainda muito

- Acesso rpido e seguro de dados de reduzida. apoio tomada de deciso. Oportunidades Ameaas Incapacidade financeira para

- Integrao e normalizao de dados de diversas origens.

acompanhar a evoluo tecnolgica. Incompetncia tcnica de alguns

- Manuteno de parcerias internas e externas.

quadros qualificados pode comprometer

- Formao de equipas de trabalho com a credibilidade e o crescimento do INE. esprito de partilha de conhecimentos. - Boa gesto do espao fsico. Mudanas socioeconmicas muito

rpidas no previstas.

- Os diversos processos administrativos - Falta de adequada manuteno. orientados a processos de negcios da empresa.
Tabela 4.7.1 - Anlise SWOT

Sendo o INE uma instituio do aparelho do estado com a finalidade de atender prontamente todas as camadas, socioeconmicas, polticas e estudantis, deve procurar sempre manter a informao constantemente atualizada e disponvel. Por isso,

52

fundamental possuir um suporte que possibilite um planeamento, comunicao e gesto de fatores estratgicos. A figura 4.7.1 mostra o resumo das perspetivas estratgicas, que resultam em sucesso quando so bem implementas na organizao.

Figura 4.7.1 - Perspetivas estratgicos; Adaptado de Silva, C. I. M. (2011)

4.8. REQUISITOS DO PROJETO


Os requisitos deste projeto iro ajudar a ter uma viso abrangente das atividades do INE-M ao longo do tempo, dos indicadores e mtricas que revelam o comportamento e desempenho dos negcios. Um sistema de apoio deciso deve refletir os objetivos e metas da organizao atravs de viso dos seus tomadores de deciso (Ziulkoski, L.C.C., 2003, p. 11). Alguns autores consideram que os requisitos deveriam ser levantados depois de o DW ser parcialmente carregado e usado pelos decisores da empresa. Porque assim, poderiam informar nomeadamente, sobre os dados desnecessrios na base e contribuir para outros desenvolvimentos do DW, o que ajudaria no refinamento e controlo de riscos do projeto.

53

A teoria anterior aponta sobretudo para o facto de ser arriscado iniciar um projeto de DW sem considerar primeiro os requisitos dos utilizadores. Os autores posteriores a Inmon so de opinio que devem coletar-se requisitos antes de implementar DW numa organizao. Neste estudo a coleta de requisitos foi feita antes, usando como ferramenta de recolha a entrevista auxiliada por um guio, como se referiu no item 3.1, do captulo da metodologia. Dos 11 entrevistados, quanto ao seu nvel de escolaridade: 2 bacharelato, 4 licenciatura e 5 com o mestrado. Tempo de servio como funcionrios na instituio: 1 est h menos de 5 anos, 3 entre 10 a 15 anos e os restantes 7 contam com mais de 20 anos de servio. Experincia como gestor: 1 menos de trs anos, 6 entre 5 a 10 anos e 4 j contam com 10 ou mais anos como chefes em diversos setores da instituio. Para melhor se inteirar dos requisitos, as entrevistas foram acompanhadas por um guio e divididas em 3 grupos: Gestores do topo, gestores intermdios e departamento de informtica. Isto porque cada nvel de gesto possui uma viso diferente apesar de a finalidade ser a mesma, o crescimento da instituio. Nos trs nveis de entrevistas teve-se como resultados: O nvel estratgico considera como objetivo principal responder pontualmente e com eficcia aos utilizadores da informao estatstica. Para os intermdios de responder de segura e atempada ao nvel estratgico do topo, para que estes faam uso da informao. Consideram ser comum notar o no cumprimento das tarefas previstas, pela dificuldade que surge quando se trata de prestar contas aos superiores hierrquicos, ou quando se pretende responder um pedido formulado pelos clientes. Isto tem sido mais frequente quando se trata de informao sobre as estatsticas econmicas empresariais. Todos os entrevistados consideram no existir ferramenta de apoio tomada de deciso na instituio. Quanto recolha de dados, afirmam ser por questionrio, mas h ocasies em que os dados so enviados em formato Excel.

54

Os entrevistados foram unnimes em afirmar que os dados so recolhidos e tratados mensalmente. A infraestrutura do INE M composta por 6 servidores: dados, web, correio eletrnico, intranet, publicaes e servidor de aplicaes. Este ltimo ainda no povoado. A rede de computadores existente no INE-M local e por cabo. Conta ainda com cerca de 200 computadores e impressoras multiusos. Usufrui da rede do governo (govNet), mas esta, limitada para alguns assuntos governamentais. A maior parte dos softwares usados na instituio so da tecnologia Microsoft, tais como: Windows server 2008, Windows7, Windows XP, Microsoft Office, Microsoft Visual Studio, Microsoft Visio, Microsoft Share Point e Microsoft SQL Server 2008, licenas doadas na sua maioria pelos parceiros da instituio. Quanto a aplicaes operacionais, verificou-se existncia de um nmero considervel e de forma desorganizada, algumas concebidas na instituio e outras doadas pelos parceiros. Em todas as aplicaes, notase a ausncia de documentao tcnica. Quanto implementao de DW, todos se afirmaram favoravelmente, prontificando-se em dar todo apoio necessrio para que o projeto tenha sucesso.

55

5. MODELAO DO DATA WAREHOUSE PARA O INE-M


Esta a fase da descrio de todos os conceitos necessrios para conceber o DW proposto. O modelo conceptual descreve os conceitos, em diferentes perspetivas de anlise e como os conceitos se relacionam entre si. O modelo lgico descreve a forma de organizao da informao no data warehouse: Molap, Rolap, etc j da responsabilidade do fornecedor do SGBD (Quaresma, S., 2004). A documentao do projeto constitui um elemento chave para monitorizar e garantir uma boa gesto de projeto. difcil negociar um projeto se no existir uma documentao que caracteriza e regista todas as decises, problemas e solues. Na prtica so utilizadas duas tcnicas: atravs de reunies peridicas com a equipa ou atravs de relatrios peridicos informando a equipa e os patrocinadores do decorrer do projeto. Na construo deste modelo importante a verificao dos prazos e tarefas por parte dos responsveis dos SI. Como forma de reduo de riscos na construo de DW, consideram trs fatores: Comunicao, Planeamento e Qualidade de dados.

5.1. MODELO PROPOSTO


Aps anlise e verificao da reviso da literatura, dos requisitos, e das metodologias de Inmon e de Kimball, props-se para o estudo de caso, o modelo de DW em estrela. O desenvolvimento deste modelo pode ser subdividido em vrias atividades, algumas desenvolvidas em paralelo, outras de forma sequencial, e outras de forma contnua. A forma contnua requer acompanhamento durante o decorrer de todo projeto do DW. Este modelo foi concebido por Ralph Kimball, usando a metodologia bottom-up e baseado em Data Marts departamentais ou por assunto. De acordo com os levantamentos realizados, seria difcil ao INE-M adotar o modelo top-down de Inmon, por vrios motivos, desde o aspeto tcnico ao financeiro. O modelo bottom-up sugerido permite a construo com os escassos recursos que a instituio possui. Isto possvel porque o modelo para alm de simples na sua implementao, permite uma construo incremental de Data Marts. A figura 5.1.1 ilustra o modelo da arquitetura sugerido ao INE-M.

56

Figura 5.1.1 - DW para INE-M; Fonte: Adaptado de Kimball (2002).

O modelo em estrela, mais acessvel para o utilizador final, vai crescendo h medida que os interesses de negcios da instituio crescem, e de fcil manuteno. O DW do INE ser constitudo por trs DMs departamentais ou por assuntos que so: Estatsticas econmicas, Estatsticas demogrficas e Estatsticas de suporte. Os Data Marts sero concebidos de forma bottom-up como mostra a figura 5.1.1, com possibilidade de acrscimos futuros se os processos da instituio assim exigirem. Na primeira fase ser modelado e implementado um DM, e na medida que vai sendo usado sero registadas todas as irregularidades que surgirem, assim como, sero registados os metadados no identificados anteriormente. Isto permitir que a equipa envolvida na reviso corrija esses problemas de modo a no se refletirem nos DMs posteriores. Na base nos requisitos, sugeriu-se o DM das estatsticas econmicas como o primeiro a ser modelado.

57

Figura. 5.1.2 - Modelo dimensional do DW em estrela para o INE-M

Antes de iniciar o processo de modelagem do DM, vai-se desenhar um modelo representativo entidade relacionamento (E-R), de duas aplicaes operacionais em uso na instituio. As aplicaes operacionais e dados externos existentes no INE-M serviro de suporte bsico para implementao do DW. Vai efetuar-se essa modelagem concetual de pelo menos duas aplicaes, por no existir nenhuma documentao tcnica dessas aplicaes na instituio.

5.2. MODELO E-R DE SISTEMAS OPERACIONAIS


Por as aplicaes existentes no possurem documentao, no fcil compreender o funcionamento das mesmas. De todas as aplicaes das estatsticas econmicas empresariais existentes, selecionaram-se aleatoriamente duas aplicaes. Essas sero representadas e modeladas neste trabalho no formato relacional. A figura 5.2.1 representa um conjunto de entidades e seus atributos. Uma entidade algo do mundo real que possui uma existncia independente. Uma entidade pode ser um objeto com uma existncia fsica - uma pessoa, carro ou empregado - ou pode ser um objeto com existncia conceptual - uma companhia, um trabalho ou um curso universitrio. Cada entidade tem propriedades particulares, chamadas atributos (Takai, O. K.; Italiano, I. C.; Ferreira, J.E., 2005, p. 23).

58

Figura 5.2.1 - Atributos e caracterizao de cada entidade

Caraterizar atributo entende-se por criar tabelas ainda na fase inicial, onde se identificam os possveis candidatos a atributos das entidades. A figura 5.2.1 mostra o exemplo de caracterizao em forma de tabelas. As tabelas representam as entidades de base de dados e os campos representam atributos. Os atributos pintados representam nesta fase as possveis chaves das entidades. As figuras (5.2.2 e 5,2,3) a seguir representam E-R e cardinalidade entre as entidades.

Figura 5.2.2 - E-R, cardinalidade e hierarquia da produo Industrial

59

Figura 5.2.3 - E-R, cardinalidade e hierarquia de comrcio e servios

A relao entre entidades a fase de modelagem de dados, onde se procura fazer a ligao entre entidades segundo o seu relacionamento, como mostra a figura 5.2.2 e 5.2.3. Nestas imagens os retngulos representam as entidades e as linhas representam o elo de ligao entre uma entidade e outra. A extremidade da linha terminada por trs traos significa muitos e onde termina com apenas um trao significa um. Correspondendo assim uma relao com cardinalidade de um-paramuitos. As figuras 5.2.4 e 5.2.5 e a representao E-R desenhados em Access.

Figura 5.2.4 Diagrama E R Comrcio e Servios

60

Figura 5.2.5 Diagrama E R de estatsticas de Produo Industrial Com os dados das aplicaes operacionais e dos dados externos, faz-se o carregamento, transformao e busca do DM ou DW.

Figura 5.2.6 - Exemplo de transformao e aglomerao de dados.

5.3. MODELO DIMENSIONAL DE DW


Este modelo obedece a uma metodologia de 3 etapas nomeadamente: 1. Classificao de entidades. 2. Identificao de hierarquias. 3. Projeo dimensional.

61

Classificao de entidades A entidade classifica-se em 3 categorias nomeadamente Transao, Componente e Classificao. necessrio observar que cada modelo E-R dever estar contido numa das 3 categorias de entidades (de Transao, de Componente e de Classificao). A entidade de transao aquela que contm o registo de acontecimentos de negcios da empresa realizadas no tempo e que podem ser sumarizadas. A entidade componente detalha ou especifica cada negcio registado na entidade de transao, tendo uma relao na entidade de relacionamentos de um-para-muitos, responde perguntas como por exemplo, Quando ? Quem ? O que ? Onde ?. Entidades de classificao diretamente ligada a entidade componente, com relacionamento de um-para-muitos, so as usadas na formao de tabelas dimenso no modelo estrela. A figura 5.3.1 mostra a classificao das entidades usadas no modelo de dados no diagrama as entidades em preto representam entidades de Transao. As entidades em cinza representam entidades Componente e as entidades em branco representam entidades de Classificao (Dill, 2002, p.49).

Figura 5.3.1 Categorias de entidades; Fonte: Dill (2002), adaptado de Moody & Kortink, (2000)

Identificao hierrquica a derivao dos modelos E-R em dimensional, podese afirmar que o sequenciamento de ligaes das entidades obedecendo uma relao de um-para-muitos com a mesma direo. A figura 5.3.2 mostra o exemplo de hierarquia. Na classificao de entidades, a de transao encontra-se hierarquicamente a nvel mais alto, enquanto a de classificao est a nvel mais baixo.

62

Figura 5.3.2 - Hierarquia de um modelo conceptual

Projeo dimensional a fase da conceo da estrutura do DW, nesta fase ainda identifica-se os atributos e chaves das tabelas de facto e dimenses. Como o projeto proposto o modelo bottom-up, neste estudo vai-se fazer a modelagem apenas de um Data Mart das Estatsticas econmicas empresariais como se afirmou acima, por ser mais representativo e que constitui a maior preocupao at este momento dos gestores do INE-M.

63

6. DATA MART
6.1. CARATERIZAO
Considera-se DM uma fragmentao de DW destinado a responder um determinado assunto da empresa. Alis pode-se dar a mesma definio de DW aos DMs com a ligeira diferena de o DW estar indicado para os assuntos de negcio de toda organizao, enquanto o DM voltado para uma determinada rea ou assunto especfico da empresa. As principais caractersticas das duas bases so o fcil acesso da informao, consistncia, flexibilidade para efetuar alteraes adaptadas s mudanas, segurana da informao, e uso da informao para apoio tomada de deciso. Cada DM composto de tabelas dimenso e de facto assim como o DW, de referir que a tabela dimensional pode possuir apenas uma ligao com a de facto, e a de facto nica e liga-se com diversas tabelas de dimenso no DM. Geralmente as tabelas de dimenso so caracterizadas de muita redundncia por no estarem de forma normalizada. Enquanto a de facto no contm redundncia, fortemente normalizada.

Figura 6.1.1 - Constituio de DM com Tabelas de facto e dimensionais

6.2. CRIAO DE DM
O processo de criao de Data Mart constitudo por quatro passos essenciais: Seleo do processo de negcio; definio da granularidade; escolha das dimenses e identificao dos factos (Kimball, 2002).

64

6.2.1. Seleo do processo de Negcio Dos trs Data Marts que iro constituir o DW institucional, a seleo do processo de negcio, recaiu para as estatsticas econmicas de empresas, por ser a maior preocupao dos gestores da instituio. As dificuldades no controlo dos dados desta rea tm sido muito complicada. Os gestores intermdios desta rea dificilmente respondem pontualmente com os dados existentes aos seus superiores hierrquicos. A conceo dos relatrios tem levado muito tempo devido s dificuldades de conciliao e uniformizao de dados. Com o uso de DM neste pelouro estatstico, ir minimizar de forma significativa seja na qualidade dos dados, seja no tempo de resposta dos relatrios de apoio tomada de deciso. 6.2.2. Definio da Granularidade O nvel de granularidade importante no DW por ser a medida determinante da qualidade dos dados, e afeta a velocidade e o armazenamento. Neste DM definiu-se como nvel de granularidade o ms, ou seja os dados agrupam-se de janeiro a dezembro. Este agrupamento conjugado por intermdio das tabelas de dimenso Localizao geogrfica, Indicador do Negcio e Tempo. Decidiu-se assim, por ser aconselhvel o uso dentro do possvel os nveis mnimos de granularidade desde que no use espaos maiores de armazenamento.

65

6.2.3. Escolha das Dimenses Com os levantamentos efetuados na instituio, considerou-se como dimenso deste DM, quatro tabelas que so: Dim_Indicadores, Dim_Local, Dim_Empresas e Dim_Tempo. Dimenso Atributos Id_Local Localidade Id_Posto Posto Administrativo Id_Distrito Distrito Id_Prov Provincia Atributos
Id_empresa Nome_Emp Id_TipoEmpresa Id_Local Ano_Constituicao Id_CAE Id_FJR NUIT

Local

Descrio Identificao da localidade Nome da localidade Identificao do Posto Administrativo Nome do Posto Administrativo Identificao do Distrito Nome do Distrito Identificao da Provncia Nome da Provncia

Dimenso

Descrio
Identificao da empresa Nome da empresa Identificao do tipo da empresa Identificao da Localidade Ano de formao da empresa Identificao do cdigo de atividades econmicas Identificao de forma juridica da empresa Nmero nico de identificao tributria

Empresa

Dimenso

Atributos
Id_Tempo Dia Ms Trimestre Semestre Ano

Descrio
Identificao do tempo Dia Ms do ano Nmero do trimestre Nmero do Semestre Ano

Tempo

66

Dimenso

Atributos
Id_Indicador Id_Industria Industria Id_Turismo Turismo Id_Transporte Transporte Id_ComeServ ComercioServico Id_Restaura Restauracao

Descrio
Identificao do indicador do negcio Identificao do indicador da indstria Nome do indicador da Industria Identificao do indicador do turismo Nome do indicador do turismo Identificao do indicador do Transporte Nome do indicador do transporte Identificao do indicador de comrcio e servios Nome do indicador do comrcio e servios Identificao do indicador da restaurao Nome do indicador da restaurao

Indicadores

6.2.4. Identificao de factos Atravs do levantamento de requisitos efetuado, identificou-se para este DM apenas uma tabela de facto que armazenar os dados sumarizados das estatsticas econmicas e empresariais. Facto Atributo
Id_Empresa Id_Local Id_Indicador Id_Tempo Emprego Remuneracao Encargos Volume_Negocio

Descrio
Identificao da Empresa Identificao da localizao Identificao do indicador do negcio Identificao do tempo Nmero de emprego Valor remunerado Encargos Volume de negcio

Econmicas

6.3. MODELAO
Depois da identificao dos processos de criao de DM, segue-se a fase de modelao do Data Mart. 6.3.1. Modelo conceptual O modelo conceptual do DM das estatsticas econmicas constitudo por quatro tabelas dimensionais e uma de facto, como se mostra nas figuras 6.3.1.1 e 6.3.1.2. Considera-se esta fase como representao de alto nvel na estrutura de dados.

67

Figura 6.3.1.1 - Modelo conceitual das Estatsticas Empresariais

Figura 6.3.1.2 - Modelo conceptual com os atributos

6.3.2. Modelo lgico O modelo lgico a transformao do modelo conceptual para a forma de como a BD ser concebida ou implementada em Sistemas de Gesto de Bases de Dados. As figuras abaixo ilustram essa representao, assentando na implementao em bases de dados relacionais.

68

Figura 6.3.2.1 Diagrama do Modelo lgico das estatsticas Econmicas e Empresariais

Figura 6.3.2.2 - Esquema do modelo lgico Para Estatsticas Econmicas, concebido em Access

69

Figura 6.3.2.3 - Esquema do modelo lgico Para Estatsticas Econmicas, concebido em SQL.

6.3.3. Projeto fsico O projeto fsico a maneira exata de como implementado o projeto lgico, faz a descrio completa da implementao da base de dados. importante nesta fase ter a viso sobre a segurana dos dados na base. Alguns fatores importantes que se deve considerar so: Particionamento Paralelismo no funcionamento Parmetros ao configurar o Sistema de Gesto de Base de Dados (SGDB). Indexao

70

Os tpicos acima merecem um cuidado especial, devendo ser detalhados para o melhoramento da qualidade do sistema a ser implementado. um trabalho que deve ser feito de forma contnua e por um profissional com gabarito de competncia reconhecida na rea das caractersticas do sistema a ser implementado. Outros pontos importantes do DW e de aspetos no especficos totalmente na fase de elaborao, mas atravs destes pontos que o projeto pode ganhar enfase de sucesso: Metadados Estes so conhecidos como dados que descrevem outros dados aplicveis no ambiente do DW. Na verdade descrevem igualmente a estrutura e formato de dados. Os metadados so uteis em todos os nveis de DW, so usados para controlo e gesto do DW, servem de dicionrio de dados desde o incio ate ao fim dos processos de conceo do modelo, processos ETL, estrutura e significado de dado, modelo de dado, isto , toda documentao do projeto includa. Ao falar de documentao referimos igualmente que o metadado um catlogo de dados contido dentro de DW, destinado a facilitar o utilizador na localizao dos dados e uso dos mesmos em anlises diversas. No fcil encontrar um repositrio de metadados que envolva todos requisitos de um DW. O ideal usar tambm como alternativa os meios mnimos incorporados nas ferramentas OLAP que possibilitam a documentao dos dados, facilitando a sua localizao, acesso e anlise por parte dos utilizadores. Neste estudo os metadados vo sendo criados paulatinamente ao decorrer do processo de criao do DW. Cada fase de criao e implementao que for atingida, sero detetados os metadados adequados fase. Estes depois podem ser exportados atravs do Information Catalog Manager existente nos pacotes de software.

71

7. DISCUSSO DE RESULTADOS
7.1. PROJETO DO SISTEMA DE DW NO INE-M
A construo de DW para INE teve como primeira etapa a identificao dos utilizadores e levantamento de requisitos. Com a identificao dos potenciais utilizadores, um ir gerir o projeto aquando sua implantao. Este gestor ser apenas responsvel pelo projeto e no pelo DW como sistema. A gerncia do projeto tem um prazo de existncia e tarefa do responsvel estabelecer o plano geral s do projeto e que deve ser de conhecimento de todos os elementos que compe a equipa de desenvolvimento. No plano geral do projeto, deve conter os recursos disponveis para o projeto, prazo do projeto e a espectativa dos utilizadores perante o sistema a ser iniciado. A identificao do responsvel pela gesto do projeto tem sido o maior problema para este tipo de atividade. O gestor de DW enquanto sistema permanente. Enquanto durar o ciclo de vida do sistema, deve preocupar-se com a execuo dos processos do DW. Para este estudo, pretende-se um sistema automatizado que possa gerar dados analticos, eliminando os problemas que a instituio enfrenta com as aplicaes operacionais ainda em uso no INE-M. Para conceo deste projeto, contou com as ferramentas da Microsoft existentes na instituio, em particular o SQL Server 2008 instalado num dos servidores.

7.2. PARTICIPAO, LOCALIZAO E CARGA


A elaborao deste trabalho contou com a participao dos gestores estratgicos do INE M. Estes facilitaram o trabalho de levantamento de requisitos na instituio, e tambm demonstraram interesse e entusiasmo em verem esta ferramenta de apoio tomada de decises instalada e a funcionar na instituio. Atendendo a este interesse dos gestores, pode concluir-se que, o risco de fracasso do projeto no INE-M ser muito menor.

72

O projeto estar ao cargo do departamento de informtica da instituio, local onde se encontram os servidores onde o DW ser instalado. Os utilizadores finais tero acesso de princpio via Web, atravs dos cdigos de restrio que sero atribudos em conformidade com o nvel estratgico de gesto. Existe uma expetativa futura de migrao para o BI e dataminig. Na primeira fase da carga dos DMs estar a cargo do tcnico de cada setor do pelouro, que at aqui responsvel pelos dados. Este tcnico ter uma assistncia direta de um tcnico de informtica, que ser indicado para essa finalidade, e que tenha feito parte da equipa de desenvolvimento.

7.3. ATUALIZAO E MANUTENO DO DW


A ferramenta de desenvolvimento de DW deve estar preparada para suportar qualquer atualizao ou manuteno. Para o efeito deve contar com atividades tais como: 1. 2. 3. Definio da periocidade da atualizao. Possibilidade de interagir com outras ferramentas. Automatizao do processo ETL.

A manuteno estar a cargo da equipa responsvel pela carga do DM e com superviso contnua de um diretor de cada pelouro.

7.4. CONSIDERAO FINAL


Com este trabalho, espera-se ter ajudado ao estudo de caso, com uma ferramenta apropriada de apoio tomada de deciso gil e segura; Ter propiciado uma ferramenta poderosa, na reduo de tempo de resposta tanto ao nvel interno como externo; Ter facilitado a criao e consulta de relatrios com apoio de ferramentas front-end, assim como ter contribudo para a melhoria de qualidade de dados e da informao.

73

8. CONCLUSES
Com o objetivo de alcanar os objetivos do estudo, os resultados aqui relatados so fidedignos, seguindo a convico de assim permitir um estudo mais aprofundado do tema. Sendo este um trabalho de investigao, acredita-se que os resultados iro ajudar o INE-M, na resoluo dos seus problemas. Este tema oferece muita oportunidade de investigao como forma de elevar o nvel acadmico. O estudo permitiu identificar a melhor metodologia e modelo de DW para apoio estratgico ao INE-M, como entidade nica de produo das estatsticas oficiais em Moambique. Foi atravs de vrias opinies colhidas em muitos autores por meio de levantamento bibliogrfico e pelos utilizadores finais, que foi possvel escolher das metodologias e modelos, a melhor que tivesse boa aplicabilidade para a realidade moambicana, concretamente numa instituio pblica de produo e disseminao de estatsticas oficiais no Pas. Como se afirmou acima, o INE-M no possui nenhum modelo analtico de dados, quando este for bem implementado segundo as propostas, ser um ganho considervel para a instituio e para o Pas. Considera-se particularmente positivo que os pontos aqui propostos que podem efetivamente orientar a elaborao de um DW no INE M, onde se destacam as fases de construo do projeto de DW. Donde a partir deste projeto, pretende-se um repositrio de dados estatsticos integrados, coerentes, estruturados, e de fcil acesso, que facilite anlises complexas e responda a todos os interesses da instituio. Atravs desta ferramenta os gestores estratgicos podem administrar o seu pessoal por intermdio de competncias, permitindo uma boa formao de equipas de partilha de conhecimentos. Por meio dos indicadores, permite um acompanhamento eficaz do negcio. Com este trabalho de dissertao adquiriu-se experincia de pesquisa e na conceo de DW em particular. Estamos convictos que o mesmo ajudar muitos pesquisadores e profissionais da rea dado que encontra-se bem documentado.

74

9. LIMITAES E RECOMENDAES PARA TRABALHOS FUTUROS


9.1. LIMITAES NO ESTUDO
Atualmente falar de DW no constitui novidade. O difcil encontrar nas empresas, tcnicos qualificados para construir ou implementar uma ferramenta desta natureza. Outra limitao a identificao da melhor metodologia que na prtica pode servir de apoio estratgico na tomada de decises na organizao. As atividades do dia-a-dia das instituies esto em constante movimentao, o que dificulta conseguir tempo livre ou suficiente dos responsveis das instituies, que possam ajudar durante a pesquisa para transmitir os seus conhecimentos, e fornecer ideias ou pareceres sobre a instituio que dirigem. Apesar da abertura total dos responsveis do INE-M, foi notrio que existiu alguma cautela na disponibilizao dos dados para este trabalho, ou seja, aquilo a que se chama sigilo ou segredo estatstico.

9.2. RECOMENDAES PARA TRABALHOS FUTUROS


O trabalho desta natureza importante para todos profissionais de rea de desenvolvimento de sistemas. Recomenda-se a criao de um dicionrio para alm de metadados existentes, para melhor auxlio no uso do DW e de outros sistemas. A metodologia escolhida de DMs incrementais recomendvel para todas organizaes ou instituies pblicas semelhantes ao INE-M, que financeiramente depende do oramento geral do estado ou de doaes dos parceiros de negcios. De seguida deve procurar-se dotar o sistema com ferramentas de cdigo aberto, que seja de uso livre mas com grandes potencialidades no desempenho. Quando implementado o primeiro DM do sistema, h que procurar junto dos utentes, conhecer a sua satisfao, avaliando o tempo de respostas do sistema, fazendo as respetivas correes ou retificaes nos mdulos que demonstrarem deficincias, para que os prximos erros sejam mnimos ou inexistentes. Sendo o INE-M uma instituio que trabalha em cooperao com outras instituies pertencentes ao grupo de Sistema Estatstico Nacional deve padronizar o modelo para facilitar o seu desempenho. O departamento de informtica e sistemas de informao (DISI), dever procurar conhecer e implementar o uso de tcnicas mais recentes, como por exemplo, o DMg para encontrar outras potencialidades do sistema DW.

75

10.BIBLIOGRAFIA
Abreu, F. S. G. G (2008), Desmistificando o conceito de ETL, Revista de Sistemas de Informao. URL: http://www.fsma.edu.br/si/artigos/v2_artigo1.pdf Arajo, E. M. T. (SD), URL: http://www.devmedia.com.br/um-estudo-sobre-asferramentas-olap/6691 Caldeira, C. P. (2008). Data Warehousing Conceitos e modelos Carlos, F. M. M. (2008). Data Warehouse, Num Instituto Politcnico URL:http://repositorio.utad.pt/bitstream/10348/426/1/msc_fmmcarlos.pdf Carvalho, I. M.; Muhoz, D. L.C.; Ferreira, M. V. A. S.; Santos, P. M.; Rover, A. J.; Fialho, F. A. P. (nd). Contribuies das tecnologias como ferramentas de gesto de conhecimento. URL:http://www.egov.ufsc.br/portal/sites/default/files/artigo_1_conegov.pdf Crisp (2007). URL: http:// www.markosweb.com/www/crisp-dm.org/Em cache; visitado em Setembro 2012. Dill, S. L. (2002). Metodologia para o Desenvolvimento de Data Warehouse. URL: http://homes.dcc.ufba.br/~mauricio052/Material%20Artigo/Uma%20Metodolog ia%20para%20Desenvolvimento%20de%20Data%20Warehouse%20e%20Estudo %20de%20Caso.pdf Facundes, E. M.(); URL: www.efagundes.com Fayyad, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. (1996). From Data Mining to Knowledge Discovery: An Overview. Knowledge Discovery and Data Mining, Menlo Park : AAAI Press. Gouveia, L. M. B. (1996). Sistemas de Informao. URL: http//homepage.ufp.pt/lmbg/textos/si_texto.pdf. Gouveia, L. M. B. (2004). Sistemas de Informao de Apoio Gesto; Spi. Hossain, L.; Patrick, J. D. & Rashid, M. A. (2002). Enterprise Resource Planning: Global Opportunities and Challenges. Sydney: IGP. INE - Moambique (2009). Organograma do INE. URL:http://www.ine.gov.mz/home_page/o_ine/dir_organograma/organograma Inmon, W. H. (1997). Como construir o data warehouse. (2 ed.) Rio de Janeiro: Editora Campus Inmon, W. H. (2002). Building the Data Warehouse. Third Edition. Wiely Julio, R.P. (2009). Apontamentos da disciplina de SIG nas Organizaes. Mestrado em Cincia e Sistemas de Informao Geogrfica no Instituto Superior de Estatstica e Gesto de Informao da Universidade Nova de Lisboa, Lisboa.

76

Kimball, R.; Ross, M. (2002). The Data Warehouse Toolkit. Second Edition: The Complete Guide to Dimensional Modeling. Wiley Knuth, D. E. (sd). Selected Papers on Computer Science. Cambridge: Cambridge University Press. 274 p. p. 1-2. ISBN 1-1881526-91-7 URL:http://pt.wikipedia.org/wiki/Informa%C3%A7%C3%A3o#cite_note-knuth-12 Laudon, K. C., & Laudon, J. P. (2003). Management Information Systems (8 ed.). New Jersey: Prentice Hall. Lustosa, R. B. (2009). Processo de Desenvolvimento Participativo de Sistemas de DW. URL:http://www.ccsa.ufpb.br/ppga/site/arquivos/dissertacoes/dissertacao_61.p df Machado, F. N. R. (2000). Projeto de Data Warehouse. Uma viso multidimensional. So Paulo: Editora rica, Machado, F. N. R. (2006). Tecnologia e projeto de Data Warehouse. So Paulo: Editora rica Perkins, A. (2000). Critical Sucess Factors for Data Warehouse Engeneering; http://www.tdan.com/view-articles/4836. Quaresma, S.; Perpetuo, F. (2004). Modelao Conceptual de Data Warehouses para (Instituto Nacional de Estatstica, Portugal) data warehousing in statistical production. Lisboa. Scalabrin, E. E. (SD). Abordagem de desenvolvimento de data warehouse. URL:http://www.ppgia.pucpr.br/~scalabrin (consultada em 05/03/2012). Santos, A., (2008). Gesto Estratgica - Conceitos, modelos e instrumentos. Lisboa. Escolar Editora. SAP Portugal, 2010. SAP Business Intelligence. URL:http://www.sap.com/portugal/platform/netweaver/businessintelligence/in dex.epx Santos, I. M. (2003). Data Warehouse como ferramenta de auxlio em sistemas de monitoramento ambiental. Cuiab-MT Brasil. URL: http://www.ufmt.br/cacomp/Downloads/monografias/DWAcompanhamentoAmbiental.pdf Silva, C. I. M. e (2011). Desenvolvimento de Software e Sistemas Interativos. URL:http://repositorio.ipcb.pt/browse?type=author&value=Silva%2C+Cristiana+I sabel+Morgado+e Silva, M. M. da, (2003). Integrao de sistemas de Informao, FCA Editora informtica, ISBN 972-722-391-5. Singh, H. S. (2001). Data warehouse conceitos, tecnologias, implementao e gerenciamento. So Paulo: Makron Books.

77

Takai, O.K.; Italiano, I.C.; Ferreira, J.E. (2005). Introduo a Banco de Dados. URL:http://www.ime.usp.br/~jef/apostila.pdf Teixeira, P. A. M.S. (2005). Estudo da adopo do Local e-government. URL:http://homepage.ufp.pt/lmbg/monografias/mscpteixeira05.pdf Varajo, J. (2005). Arquitectura da Gesto de Sistemas da Informao, editor FCA Brasil, ISBN: 9727225071, 9789727225071. Ziulkoski, L.C.C., (2003). Tcnicas de Aquisio de conhecimento. URL:http:// www.inf.ufrgs.br/bdi/wp-content/uploads/Monografia-LuisZiulkoski.pdf

78

11.ANEXOS

Anexo 11.1 - Ficha de dados rea de Comrcio e Servios; Fonte: INE M.

79

Anexo 11.2- Ficha de dados de rea industrial; Fonte: INE M.

80

Guio de apoio entrevistas Gesto de topo

Estimado(a) senhor(a), serve este meio, para pedir algum tempo da sua disponibilidade para esta pequena entrevista. Os dados aqui recolhidos sero guardados sigilosamente e destinam-se nica e exclusivamente para o estudo de um modelo conceptual de Data Warehouse a propor para INE M, como tema de dissertao. Desde j, agradeo a colaborao.

I.1. Dados Gerais I.1. Ano:2012; Ms: ______________; Departamento / Direo / Presidncia:_________________; I.2. Dados Pessoais I.2.1 - Nome (Opcional): I.2.2 - Gnero (marque com X): 1. Homem ________________; 2. Mulher _________________ II. Questes gerais (sublinhar, marcar X ou descrever) II.1- H quantos anos trabalha na instituio: A: 0 5; B: 6 10; C: 11 15; D: 16-20; E: 21 ou + H.2- Qual o nvel de escolaridade que terminou: 1 Primrio; 2-Secundrio; 3-Mdio; 4-superior H.3- H quanto tempo (anos) gestor: A: 0 5; B: 6 10; C: 11 15; D: 16-20; E: 21 ou +

II.4 Na qualidade de gestor usa algum software especfico de gesto? A: Sim, B:No II.5- Qual o principal objetivo da sua instituio? ______________________________________ II.6- Como mede o cumprimento dos objetivos? _______________________________________ II.7- Quem so os principais clientes da empresa? ______________________________________ II.8- Como gestor considera o uso das novas tecnologias da informao importante na sua atividade? A:Sim; B:No; C:Sem opinio O objetivo principal do DW apoiar aos gestores na tomada de deciso, aceita ou apoia a implementao deste instrumento nesta instituio? A: Sim; B:No; C:Sem opinio Observao / sugesto:

Obrigado pela ateno dispensada e votos de bom trabalho.

Anexo 11.3 - Guio de apoio na recolha de requisitos (gesto de topo)

81

Guio de apoio entrevista Gesto Intermdia

Estimado(a) senhor(a), serve este meio, para pedir algum tempo da sua disponibilidade para esta pequena entrevista. Os dados aqui recolhidos sero guardados sigilosamente e destinam-se nica e exclusivamente para o estudo de um modelo conceptual de Data Warehouse a propor para INE M, como tema de dissertao. Desde j, agradeo a colaborao.

I.1. Dados Gerais I.1. Ano:2012; Ms: ______________; Departamento / Direo / Presidncia:_________________; I.2. Dados Pessoais I.2.1 - Nome (Opcional): I.2.2 - Gnero (marque com X): 1. Homem ________________; 2. Mulher _________________ II. Questes gerais (sublinhar, marcar X ou descrever) II.1- H quantos anos trabalha na empresa: A: 0 5; B: 6 10; C: 11 15; D: 16-20; E: 21 ou + H.2- Qual o nvel de escolaridade que terminou: 1 Primrio; 2-Secundrio; 3-Mdio; 4-superior H.3- H quanto tempo (anos) gestor: A: 0 5; B: 6 10; C: 11 15; D: 16-20; E: 21 ou + II.4 Na qualidade de gestor usa algum software especfico de gesto? A: Sim, B:No II.5- Qual o principal objetivo da sua Direo? _______________________________________ II.6- Como mede o cumprimento dos objetivos? _______________________________________ II.7- Quem fornece dados para sua Direo? A: Setor Formal; B: Setor Informal; C: Outros II.8- Como feita a recolha de dados no seu setor? A- Entrevista; B- Questionrio; C- Outros meios II.9- Qual a periodicidade de recolha de dados no seu setor? A: Dirio; B:Semanal; C:Mensal; D: Trimestral; E: Semestral; F: Anual. II.10 Os dados recolhidos j vm uniformizados? A: Sim; B:No; C: No sabe II.11 Com estes dados consegue responder pontualmente os interesses da instituio? A: Sim; B: No; C: No sempre II.12- O objetivo principal do DW apoiar os gestores na tomada de deciso, aceita ou apoia a implementao deste instrumento nesta instituio? A: Sim; B:No; C:Sem opinio Observao / sugesto:

Obrigado pela ateno dispensada e votos de bom trabalho.

Anexo 11.4 - Guio de apoio na recolha de requisitos (gesto intermdia)

82

Guio de apoio a entrevistas Informtica

Estimado(a) senhor(a), serve este meio, para pedir algum tempo da sua disponibilidade para esta pequena entrevista. Os dados aqui recolhidos sero guardados sigilosamente e destinam-se nica e exclusivamente para o estudo de um modelo conceptual de Data Warehouse a propor para INE M, como tema de dissertao. Desde j, agradeo a colaborao.

I.1. Dados Gerais I.1. Ano:2012; Ms: ______________; Departamento / Direo /Presidncia:_________________; I.2. Dados Pessoais I.2.1 - Nome (Opcional): I.2.2 - Gnero (marque com X): 1. Homem ________________; 2. Mulher _________________ II. Questes gerais (sublinhar, marcar X ou descrever) II.1- H quantos anos trabalha na instituio: A: 0 5; B: 6 10; C: 11 15; D: 16-20; E: 21 ou + H.2- Qual o nvel de escolaridade que terminou: 1 Primrio; 2-Secundrio; 3-Mdio; 4-superior H.3- H quanto tempo (anos) chefe do Departamento: A: 0 5; B: 6 10; C: 11 15; D: 16-20; E: 21 ou + II.4- Qual a principal tarefa do Departamento? _______________________________________________ II.5- Quantas aplicaes a instituio possui e onde funcionam? II.6- Quantos servidores existem na instituio? II.7- Que tipo de softwares e aplicaes a instituio usa? II.8- Das aplicaes existentes possuem documentao tcnica? II.9- O seu departamento possui condies tcnicas de conceo e desenvolvimento de base de dados? A- Sim; B- No II.10- O objetivo principal do DW apoiar aos gestores na tomada de deciso, O departamento est capacitado para o desafio? A: Sim; B:No; C:Sem opinio Observao / sugesto:

Obrigado pela ateno dispensada e votos de bom trabalho.

Anexo 11.5 - Guio de apoio na recolha de requisitos (Departamento de Informtica)

83

You might also like