"Educação é o que sobra ao indivíduo depois que esqueceu tudo o que aprendeu na escola."    
(Albert Einstein)   

Procurar Artigo:

Por favor, Identifique-se.

Untitled Document

Data Warehouse e Data Mart


Por Mauri Rodrigo Back
Em 19 de Fevereiro de 2010

 

          1. DATA WAREHOUSE E DATA MART         

          As empresas que almejam competitividade no mercado não questionam a importância do Business Intelligence. A grande dúvida de todos é por onde e como começar. Os analistas têm uma resposta que pode parecer simplista, porém, verdadeira: o tamanho do sapato deve ser do tamanho do pé. Em outros termos, empresas pequenas ou com pouca cultura tecnológica podem começar usando algumas ferramentas de análise mais simples.           
O importante é compreender que os dados precisam ser estruturados de forma diferente dos sistemas transacionais. Por isso, os especialistas no assunto ressaltam que um dos principais pilares do Business Intelligence é o Data Warehouse e Data Mart.

          1.1. Data Warehouse           

          Data Warehouse ou armazém de dados é o nome que se dá a uma grande base de dados informacional que tem por objetivo armazenar em um único repositório os dados que foram consolidados, limpos e uniformizados, armazenados em estruturas lógicas dimensionais, possibilitando o seu processamento por ferramentas especiais.           
O conceito de Data Warehouse visa definir uma base de dados preparada em vários níveis de granularidade e obtida através dos sistemas estruturados, armazenando essas informações em vários graus de relacionamentos e sumariação, esses dados deverão estar preparados de tal forma que as informações que nele estiverem contidas estarão prontas para serem utilizadas nas mais diversas formas de consultas. 
           
O Data Warehouse vem evoluindo constantemente, e para se entender tal avanço é preciso destacar como evoluíram os processos tecnológicos na área.
           
Na década de 70, surgiu uma nova tecnologia de armazenamento e acesso a dados: a introdução do armazenamento em disco, ou DASD (direct access storage device - dispositivo de armazenamento de acesso direto). Com isso, ocorreu a chegada de um novo tipo de software, conhecido como SGBD (Sistema Gerenciador de Banco de Dados). (Parente, 2007)
           
Para Parente (2007), o banco de dados promoveu uma visão de uma organização baseada em dados, na qual o computador poderia atuar como coordenador central para todas as atividades realizadas na empresa. Assim, os sistemas de informação para os negócios começaram a tomar forma, ou seja, as empresas alcançaram mais eficiência, pois os computadores tornaram-se importantes máquinas de negócios.
            Com a chegada dos bancos de dados relacionais as empresas se informatizavam mais rapidamente, o acesso aos computadores e a facilidade de uso aumentara muito.            
Com o surgimento de PC’s e linguagens de 4ª geração, permitiu-se que o usuário assumisse um papel mais ativo, controlando os sistemas e os dados, fora do domínio do processamento de dados. (Parente, 2007)
           
Com essa evolução, percebeu-se que os dados poderiam ser analisados de forma otimizada, ou seja, descobriram que poderiam incrementar seus recursos de Business Intelligence.  Essa descoberta muda o enfoque que até então fora atribuído ao conjunto de informações (Sistemas). Com isso os sistemas informatizados passaram a pertencer a dois grupos:
·        Sistemas que tratam o negócio: dão suporte ao dia-a-dia do negócio e garantem a operação da empresa, são chamados de Sistemas Transacionais;·        Sistemas que analisam o negócio: sistemas que ajudam a interpretar e decidir sobre estratégias futuras para a empresa – Sistemas de Suporte a Decisão.           
Os Sistemas Transacionais não estavam preparados para armazenar as informações estratégicas que os gerentes começaram a exigir. Em atendimento às solicitações dos gestores surgiu no mercado os chamados Programas Extratores. Esses programas extraiam dados dos Sistemas Transacionais para trabalhá-las em outros ambientes. Muitas vezes as extrações sofriam novos tratamentos. Isso provocava uma falha na integridade e acabava acarretando uma falta de confiabilidade dos dados, queda de produtividade e as informações eram, muitas vezes, publicadas com valores diferentes.
           
Além disso, os Sistemas Transacionais geravam uma grande quantidade de dados e a diversidade dos sistemas implantados nas empresas as pesquisas realizadas eram produzidas muito lentamente. Outro fator importante que prejudicava as decisões nos Sistemas Transacionais foi a falta de registro dos fatos históricos, pois esses sistemas legados trabalhavam com uma situação instantânea dos negócios. (Parente, 2007)
           
Para a solução de tantos problemas, começou-se a estudar uma forma de se armazenar a informação dos sistemas transacionais numa base de dados única e central, para que houvesse integração dos dados da empresa. Também era necessário manter e fornecer o histórico das informações, ou seja, era preciso disponibilizar ao analista de negócios visualizar um mesmo fato através de diversas dimensões diferentes. O nome dado a essa modalidade de SAD (Sistema de Apoio à Decisão) foi o Data Warehouse. (Parente, 2007)

          1.2. Data Mart           

Um Data Mart pode ser definido brevemente como: Um banco de dados desenhado para cada departamento. É um mini Data Warehouse que fornece suporte a decisão para um pequeno grupo de pessoas, como um departamento de projeto, ou de vendas, por exemplo.
Existem dois tipos distintos de Data Marts.Data Marta dependente: é aquele cuja fonte geradora é um DW. Todos os Data Mart dependentes são alimentados com dados de uma única fonte, o Data Warehouse. Eles são estruturalmente sólidos, diferentemente dos DM independentes.Data Mart Independente: é aquele cuja fonte é o ambiente legado de aplicações. Ele é construído com base em processos criados para fazer face às necessidades mais urgentes da organização, com curtos prazos de planejamento. Ele tem problemas com o compartilhamento de informações e é pouco escalar.           
Para Kimball (2007), “O Data Warehouse deve ser dividido para depois ser conquistado”, ou seja, o melhor para as empresas é, conforme Kimball (2007), “desenvolver vários Data Marts para posteriormente integrá-los e, assim, chegar-se ao Data Warehouse”. Dessa forma, informações entre os diferentes Data Marts poderiam ser geradas de maneira íntegra e segura. Kimball batizou esse conceito de Data Warehouse Bus Architeture.
           
A teoria de Kimball é rebatida por Inmon, que propõe justamente o contrário. Em sua opinião deve-se construir primeiro um Data Warehouse, modelando-se toda a empresa para se chegar a um único modelo corporativo, depois disso partir para o desenvolvimento dos Data Marts construídos por departamentos, ou seja, como bem define Inmon (2007) “conquistar para dividir”.
           
Tanto Inmon como Kimball concordam, no entanto, que apenas Data Marts independentes ou isolados, bem como Data Warehouses assim constituídos não satisfazem as necessidades por dados exatos e oportunos, bem como não facilitam o acesso a essa informação por parte dos usuários.

Compartilhe este artigo!
Avalie este artigo!
Adicione ao Digg!
Adicione ao Yahoo My Web!
Adicione ao Del.icio.us!
Adicione ao Technorati!
Adicione ao Reddit!
Adicionar ao Rec6!

Outros Artigos deste Autor

   Informática: APLICAÇÃO DE DATA WAREHOUSE PARA AUXILIAR AS DECISÕES GERENCIAIS UTILIZANDO TÉCNICAS DE BUSINESS INTELLIGENCE, em 12 de Setembro de 2009
   Informática: Data Warehouse e Data Mart, em 19 de Fevereiro de 2010
 

Comentários

Não há comentários para este artigo. Seja o primeiro a escrever um!