Entendendo o conceito de Data Warehouse

Um Conceito básico sobre Data Warehouse!🙂

Inicialmente analisemos algumas definições, elaboradas por acadêmicos autores e profissionais especializados em Data Warehouse, que podem nos dar uma primeira impressão sobre a tecnologia.

Segundo Inmom, Data Warehouse é uma coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão.

Conforme Harjinder, Data Warehouse é um processo em andamento que aglutina dados de fontes heterogêneas, incluindo dados históricos e dados externos para atender à necessidade de consultas estruturadas e AD_HOC, relatórios analíticos e de suporte de decisão.

Kimball define assim: é um conjunto de ferramentas e técnicas de projeto, que quando aplicadas às necessidades específicas dos usuários e aos bancos de dados específicos, permitirá que planejem e construam um Data Warehouse.🙂

Para entender o que é um DW, é importante fazer uma comparação com o conceito tradicional de banco de dados. Conforme Batini, “Um banco de dados é uma coleção de dados operacionais armazenados e utilizados pelo sistema de aplicações de uma empresa específica”. Os dados mantidos por uma empresa são chamados de ‘operacionais’ ou ‘primitivos’. Batini refere-se aos dados do banco de dados como ‘dados operacionais’, distinguindo-se de dados de entrada, dados de saída e outros tipos de dados.

Levando em consideração esta definição sobre dados operacionais, pode-se dizer que um DW é, na verdade, uma coleção de dados derivados dos dados operacionais, para sistemas de suporte à decisão. Estes dados derivados são, muitas vezes, referidos como dados ‘gerenciais’, ‘informacionais’ ou ‘analíticos’.

Os bancos de dados transacionais, ou operacionais, armazenam as informações diárias da empresa, são utilizados por todos os funcionários para registrar e executar operações pré-definidas, por isso seus dados podem sofrer constantes mudanças. Por não ocorrer redundância nos dados e as informações históricas não ficar armazenadas por muito tempo, este tipo de banco de dados não exige grande capacidade de armazenamento.

Já um DW armazena dados analíticos, destinados às necessidades da gerência no processo de tomada de decisões. Isto pode envolver consultas complexas que necessitam acessar um grande número de registros, por isso é importante de muitos índices criados para acessar as informações da maneira mais rápida possível. Um DW armazena informações históricas de muitos anos e por isso deve ter uma grande capacidade de processamento e armazenamento dos dados que se encontram de duas maneiras: detalhados e resumidos.

Com base nestes conceitos podemos concluir que o DW é um conjunto de técnicas e bancos de dados integrados, projetados para suportar as funções dos Sistemas de Apoio à Decisão, onde cada unidade de dados está relacionada a um determinado assunto, ou fato. Esses bancos de dados é que darão subsídio de Informações aos gerentes e diretores de empresas, para analisarem tendências históricas dos seus clientes e com isso melhorarem os processos que aumentem a satisfação e fidelidade dos mesmos.

No DW os dados podem ser retirados de múltiplos sistemas de computação normalmente utilizados há vários anos e que continuam em operação, como também podem ser de fontes externas da empresa. Data Warehouses são construídos para que tais dados possam ser armazenados e acessados de forma que não sejam limitados por tabelas e linhas estritamente relacionais. Os dados de um DW podem ser compostos por um ou mais sistemas distintos e sempre estarão separados de qualquer outro sistema transacional, ou seja, deve existir um local físico onde os dados desses sistemas serão armazenados. (Fonte: Site DWBrasil – http:// http://www.dwbrasil.com.br)

4 Respostas to “Entendendo o conceito de Data Warehouse”

  1. Fernando Junior Says:

    Olá Lito!

    Acompnho seu blog algum tempo, mas hoje eu vim lhe “aperriar” (:

    Como eu poderia fazer para dimensionar o hardware de um projeto Data Warehouse? Por exemplo, tenho os seguintes bancos de dados: 315 GB, 70 GB e 25 Gb, e para cada um gostaria de fazer um projeto de Data Warehouse … mas não sei como e não tenho achado alguma documentação sobre isso =\

    Help me please!
    E continue com o ótimo trabalho!

  2. Felipe Farias Says:

    Muito bom!


Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: