Arquiteturas de Data Warehousing – Parte 1

Há algumas arquiteturas básicas de Data Warehousing… Segundo Turban, Sharda, Aronson e King

As arquiteturas de duas e três camadas são comuns (ver figuras 2.2 e 2.3), mas às vezes, há apenas uma camada. Hoffer et al. (2007) as distinguem dividindo o Data Warehousing em Três partes:

  1. O próprio Data Warehouse, que contém os dados e o software associados;
  2. Software de aquisição de dados (retaguarda), que extrai dados dos sistemas legados e fontes externas, os consolida e resume, e depois os carrega no Data Warehouse;
  3. Software cliente (front-end), que permite aos usuários acessar e analisar dados a partir do Warehouse (um mecanismo de DSS/BI/Análise de Negócios[BA]).
Na Arquitetura de três camadas, os sistemas operacionais contêm dados e o software para aquisição em uma camada (o servidor), o Data Warehouse em outra camada, e a terceira camada inclui o mecanismo de DSS/BI/BA (servidor de aplicação e o cliente.
Os dados do Warehouse são processados duas vezes e depositados em um banco de dados multidemensional adicional, organizado para facilitar a análise e apresentação multidimensional, ou replicados em Data Marts. A vantagem da arquitetura de três camadas  é a sua separação das funções do Data Warehouse, que elimina as limitações de recursos e possibilita a fácil criação de Data Marts.
Em uma arquitetura de duas camadas, o mecanismo de DSS é executado fisicamente na mesma plataforma de hardware que o Data Warehouse. Portanto, é mais econômico aue a arquitetura de três camadas.
A arquitetura de duas camadas pode apresentar problemas de desempenho, caso haja Data Warehouses grandes que trabalhem com aplicações de uso intenso de dados no suporte à decisão.
A sabedoria popular, em boa parte, assume uma abordagem absolutista, afirmando que uma solução é melhor que a outra, independentemente das circunstâncias e necessidades exclusivas da organização. Para complicar ainda mais essas decisões de arquitetura, muitos consultores e fornecedores de software se concentram em uma parte da arquitetura. Portanto, acabam limitando sua capacidade e motivação para auxiliar uma organização a ver as opções com base em suas necessidades. Entretanto, esses aspectos estão sendo questionados e analisados. Por exemplo, Ball (2005) forneceu critérios de decisão para as organizações que têm planos de implementar uma aplicação BI e já determinaram suas necessidades de Data Marts multidimensionais, mas que precisam de ajuda para decidir a arquitetura em camadas apropriadas. Os critérios do autor giram em torno de necessidades de previsão para obtenção de espaço e velocidade de acesso.
O Data Warehousing e a internet  são duas tecnologias essenciais que oferecem soluções importantes à gestão de dados corporativos. A integração dessas duas tecnologias produz o Data Warehousing baseado na Web. Na figura 2,4 mostramos a sua arquitetura. Ela possui três camadas e inclui PC cliente, servidor Web e servidor de aplicação.
No lado do cliente, o usuário necessita de uma conexão à Internet e um navegador da WEB (de preferência, que permita Java) ligado à interface gráfica familiar ao usuário (GUI). A Internet/Intranet/Extranet é o meio de comunicação entre cliente e servidores. No lado do servidor, um servidor Web é utilizado para administrar os fluxos de entrada e saída de informações entre cliente e servidor. Ele é auxiliado por um Data Warehouse e por um servidor de aplicação. O data Warehousing baseado na Web oferece algumas vantagens atraentes, que incluem facilidade de acesso, independência de plataforma e custo mais baixo.
O Vanguard Group adotou uma arquitetura de três camadas baseada na Web para que a arquitetura de sua empresa integrasse todos os dados e oferecesse aos clientes as mesmas visualizações de dados que tinham os usuários internos. Da mesma forma, o Hilton migrou todos os seus sistemas cliente/servidor independentes para um Data Warehouse de três camadas, usando um sistema empresarial com projeto Web. A mudança incluiu um investimento de US$ 3,8 milhões (excluindo a mão de obra) e afetou 1.500 usuários. Ela aumentou a eficiência de processamento (velocidade) em seis vezes. Quando foi implementada, o Hilton esperava economizar entre US$ 4,5 e 5 milhões ao ano. Finalmente, a corporação fez experiências com a tecnologia de clustering (computação paralela) da Dell para aprimorar a escalabilidade e velocidade.
As arquiteturas de Data Warehousing da Web têm estrutura semelhante a outras arquiteturas de Data Warehousing e exigem uma escolha de projeto para hospedar o Warehouse na Web com o servidor de transações ou como servidor(s) separado(s). A velocidade de carregamento das páginas é uma consideração importante ao se projetar aplicações baseadas na Web; portanto, se deve planejar cuidadosamente a capacidade do servidor.
Há algumas questões a serem consideradas ao decidir que arquitetura usar. Eis algumas delas:
  • Qual o sistema de gerenciamento de banco de dados (SGBD) usar? A maioria dos Data Warehouses é construída usando sistemas de gerenciamento de banco de dados relacional (SGBDR). Oracle, SQL Server e DB2 são os mais usados. Todos esses produtos suportam arquiteturas cliente/servidor e baseada na Web;
  • O processamento paralelo e/ou o particionamento serão usados? O processamento paralelo permite que multiplas CPUs processem solicitações de consultas ao Data Warehouse simultaneamente, além de oferecer escalabilidade. Os projetistas do Data Warehouse precisam decidir se as tabelas de bancos de dados serão particionadas (divididas em tabelas menores), para maior eficiência de acesso, e quais serão os critérios. Esta é uma consideração importante, que se faz necessária pelas grandes quantidades de dados contidas em um Data warehouse típico. A Teradata adotou essa abordagem com sucesso;
  • Serão usadas ferramentas de migração de dados para carregar o Data Warehouse?
  • Que ferramentas serão usadas para dar suporte à recuperação e análise de dados
Até a próxima!!!!

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: