O que é a Modelagem Dimensional em Data Warehouse?

Dimensional Modeling

Dimensional Modeling (DM) é uma técnica de estrutura de dados otimizada para armazenamento de dados em um Data Warehouse. O objetivo da modelagem dimensional é otimizar a base de dados para uma recuperação mais rápida dos dados. O conceito de Modelação Dimensional foi desenvolvido por Ralph Kimball e consiste em tabelas de “factos” e “dimensões”.

Um modelo dimensional em data warehouse foi concebido para ler, resumir, analisar informação numérica como valores, balanços, contagens, pesos, etc., num data warehouse. Em contraste, modelos de relação são otimizados para adição, atualização e exclusão de dados em um Sistema de Transação Online em tempo real.

Estes modelos dimensionais e relacionais têm sua forma única de armazenamento de dados que tem vantagens específicas.

Por exemplo, no modo relacional, os modelos de normalização e ER reduzem a redundância nos dados. Pelo contrário, o modelo dimensional no data warehouse organiza os dados de forma a facilitar a recuperação de informação e a geração de relatórios.

Hence, modelos dimensionais são usados em sistemas de data warehouse e não são um bom ajuste para sistemas relacionais.

Neste tutorial, você vai aprender…

  • Elementos do Modelo de Dados Dimensionais
  • Facto
  • Dimensão
  • Atributos
  • Tabela de Factos
  • Tabela de Dimensões
  • Tipos de Dimensões em Data Warehouse
  • Etapas da Modelação Dimensional
  • Etapa 1) Identificar o Processo de Negócio
  • Etapa 2) Identificar o Grão
  • Passo 3) Identificar as Dimensões
  • Passo 4) Identificar o Facto
  • Passo 5) Esquema de Construção
  • Regras para Modelação Dimensional
  • Benefícios da Modelação Dimensional

Elementos do Modelo de Dados Dimensionais

Facto

Factos são as medidas/métricas ou factos do seu processo de negócio. Para um processo empresarial de Vendas, uma medida seria o número de vendas trimestral

Dimensão

Dimensão fornece o contexto em torno de um evento do processo empresarial. Em termos simples, eles dão quem, o quê, onde de um fato. No processo de negócios de Vendas, para o número de vendas trimestral do fato, as dimensões seriam

  • Quem – Nomes de Clientes
  • Onde – Localização
  • O quê – Nome do Produto

Em outras palavras, uma dimensão é uma janela para ver as informações nos fatos.

Atributos

Os Atributos são as várias características da dimensão na modelagem de dados dimensionais.

Na dimensão Localização, os atributos podem ser

  • Estado
  • País
  • Zipcode etc.

Os atributos são usados para pesquisar, filtrar ou classificar fatos. As tabelas de dimensões contêm Atributos

Tabela de fatos

Uma tabela de fatos é uma tabela primária na modelagem de dimensões.

Uma tabela de fatos contém

  1. Medições/fatos
  2. Chave de dimensão

Tabela de dimensões

  • Uma tabela de dimensões contém dimensões de um fato.
  • A tabela de dimensões contém as dimensões de um facto.
  • Tabelas de dimensões são tabelas desnormalizadas.
  • Os atributos de dimensões são as várias colunas em uma tabela de dimensões
  • As dimensões oferecem características descritivas dos fatos com a ajuda dos seus atributos
  • Sem limite definido para o número de dimensões
  • A dimensão também pode conter uma ou mais relações hierárquicas

Tipos de dimensões em Data Warehouse

A seguir estão os Tipos de dimensões em Data Warehouse:

>

  • Dimensão Conformada
  • Dimensão do Nutrigger
  • Dimensão Encolhida
  • Role-jogando Dimension
  • Dimension to Dimension Table
  • Junk Dimension
  • Degenerate Dimension
  • Swappable Dimension
  • Step Dimension

Passos da Modelação Dimensional

A precisão na criação da sua modelação Dimensional determina o sucesso da implementação do seu data warehouse. Aqui estão os passos para criar o Modelo Dimensional

  1. Identificar Processo de Negócios
  2. Identificar Grão (nível de detalhe)
  3. Identificar Dimensões
  4. Identificar Fatos
  5. Build Star

O modelo deve descrever o Porquê, Quanto, quando/onde/quem e o que do seu processo de negócio

Passo 1) Identificar o processo de negócio

Identificar o processo de negócio real que um datarehouse deve cobrir. Isto pode ser Marketing, Vendas, RH, etc. de acordo com as necessidades de análise de dados da organização. A seleção do Processo de Negócio também depende da qualidade dos dados disponíveis para esse processo. É o passo mais importante do processo de Modelagem de Dados, e uma falha aqui teria defeitos em cascata e irreparáveis.

Para descrever o processo de negócio, você pode usar texto simples ou usar a Notação Básica de Modelagem de Processos de Negócio (BPMN) ou a Linguagem de Modelagem Unificada (UML).

Passo 2) Identificar o Grão

O Grão descreve o nível de detalhe para o problema/solução do negócio. É o processo de identificação do nível de informação mais baixo para qualquer tabela no seu armazém de dados. Se uma tabela contém dados de vendas para cada dia, então ela deve ser granularidade diária. Se uma tabela contém dados de vendas totais para cada mês, então ela tem granularidade mensal.

Durante esta etapa, você responde perguntas como

  1. Precisamos armazenar todos os produtos disponíveis ou apenas alguns tipos de produtos? Esta decisão é baseada nos processos de negócio seleccionados para Datawarehouse
  2. Armazenamos a informação de venda dos produtos numa base mensal, semanal, diária ou horária? Esta decisão depende da natureza dos relatórios solicitados pelos executivos
  3. Como as duas escolhas acima afetam o tamanho do banco de dados?

Exemplo de Grãos:

O CEO de uma MNC quer encontrar diariamente as vendas de produtos específicos em diferentes locais.

Então, o grão é “informação da venda do produto por localização ao dia”.

Passo 3) Identificar as Dimensões

Dimensões são substantivos como data, loja, inventário, etc. Estas dimensões são onde todos os dados devem ser armazenados. Por exemplo, a dimensão de data pode conter dados como um ano, mês e dia da semana.

Exemplo de Dimensões:

O CEO de uma MNC quer encontrar diariamente as vendas de produtos específicos em diferentes locais.

Dimensões: Produto, Localização e Tempo

Atributos: Para Produto: Chave do produto (Chave estrangeira), Nome, Tipo, Especificações

Hierarquias: Para Localização: País, Estado, Cidade, Endereço, Nome

Passo 4) Identificar o Fato

Este passo é co-associado com os usuários comerciais do sistema porque é onde eles obtêm acesso aos dados armazenados no data warehouse. A maioria das linhas da tabela de fatos são valores numéricos como preço ou custo por unidade, etc.

Exemplo de Fatos:

O CEO de uma MNC quer encontrar diariamente as vendas de produtos específicos em diferentes locais.

O facto aqui é a soma das vendas por produto e por localização por tempo.

Passo 5) Esquema de Construção

Neste passo, você implementa o Modelo Dimensão. Um esquema nada mais é do que a estrutura do banco de dados (disposição das tabelas). Existem dois esquemas populares

  1. Esquema estrelado

A arquitectura do esquema estrelado é fácil de desenhar. É chamado de esquema estelar porque o diagrama se assemelha a uma estrela, com pontos irradiando de um centro. O centro da estrela consiste na tabela de fatos, e os pontos da estrela são tabelas dimensionais.

As tabelas de fatos em um esquema estelar que é a terceira forma normal, enquanto que as tabelas dimensionais são desnormalizadas.

  1. Esquema do floco de neve

O esquema do floco de neve é uma extensão do esquema estelar. Em um esquema de floco de neve, cada dimensão é normalizada e conectada a tabelas de mais dimensões.

Regras para Modelação Dimensional

A seguir são as regras e princípios da Modelação Dimensional:

  • Carregar dados atómicos em estruturas dimensionais.
  • Modelos dimensionais em torno de processos de negócio.
  • Need para assegurar que cada tabela de factos tem uma tabela dimensional de datas associada.
  • Certifique-se de que todos os factos numa única tabela de factos estão no mesmo grão ou nível de detalhe.
  • É essencial armazenar etiquetas de relatórios e filtrar valores de domínio nas tabelas de dimensões
  • Need para assegurar que as tabelas de dimensões usam uma chave substituta
  • Continuamente equilibrar requisitos e realidades para fornecer uma solução de negócio para apoiar a sua tomada de decisão

Benefícios da Modelação Dimensional

  • A padronização de dimensões permite relatórios fáceis entre áreas do negócio.
  • As tabelas de dimensões armazenam o histórico da informação dimensional.
  • Permite introduzir dimensões totalmente novas sem grandes interrupções na tabela de fatos.
  • Dimensional também para armazenar dados de tal forma que é mais fácil recuperar a informação dos dados uma vez que os dados são armazenados na base de dados.
  • Comparado com a tabela dimensional do modelo normalizado são mais fáceis de entender.
  • Informação é agrupada em categorias comerciais claras e simples.
  • O modelo dimensional é muito compreensível para o negócio. Este modelo é baseado em termos empresariais, de modo que o negócio sabe o que cada fato, dimensão, ou atributo significa.
  • Os modelos dimensionais são deformados e otimizados para uma rápida consulta de dados. Muitas plataformas de banco de dados relacionais reconhecem este modelo e otimizam os planos de execução de consultas para auxiliar na performance.
  • A modelagem dimensional em data warehouse cria um esquema que é otimizado para alta performance. Isso significa menos uniões e ajuda com a minimização da redundância de dados.
  • O modelo dimensional também ajuda a aumentar a performance da consulta. Ele é mais desnormalizado, portanto é otimizado para consultas.
  • Os modelos dimensionais podem acomodar confortavelmente as mudanças. As tabelas dimensionais podem ter mais colunas adicionadas a elas sem afetar as aplicações de business intelligence existentes usando estas tabelas.

O que é o modelo de dados multidimensional em Data Warehouse?

Modelo de dados multidimensional em Data Warehouse é um modelo que representa os dados na forma de cubos de dados. Ele permite modelar e visualizar os dados em múltiplas dimensões e é definido por dimensões e fatos. O modelo de dados multidimensional é geralmente categorizado em torno de um tema central e representado por uma tabela de fatos.

Sumário:

  • Um modelo dimensional é uma técnica de estrutura de dados otimizada para ferramentas de Data Warehousing.
  • Fatos são as medidas/métricas ou fatos do seu processo empresarial.
  • Dimensão fornece o contexto em torno de um evento de processo empresarial.
  • Tributos são as várias características da modelagem de dimensões.
  • Uma tabela de fatos é uma tabela primária em um modelo dimensional.
  • Uma tabela dimensional contém dimensões de um fato.
  • Existem três tipos de fatos 1. Aditivo 2. Não aditivo 3. Semi-aditivo .
  • Tipos de dimensões são Conformed, Outrigger, Shrunken, Role-playing, Dimension to Dimension Table, Junk, Degenerate, Swappable e Step Dimensions.
  • Cinco passos de modelagem Dimensional são 1. Identificar o Processo de Negócio 2. Identificar o Grain (nível de detalhe) 3. Identificar as Dimensões 4. Identificar Factos 5. Build Star
  • Para a modelação Dimensional em data warehouse, é necessário assegurar que cada tabela de factos tem uma tabela de dimensões de data associada.

Deixe uma resposta

O seu endereço de email não será publicado.