Introdução à tabela de dimensões
Uma tabela de dimensões está presente no esquema em estrela ou floco de neve. As tabelas de dimensões ajudam a descrever dimensões, como valores, atributos e chaves. Geralmente é pequeno em tamanho. O tamanho pode variar de várias a mil linhas. Ele descreve os objetos presentes na tabela de fatos. Tabela de dimensões refere-se à coleta ou grupo de informações relacionadas a qualquer evento mensurável. Eles formam um núcleo para modelagem dimensional. Ele contém uma coluna que pode ser considerada uma coluna de chave primária, o que ajuda a identificar exclusivamente cada linha ou registro de dimensão. Ele está sendo associado às tabelas de fatos por meio dessa chave. Quando é criada, uma chave chamada chave substituta gerada pelo sistema é usada para identificar exclusivamente as linhas na dimensão.
Por que precisamos usar?
- Sua ajuda para armazenar o histórico das informações ou informações dimensionais.
- É fácil de entender do que as tabelas normalizadas.
- Mais colunas podem ser adicionadas à tabela sem afetar os aplicativos existentes que os estão usando.
Tabela de tipos de dimensão
A seguir estão os diferentes tipos de tabela de dimensões:
1. SCD (dimensões que mudam lentamente)
Os atributos de dimensão que tendem a mudar lentamente com o tempo, em vez de mudar em um intervalo regular de tempo, são chamados de dimensões que mudam lentamente. Por exemplo, alterações de endereço e número de telefone, mas não regularmente. Vamos ver o exemplo de um homem que viaja para diferentes países, para que ele precise mudar de endereço de acordo com esse país. Isso pode ser feito de três maneiras:
Tipo1: Substitua o valor anterior. Esse método é fácil de aplicar e ajuda a economizar espaço, reduzindo assim os custos. Mas, a história está perdida nesse cenário.
A tabela antes da mudança
EU IRIA | NOME | PAÍS | NACIONALIDADE |
1001 | Rachel | Índia | indiano |
Tabela após a alteração
EU IRIA | NOME | PAÍS | NACIONALIDADE |
1001 | Rachel | China | indiano |
Tipo2: adicione uma nova linha com o novo valor. Nesse método, o histórico é salvo e pode ser usado sempre que necessário. Mas isso requer um grande espaço, portanto, aumenta o custo.
A tabela antes da mudança
EU IRIA | NOME | PAÍS | NACIONALIDADE |
1001 | Rachel | Índia | indiano |
Tabela após a alteração
EU IRIA | NOME | PAÍS | NACIONALIDADE |
1001 | Rachel | Índia | indiano |
1001 | Rachel | China | indiano |
Tipo3: adicione uma nova coluna. É a melhor abordagem, pois a história pode ser mantida facilmente.
A tabela antes da mudança
EU IRIA | NOME | PAÍS | NACIONALIDADE |
1001 | Rachel | Índia | indiano |
Tabela após alteração
EU IRIA | NOME | PAÍS | PAÍS ANTIGO | NACIONALIDADE |
1001 | Rachel | China | Índia | indiano |
2. Dimensão Conformada
Essa dimensão é compartilhada entre várias áreas de assunto ou data marts. O mesmo pode ser usado em projetos diferentes sem nenhuma modificação feita no mesmo. Isso é usado para manter a consistência. Dimensões conformes são aquelas que são exatamente iguais ou um subconjunto adequado de qualquer outra dimensão.
3. Dimensão de Lixo Eletrônico
Uma dimensão de lixo eletrônico é um grupo de atributos de baixa cardinalidade. Ele contém atributos diferentes ou vários que não estão relacionados a qualquer outro atributo. Eles podem ser usados para implementar o RCD (dimensão que muda rapidamente), como sinalizadores, pesos etc.
4. Dimensão degenerada
Atributos que são armazenados na própria tabela de fatos e não como uma tabela de dimensão separada, esses atributos são chamados de dimensão degenerada. Por exemplo, número do bilhete, número da fatura, número da transação etc.
5. Dimensão do papel
O fato de ter vários relacionamentos com a tabela de fatos é chamado de dimensão de dramatização. Em outras palavras, é quando a mesma chave de dimensão com todos os seus atributos relacionados é associada a muitas chaves estrangeiras presentes na tabela de fatos. Pode cumprir vários propósitos dentro do mesmo banco de dados existente.
Como funciona no Data Warehouse?
- Dimensão refere-se à coleta ou grupo de informações relacionadas a qualquer evento mensurável. Eles formam um núcleo para modelagem dimensional. Quando uma dimensão é criada, uma estrutura de um projeto é gerada. Criado pode ser usado em diferentes projetos e reflete a idéia de reutilização. Quando uma alteração é feita em qualquer uma delas, seu efeito é refletido apenas nessa tabela específica. Quando um relatório deve ser criado, o usuário pode obter os dados, pois as tabelas de dimensões contêm todas as informações necessárias.
- Ao executar a modelagem de dimensão, os dados atômicos são carregados nas estruturas dimensionais. Em seguida, os modelos dimensionais são gerados ou construídos em torno dos processos de negócios. Durante a criação, lembre-se de filtrar valores de domínio e armazenar rótulos dos relatórios nessas tabelas. Deve-se garantir que a chave substituta (chave gerada pelo sistema usada durante a criação da tabela de dimensões, que ajuda a identificar exclusivamente cada registro presente na tabela de dimensões.) Seja usada enquanto a tabela de dimensões é criada. Ele deve ser desnormalizado, pois sua tarefa é permitir que o usuário leia e analise os dados com a mesma facilidade e eficiência, em vez de gerenciar transações. O principal objetivo da dimensão é fornecer a filtragem, executar o agrupamento e rotular com eficiência.
Vantagens
Abaixo estão as diferentes vantagens da tabela de dimensões:
- Tem uma estrutura simples.
- É fácil de analisar e entender.
- Dados não normalizados.
- Ajuda a manter informações históricas para qualquer dimensão.
- Fácil de recuperar dados a partir dele.
- Rápido para criar e implementar.
- Ele fornece o contexto de qualquer processo de negócios.
Conclusão - Tabela de Dimensões
Esta é uma parte integrante da modelagem de dados. É usado no esquema estrela ou floco de neve. Ele contém as dimensões, chaves e valores dos atributos da tabela de fatos. Existem diferentes tipos usados em diferentes cenários.
Artigos recomendados
Este é um guia para a tabela de dimensões. Aqui discutimos Tipos, Como a Tabela de Dimensões funciona no armazém de dados com o Advantages. Você também pode consultar nossos outros artigos relacionados para saber mais.
- Tabela de fatos vs tabela de dimensões
- O que é tabela de fatos?
- O que é o Tableau?
- Mistura de dados no Tableau