Diferença entre Star Schem a e Snowflake Schema

Neste artigo, discutiremos as diferenças de esquema em estrela e esquema de floco de neve em detalhes. Esquema é a maneira de descrever logicamente todos os bancos de dados ou data warehouses usando bancos de dados relacionais. A descrição pode incluir o nome e os detalhes dos registros de qualquer tipo com todos os agregados e itens de dados. Os data warehouses usam o esquema Star, Snowflake, Fact Constellation e Galaxy.

Esquema em estrela

É o esquema mais simples do data warehouse. Como o próprio nome sugere, sua estrutura é como uma estrela. Nesse esquema, a tabela de fatos está presente no centro e o número de tabelas de dimensões é associado a ele por meio de chave estrangeira e a tabela de dimensões contém o conjunto de atributos. Nesse esquema, todas as dimensões são representadas apenas com uma única tabela de dimensões, mas as tabelas de dimensões não são unidas umas às outras. Suas vantagens incluem redução, fácil entendimento dos dados, uso ideal do disco e aumento de desempenho. Vamos ver um exemplo para uma melhor compreensão.

Exemplo:

Considere uma empresa de fabricação de refrigeradores e precisamos criar um esquema para as vendas dessa empresa de fabricação de refrigeradores. As vendas terão as seguintes dimensões:

  • Item
  • Localização
  • Ramo
  • Tempo

O esquema possui uma tabela de fatos no centro de vendas que conteria chaves a serem associadas a cada dimensão, com duas medidas, isto é, unidades vendidas e dólares vendidos.

Esquema de floco de neve

Esquema de floco de neve é ​​a extensão do esquema em estrela. Ele adiciona dimensões adicionais a ele. Como o próprio nome sugere, parece um floco de neve. Nesse esquema, as tabelas de dimensões são normalizadas, ou seja, os dados são divididos em tabelas adicionais. Dividir a mesa reduz a redundância e o desperdício de memória. Tem a forma hierárquica de tabelas dimensionais. As tabelas de dimensão e subdimensão estão associadas às chaves primárias e estrangeiras na tabela de fatos. É mais fácil de implementar e usa menos espaço em disco. Como possui várias tabelas, o desempenho da consulta é reduzido. É necessária mais manutenção porque há mais tabelas de pesquisa. Vamos ver um exemplo para uma melhor compreensão.

Exemplo:

Considerando o mesmo exemplo acima da empresa de fabricação de refrigeradores, no esquema de floco de neve, a tabela de fatos é a mesma do esquema em estrela, mas a principal diferença está na definição ou no layout das tabelas de dimensões.

Nesse esquema, a tabela de dimensão única do item foi normalizada e foi dividida e uma nova tabela de fornecedores foi criada, incluindo informações sobre o tipo de fornecedor. Da mesma forma, a tabela de dimensões da localização é normalizada e os dados são divididos em uma nova tabela da cidade que contém detalhes da cidade específica.

Comparação cara a cara entre esquema estrela e esquema floco de neve (infográficos)

Abaixo estão as 9 principais diferenças entre Esquema Star e Esquema Floco de Neve.

Principais diferenças entre o esquema Star e o esquema Snowflake

Vamos ver algumas diferenças importantes entre o esquema Star ou o esquema Snowflake.

Esquema em estrela:

  • As hierarquias de dimensão no esquema em estrela são armazenadas na tabela de dimensões.
  • Ele contém uma tabela de fatos central cercada por tabela de dimensão.
  • Nesse caso, uma única junção associava a tabela de fatos a uma tabela de dimensões.
  • Tem um design simples.
  • A estrutura de dados é desnormalizada.
  • A consulta é executada em uma taxa mais rápida.
  • Nesse cubo, o processamento é mais rápido.
  • Possui dados mais redundantes.
  • Ele usa consultas simples.
  • O esquema em estrela é fácil de entender.
  • Em um esquema em estrela, mais espaço é consumido.

Esquema de floco de neve:

  • Hierarquias em um esquema de floco de neve são armazenadas em tabelas separadas.
  • Ele também contém uma tabela de fatos cercada por tabela de dimensões e essas tabelas de dimensões são ainda mais cercadas por uma tabela de dimensões.
  • Nesse esquema, muitas junções são necessárias para buscar os dados.
  • Tem um design complexo.
  • A estrutura de dados é normalizada no esquema do floco de neve.
  • A consulta executa comparativamente mais lenta que o esquema em estrela.
  • No esquema do floco de neve, o processamento do cubo é mais lento.
  • Ele contém dados menos redundantes.
  • Ele usa consultas complexas.
  • O esquema do floco de neve é ​​comparativamente difícil de entender esse esquema em estrela.
  • No esquema do floco de neve, menos espaço é consumido.

Tabela de comparação de esquema Star vs esquema Snowflake

Vamos discutir as comparações entre Star Schema vs Snowflake Schema.

Característica

Esquema em estrela

Esquema de floco de neve

Manutenção / MudançaPossui dados mais redundantes e, portanto, é mais difícil alterar ou manterEsse esquema é mais fácil de alterar e manter devido a menos redundância
CompreensibilidadeA complexidade da consulta é menor e, portanto, é fácil entenderAs consultas aplicadas são mais complexas e, portanto, difíceis de entender
Tempo de execução da consultaPossui menos chaves estrangeiras e, portanto, a execução da consulta é mais rápida e leva menos tempoDevido a mais chaves estrangeiras, o tempo de execução da consulta é maior ou a consulta é executada lentamente
Tipo de Data WarehouseMelhor para datamarts com relacionamento único, ou seja, um para um ou um para muitosMelhor para relacionamentos complexos, isto é, muitos para muitos relacionamentos
Número de junçõesTem mais número de junçõesTem menos número de junções
Tabela de dimensõesPossui apenas uma tabela de dimensões para cada dimensãoPossui uma ou mais tabelas de dimensões para uma única dimensão
UsabilidadeSe o tamanho da tabela de dimensões for menor, ou seja, menor número de linhas, o esquema em estrela é preferidoÉ bom usar quando o tamanho da tabela de dimensões é maior
Normalização e desnormalizaçãoA tabela de fatos e as tabelas de dimensões são desnormalizadas.Uma tabela de fatos é desnormalizada enquanto a tabela de dimensões é normalizada
Modelo de dadosSegue uma abordagem de cima para baixoSegue uma abordagem de baixo para cima

Conclusão

Neste artigo, discutimos em detalhes o esquema Star Star vs Snowflake Schema. Esses esquemas são usados ​​para representar o armazém de dados. Eles são semelhantes em alguns aspectos e diferentes em outros. Floco de neve é ​​a extensão do esquema em estrela. Quando os dados são maiores, o floco de neve é ​​preferido, pois reduz a redundância, mas a estrela é comparativamente mais popular que o esquema do floco de neve.

Artigos recomendados

Este é um guia para o Star Schema vs Snowflake Schema. Aqui também discutimos as principais diferenças do esquema Star vs esquema Snowflake com infográficos e tabela de comparação. Você também pode consultar nossos outros artigos sugeridos para saber mais -

  1. Codificação vs Decodificação - Principais Diferenças
  2. Diferença entre dados pequenos e dados grandes
  3. Teste Funcional vs Teste Não Funcional
  4. Teste de Fumo vs Teste de Sanidade
  5. O que é o teste de sanidade e como funciona?