Introdução ao esquema Star

O esquema em estrela é a abordagem mais fácil e o modelo dimensional, onde as tabelas de funções, dimensões e fatos são organizados de maneira organizada e são aplicados principalmente em Business Intelligence e Data Warehousing. Um esquema em estrela é formado organizando cada fato com suas dimensões relacionadas que se assemelham a uma estrela. Um fato é um resultado infinito, como detalhes de vendas e contagens de login. Uma dimensão é a coleta de dados de referência, incluindo fatos, como data, detalhes sobre o produto e os clientes. O esquema em estrela é otimizado para grandes consultas de dados em data warehousing, cubos de dados do Online Analytical Processing e também consultas ad-hoc.

Como criar um esquema em estrela?

Aqui, o usuário criará o Star Schema por conversão do modelo de entidade-relacionamento. Os modelos de relacionamento de entidade são muito complexos para explicar as quantidades e atributos funcionais, portanto, é simplificado para o esquema em estrela dimensional da seguinte maneira:

  • Encontre o procedimento corporativo na visão de relacionamento da entidade e entenda o modelo que pode ser dividido em vários modelos dimensionais. Um relacionamento de entidade consiste em dados comerciais.
  • Encontre muitas ou muitas tabelas no relacionamento entre entidades, o que explica o procedimento da empresa e as converta em tabelas de realidade de modelos dimensionais. Esta tabela contém dados que incluem a tabela de fatos e uma tabela dimensional com valores numéricos e atributos-chave exclusivos.
  • A idéia por trás desse processo é diferenciar as tabelas de informações baseadas em troca ou as tabelas apagadas pelas informações. Portanto, é necessário projetar muitos ou vários relacionamentos. Por exemplo, no banco de dados do ERP, existem detalhes da fatura que são a tabela de trocas. Os detalhes atualizados e atualizados são tabelas baseadas em troca. Agora, comparando as duas tabelas, deduz-se que os dados são realmente estáticos.
  • A tabela de realidade é uma representação de um modelo dimensional que mostra muitas e numerosas redes entre medições finitas. Isso resulta que chaves estrangeiras nas tabelas de realidade compartilham de muitos a numerosos, que é um relacionamento contável. a maior parte dessa tabela se enquadra em tabelas baseadas em troca
  • A última etapa no design do esquema em estrela é desnormalizar as tabelas residentes em tabelas de medidas. A chave obrigatória é criar uma chave duplicada. Essa chave baseia-se na tabela de realidade que ajuda na melhor compreensão. Encontre a data e a hora do design do relacionamento entre entidades e arquive a tabela de dimensões. As datas são salvas como carimbos de data e hora. Uma coluna de dimensão de data representa o ano, mês ou data ou hora

Exemplo: a tabela dimensional do tempo possui TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, que podem ser critérios importantes para as tabelas dimensionais. Da mesma forma, todas as tabelas possuem ID e atributos exclusivos. Linguagens de consulta como SQL podem ser aplicadas à mineração de dados, data warehouse e análise de dados.

Sintaxe da definição de cubo:

Define cube (cube-name)(dimension-list): (measure-list)

Os cubos são implantados para endereçar os alertas em vários níveis e o tempo de resposta para responder à consulta é mínimo. Está disponível como um design pré-fabricado e aplicável nas situações necessárias. A criação do esquema Star é muito fácil e eficiente de aplicar e também é adaptável. A conclusão da tabela de fatos e da tabela dimensional é obrigatória, que por sua vez se forma em estrela e pode ser formada usando consultas SQL ou código em execução. Esse design foi desenvolvido para melhor entendimento e busca fácil de dados.

Características do esquema estrela

1. O esquema em estrela fornece agregações e cálculos rápidos, como o total de itens vendidos e a receita da receita obtida no final de cada mês. Esses detalhes e processos podem ser filtrados de acordo com os requisitos, enquadrando as consultas adequadas.

2. Tem a capacidade de filtrar os dados de dados normalizados e fornecer as necessidades de data warehousing. As informações associadas da tabela normalizada são empilhadas na guia de várias dimensões. Uma chave exclusiva é gerada para cada tabela de fatos para identificar cada linha.

3. Tabela de fatos é a medida de eventos específicos, incluindo valores numéricos finitos e consiste em chaves estrangeiras relacionadas a tabelas dimensionais. Esta tabela é enquadrada com valores de fatos no nível atômico e permite armazenar vários registros por vez. Existem três tipos diferentes de tabela de fatos.

4. As tabelas de fatos da transação consistem em dados sobre eventos específicos, como feriados, eventos de vendas.

5. Registro de fatos para períodos determinados, como informações da conta no final de cada trimestre.

6. As tabelas com agregação rápida por um determinado período são chamadas de tabelas de Captura Instantânea Acumuladora.

7. As tabelas dimensionais fornecem dados detalhados dos atributos, registros encontrados na tabela de fatos. A tabela de dimensões pode ter recursos variados. As tabelas dimensionais são usadas principalmente como tabela de dimensões Hora e data, tabela dimensional de produto e ordem de compra, detalhes do funcionário e da conta tabela dimensional, tabela dimensional de localização geográfica e de localização. Essas tabelas são atribuídas com um único tipo de dados inteiro, que é a chave primária duplicada.

8. O usuário pode projetar sua tabela de acordo com os requisitos. Por exemplo, se ele precisar de uma tabela dimensional de vendas com chave de produto e cliente, chave de data e hora, a chave de receita gerada. Se o empresário enquadrar uma tabela dimensional do produto com atributos-chave, como cor, data do item comprado, chave da promoção e chave do cliente.

Vantagens

  • É formado com lógica simples e consultas fáceis de extrair os dados do processo transacional.
  • Possui uma lógica de relatório comum, implícita dinamicamente.
  • O esquema em estrela pode oferecer um aumento no desempenho dos aplicativos de relatório.
  • Esquema em estrela projetado alimentando cubos aplicados pelo Processo de Transação Online para criar e fazer com que os cubos funcionem efetivamente.

Desvantagens

  • Possui alta integridade e um alto estado des normalizado. Se o usuário não atualizar os valores, o processo completo será recolhido. As proteções e segurança não são confiáveis ​​até o limite. Não é tão flexível quanto um modelo analítico e não estende seu suporte eficiente a muitos relacionamentos.
  • O esquema em estrela é implantado no banco de dados para controlar a recuperação mais rápida dos dados. A consulta é empregada para selecionar a necessidade, em vez de pesquisar no banco de dados inteiro. Os dados filtrados e selecionados podem ser aplicados em diferentes casos. Portanto, esse esquema em estrela é um modelo simples que é adotado facilmente.

Artigo recomendado

Este é um guia para O que é o Star Schema? Aqui discutimos a introdução ao esquema estrela e suas características, além de vantagens e desvantagens. Você também pode consultar nossos outros artigos sugeridos para saber mais -

  1. Visão geral da tabela de fatos
  2. Esquema em estrela vs esquema de floco de neve | Principais diferenças
  3. Modelagem de data warehouse com tipos
  4. Bancos de dados da AWS com vantagens
  5. Pipeline de dados da AWS

Categoria: