O que é o modelo de dados?

A interpretação e a documentação dos procedimentos e transações de design e desenvolvimento de software existentes são denominadas modelagem de informações. Os métodos e instrumentos de modelagem de informações simplificam os projetos complexos do sistema para simplificar a reengenharia da operação das informações. É usado para projetar um armazém de informações lógica e fisicamente. Neste tópico, vamos aprender sobre a Modelagem de Data Warehouse.

Necessidade de modelagem de data warehouse

  1. Coleta de requisitos de negócios
  2. Melhorando o desempenho do banco de dados
  3. Fornece documentação do sistema de origem e destino

1. Coleta de Requisitos de Negócios

Um data warehouse normalmente é projetado para determinar as entidades necessárias para o data warehouse e os fatos que devem ser registrados com os arquitetos de dados e usuários de negócios. Esse primeiro design tem muita iteração antes que o modelo final seja decidido.

Temos que superar as desvantagens predominantes na fase de projeto neste momento. Como um sistema existente implementa um data warehouse, os arquitetos às vezes incorporam uma grande proporção do sistema antigo ao novo design, economizando tempo ou divulgação.

O modelo lógico captura efetivamente as necessidades da empresa e serve como base para o modelo físico.

2. Melhorando o desempenho do banco de dados

Verificar a eficiência é uma característica essencial de um armazenamento de dados. Em um data warehouse, há enormes informações envolvidas; portanto, é muito essencial usar um produto de modelo de dados para metadados e gerenciamento de dados usado pelos consumidores de BI.

O modelo físico adiciona indexação para otimizar a eficiência do banco de dados. Os esquemas também são modificados às vezes. Por exemplo, se um esquema em estrela promete uma recuperação mais rápida dos dados, ele pode mudar para um esquema de floco de neve

3. Fornece documentação do sistema de origem e destino

No desenvolvimento de um sistema ETL, é muito importante verificar os modelos físicos e lógicos dos sistemas de origem e destino.

Esta documentação é oferecida pela modelagem de informações como uma referência para o futuro.

Modelo Conceitual de Dados

O relacionamento mais alto entre as entidades distintas é determinado por um modelo de dados conceitual.

É o primeiro passo para criar um modelo de dados de cima para baixo que represente a apresentação precisa da organização comercial.

Projeta a estrutura total do banco de dados e lista as áreas de assunto

Compreende os tipos e interações de entidades. As notações simbólicas (IDEF1X ou IE) representam a conexão entre os campos do tópico. Em um modelo de informação, a cardinalidade mostra os relacionamentos um a um ou muitos

Modelo de dados de relacionamento

A modelagem de informações relativas em esquemas OLTP orientados a transações é usada. Um modelo de dados relacionais possui recursos significativos:

  • Usos da chave
  • Redundância de dados
  • Relação entre dados

Usos da chave

A chave principal em uma tabela é a chave. É usado como uma única identificação. Uma coluna diferente de zero é uma chave primária. Para a chave principal, a chave estrangeira é usada. Eles vinculam as informações de uma tabela a outra tabela e se conectam.

Redundância de dados

O modelo de informações de relacionamento aplica leis de integridade das informações

A redundância de dados é eliminada. Uma informação não é coletada repetidamente. Isso garante a consistência dos dados e o armazenamento restrito de dados

Relação entre dados

Todos os dados são armazenados em tabelas e cada relacionamento possui colunas e linhas.

Um cabeçalho e um corpo devem estar sobre a mesa. O cabeçalho é a lista de colunas da tabela e a tabela consiste nas linhas. A tupla é o valor único produzido por uma interseção de coluna e linha.

Modelo de dados multidimensional

Uma organização que reflete as entidades significativas de uma empresa e a conexão entre elas é uma perspectiva lógica de um modelo de dados multidimensional. Os bancos de dados e tabelas não estão limitados a um banco de dados natural. Os diagramas de ER não são representados.

  • Atributos
  • Fatos
  • Dimensão

uma. Dimensão

  1. Um aspecto é uma coleta de dados que consiste em componentes de informações individuais que não se sobrepõem
  2. Você pode definir, agrupar e filtrar informações para fins de visualização e navegação pelos usuários finais.

b. Fatos

  1. Uma tabela de colunas usada para responder a problemas da empresa por motivos numéricos.
  2. As medidas são aditivas, semi-aditivas e não aditivas

c. Atributos

  1. As condições abstratas são projetadas para facilitar o resumo das informações em um estudo
  2. Eles também podem ser descritos como títulos de coluna que não estão incluídos no cálculo do relatório.

Vantagens do modelo dimensional

  1. A padronização de dimensões facilita o relatório entre as áreas de negócios.
  2. Dimensional também para armazenamento de dados para facilitar a obtenção de dados quando os dados são armazenados no banco de dados.
  3. A empresa é muito compreensível para o modelo dimensional. Esse modelo é baseado nos termos da empresa, para que a empresa entenda os significados de cada realidade, aspecto ou característica.
  4. Para consulta rápida de informações, os modelos dimensionais são deformados e otimizados. Muitas plataformas de banco de dados de relacionamento reconhecem esse modelo e otimizam os planos de desempenho da consulta.
  5. Os modelos dimensionais podem acomodar alterações convenientemente. As tabelas de dimensões podem incluir colunas adicionais sem influenciar o uso dessas tabelas pelos aplicativos atuais de inteligência da empresa.

Modelagem de dados de práticas recomendadas

Antes de iniciar o modelo de dados, uma análise completa das necessidades da empresa-cliente deve ser realizada. Deve ser extremamente importante atender aos clientes para discutir demandas e técnicas de modelagem de informações e solicitar que os especialistas da empresa o confirmem imediatamente.

A empresa deve entender o modelo de dados, seja em formato gráfico / metadado ou como regras de negócios para textos.

Artigos recomendados

Este é um guia para Modelagem de Data Warehouse. Aqui discutimos o modelo de dados, por que ele é necessário no Data Warehousing, além de suas vantagens e tipos de modelos. Você também pode consultar o seguinte artigo para saber mais -

  1. Ferramentas de Data Warehouse
  2. Tipos de Data Warehouse
  3. Ferramentas de análise de dados
  4. Ferramentas de ciência de dados
  5. Armazenamento de Dados Oracle

Categoria: