Introdução às perguntas e respostas da entrevista ETL

ETL significa Extract-Transform-Load. É uma base do sistema do data warehouse, onde os dados são extraídos das diferentes fontes e, em seguida, os dados são transformados onde os dados são aplicados ou processados, a fim de obter qualidade, consistência dos dados em um formato de apresentação apropriado e, finalmente, o os dados são carregados no Data Warehouse no formato de apresentação, para ajudar o usuário final a obter as informações com facilidade e tomar decisões.

Abaixo estão as principais perguntas da entrevista ETL de 2019, que são feitas com frequência em uma entrevista

Se você está procurando um emprego relacionado ao ETL, precisa se preparar para as Perguntas da entrevista ETL de 2019. Embora cada entrevista seja diferente e o escopo de um trabalho também seja diferente, podemos ajudá-lo com as principais perguntas e respostas da entrevista ETL, que ajudarão você a dar o salto e obter seu sucesso em sua entrevista.

Parte 1 - Perguntas da entrevista ETL (Básica)

Esta primeira parte aborda as perguntas e respostas básicas da entrevista ETL

1. Expanda o sistema ETL no data warehouse? Explicar

Responda:
O sistema Extract-Transform-Load (ETL) é a base do data warehouse. Um sistema ETL projetado adequadamente extrai dados dos sistemas de origem, reforça os padrões de qualidade e consistência dos dados, confirma dados para que fontes separadas possam ser usadas juntas e, finalmente, entrega dados em um formato pronto para apresentação, para que os desenvolvedores de aplicativos possam criar aplicativos e usuários finais pode tomar decisões.

2. O significado do sistema ETL no data warehouse?

Resposta :
Remove erros e corrige os dados ausentes. Ele fornece medidas documentadas de confiança nos dados. Captura o fluxo de dados transnacionais para proteção. Ajusta dados de várias fontes para serem usados ​​juntos. Estrutura os dados para serem utilizáveis ​​pelas ferramentas do usuário final.

3. Qual é o processo diário no sistema ETL?

Resposta :
Crie o conjunto de desenvolvimento / teste / produção de processos ETL. Entenda as vantagens e desvantagens de várias estruturas de dados da sala de apoio, incluindo arquivos simples, esquemas normalizados, esquemas XML e esquemas de junção em estrela (dimensional). Analise e extraia dados de origem. Crie um subsistema abrangente de limpeza de dados. Estruture os dados em esquemas dimensionais para a entrega mais eficaz aos usuários finais, ferramentas de business intelligence, ferramentas de mineração de dados, cubos OLAP e aplicativos analíticos. Entregue dados de maneira eficaz a data warehouses altamente centralizados e profundamente distribuídos, usando as mesmas técnicas. Ajuste o processo ETL geral para obter o melhor desempenho.

Vamos para as próximas perguntas da entrevista sobre ETL.

4. Formatos de dados no sistema ETL?

Resposta :
Existem vários formatos de dados no ETL, alguns deles são arquivos simples, conjuntos de dados XML, tabelas de trabalho independentes do DBMS, esquemas normalizados de entidade / relacionamento (E / R) e modelos de dados dimensionais.

5. Criação de perfil de dados no sistema ETL?

Resposta :
A criação de perfil de dados é um exame sistemático da qualidade, escopo e contexto de uma fonte de dados para permitir a construção de um sistema ETL. Em um extremo, uma fonte de dados muito limpa que foi bem mantida antes de chegar ao data warehouse requer transformação e intervenção humana mínimas para carregar diretamente nas tabelas de dimensão final e tabelas de fatos.

6. O que é um validador de ETL?

Resposta :
O ETL Validator é uma ferramenta de teste de dados que simplifica bastante o teste de projetos de Integração de Dados, Data Warehouse e Migração de Dados. Ele utiliza nossa arquitetura patenteada ELV para extrair, carregar e validar dados de fontes de dados como bancos de dados, arquivos simples, XML, Hadoop e sistemas de BI.

Parte 2 - Perguntas da entrevista ETL (avançado)

Vamos agora dar uma olhada nas perguntas avançadas da entrevista ETL.

7. Quais são as operações no sistema ETL?

Resposta :
As três operações a seguir: Extrai os dados do seu sistema transnacional, que pode ser um Oracle, Microsoft ou qualquer outro banco de dados relacional. Transforma os dados executando operações de limpeza de dados. Uma carga é um processo de gravação dos dados no banco de dados de destino.

8. Cite algumas das ferramentas ETL mais usadas no mercado?

Responda:
Existem várias ferramentas ETL usadas no mercado, mas algumas das ferramentas ETL preferidas
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
Gerenciamento de dados SAS.
• Power Center Informatica.
• Elixir Repertório para ETL de dados.
• Migrador de dados (IBI)
Serviços de Integração do SQL Server (SSIS)

9. Quais são os papéis e responsabilidades da equipe ETL?

Responda:
As funções da equipe de ETL no nível mais alto são construir a sala dos fundos do armazém de dados.
• Entregue dados com mais eficiência às ferramentas do usuário final
• Agregue valor aos dados nas etapas de limpeza e conformidade
• Proteger e documentar a linhagem de dados
• Extraindo dados das fontes originais
• Garantia de qualidade e limpeza de dados
• Conformidade dos rótulos e medidas nos dados para alcançar
• consistência entre as fontes originais
• Entrega de dados em um formato físico que pode ser usado por ferramentas de consulta,
• Redatores de relatórios e painéis.

Vamos para as próximas perguntas da entrevista sobre ETL.

10. Qual é o papel da análise de impacto no sistema ETL?

Responda:
A análise de impacto examina os metadados associados a um objeto (neste caso, uma tabela ou coluna) e determina o que é afetado por uma alteração em sua estrutura ou conteúdo. A alteração de objetos de armazenamento temporário de dados pode interromper processos cruciais para carregar adequadamente o armazém de dados. Permitir alterações ad-hoc nos objetos de armazenamento temporário de dados é prejudicial para o sucesso do seu projeto. Depois que uma tabela é criada na área de preparação, você deve executar uma análise de impacto antes de fazer alterações nela. Muitos fornecedores de ferramentas de ETL fornecem funcionalidade de análise de impacto, mas essa funcionalidade geralmente é negligenciada durante a prova de conceito do produto ETL, porque é uma função de sala de espera e
Não é realmente importante até que o data warehouse esteja em funcionamento e comece a evoluir.

11. Como você processa o arquivo simples de tamanho fixo?

Responda:
Um layout de arquivo de tamanho fixo deve incluir o nome do arquivo, onde o campo começa; seu comprimento; e seu tipo de dados (geralmente texto ou número). Às vezes, a posição final é fornecida. Caso contrário, você deve calcular a posição final de cada campo com base em sua posição inicial e comprimento, se necessário pela sua ferramenta ETL. Na maioria das ferramentas ETL, você provavelmente precisará inserir manualmente o layout do arquivo simples uma vez. Depois que o layout é inserido, a ferramenta se lembra do layout e espera o mesmo layout sempre que interagir com o arquivo simples. Se o layout do arquivo for alterado ou os dados mudarem de suas posições atribuídas, o processo ETL deverá ser programado para falhar. Ao processar arquivos simples de comprimento fixo, tente validar se as posições dos dados no arquivo são precisas. Uma verificação rápida para validar as posições é testar qualquer campo de data (ou hora) para garantir que seja uma data válida. Se as posições forem alteradas, o campo de data provavelmente conterá caracteres alfa ou números ilógicos. Outros campos com domínios muito específicos podem ser testados da mesma maneira. XML oferece habilidades de validação mais concretas. Se a validação ou consistência dos dados for um problema, tente convencer o provedor de dados a fornecer os dados no formato XML.

12.Por que ETL em tempo real no data warehouse?

Responda:
O data warehouse precisava fornecer um conjunto inabalável de dados aos tomadores de decisão de negócios, fornecendo um piso de informações confiável sobre o qual se apoiar. Para relatórios atualizados no momento em um banco de dados cintilante, os usuários de negócios eram direcionados aos aplicativos de produção que executam os negócios. Portanto, os usuários tiveram que ir ao data warehouse para obter uma imagem histórica do que aconteceu nos negócios de ontem e tiveram que procurar em muitos sistemas OLTP uma imagem do que estava acontecendo hoje. Os usuários corporativos nunca aceitaram totalmente essa divisão. Obviamente, os data warehouses precisam de fluxos constantes de informações do cliente de uma operação, mas os sistemas operacionais cada vez mais dependem do enriquecimento de informações do cliente no data warehouse. Portanto, é previsível que as organizações tenham começado a explorar alternativas de arquitetura que possam suportar cenários de integração mais generalizados, movendo dados operacionais entre aplicativos e simultaneamente entrando e saindo do armazém com crescente urgência.

Artigos recomendados

Este foi um guia para a lista de perguntas e respostas da entrevista ETL, para que o candidato possa reprimir essas perguntas da entrevista ETL facilmente. Você também pode consultar os seguintes artigos para saber mais -

  1. Paas do Azure vs Iaas - Recursos
  2. 9 perguntas e respostas surpreendentes da entrevista do MapReduce
  3. As 11 perguntas e respostas mais úteis da entrevista sobre RDBMS
  4. 10 perguntas mais impressionantes da entrevista em PHP para pessoas experientes
  5. Conheça as 5 perguntas e respostas mais úteis da entrevista com o DBA

Categoria: