Perguntas e respostas da entrevista do ab initio

Então você finalmente encontrou o emprego dos seus sonhos no Ab initio, mas está se perguntando como quebrar a Entrevista do Ab initio e quais poderiam ser as prováveis ​​Perguntas da Entrevista do Ab initio para 2018. Cada entrevista é diferente e o escopo de um trabalho também. Tendo isso em mente, criamos as perguntas e respostas mais comuns da entrevista do Ab initio para 2018 para ajudá-lo a obter sucesso em sua entrevista.

Abaixo, estão as principais perguntas da entrevista Ab initio, que são feitas com freqüência em uma entrevista. Essas perguntas da entrevista estão divididas em duas partes:

Parte 1 - Perguntas da entrevista ab initio (Básica)

Esta primeira parte aborda as perguntas e respostas básicas da entrevista do Ab initio.

1. Quais são os componentes ou funções disponíveis no ab initio?

Responda:
Os principais componentes do ab initio estão aqui abaixo,

ComponenteObjetivo
DedupPara remover duplicatas
Junte-sePara juntar vários conjuntos de dados de entrada com base em um valor de chave comum.
OrdenarEste componente reordena os dados. Leva a ordem de agrupamento e despeja dados na memória
FiltroQualquer remoção relacionada condicional de dados.
ReplicarEsse componente é principalmente para o paralelismo, pois uma cópia adicional dos dados é útil enquanto outros nós ficam indisponíveis.
fundirEste componente é para combinar vários dados de entrada.

2. Quais são os tipos de processamento paralelo?

Responda:
Essas são as perguntas comuns da entrevista Ab initio feitas em uma entrevista. Diferentes tipos de processamento paralelo são,

  1. Paralelismo de componentes
  2. Paralelismo de dados
  3. Paralelismo de pipeline

Paralelismo de componentes: um aplicativo que possui vários componentes em execução no sistema simultaneamente. Mas os dados são separados. Isso é obtido através do processamento paralelo no nível do componente.

Paralelismo de dados: os dados são divididos em segmentos e executam as operações simultaneamente. Esse tipo de processo é alcançado usando o paralelismo de dados

Paralelismo de pipeline: um aplicativo com vários componentes, mas executando no mesmo conjunto de dados. Isso usa paralelismo de pipeline.

3. Qual é a maneira diferente de obter as partições?

Responda:
Existem várias maneiras de fazer as partições.

PartiçõesDescrição
ExpressãoDados divididos de acordo com a linguagem de manipulação de dados.
ChaveAgrupando os dados por chaves específicas
Balanceamento de cargaBalanceamento de carga dinâmico
PercentagemSepare os dados em que o tamanho da saída está nas frações de 100
AlcanceDivida os dados uniformemente com base em uma chave e um intervalo entre os nós
Pisco de peito vermelho redondoDistribuir os dados uniformemente em tamanho de bloco nas partições de saída.

Vamos passar para as próximas perguntas da entrevista do Ab initio.

4. O que é um sistema multifile?

Responda:
Multifile é um conjunto de diretórios em diferentes nós em um cluster. Eles possuem uma estrutura de diretório idêntica. O sistema multifile leva a um melhor desempenho, pois é um processamento paralelo em que os dados residem em vários discos.

Ele é criado com a partição de controle em um nó e as partições de dados nos outros nós para distribuir o processamento para melhorar o desempenho.

5. Diferença entre Hadoop e Ab initio?

Responda:

HadoopAb initio
Código abertoSoftware proprietário
Processamento paralelo através de mapeadores e redutoresArquitetura de processamento paralelo
Qualquer variedade de dados é mais adequada aquiMelhor para implementações tradicionais de EDW
A tolerância a falhas é alcançadaA tolerância a falhas não é alcançada
O MapReduce é controlado em qualquer componente ou funçãoComponentes como ingresso, grupo e classificação são facilmente

realizado

Barato como seu código aberto e pode experimentar qualquer caso de uso comercial.Caro e aplicável em um caso de negócios de alto valor devido ao custo
Componentes fracamente acoplados onde funções personalizadas são construídasAcoplado firmemente entre os componentes, pois eles são altamente recomendados com base no caso de uso de negócios.

Parte 2 - Perguntas da entrevista do Ab initio (avançado)

Vamos agora dar uma olhada nas perguntas avançadas da entrevista do Ab initio.

6. Que tipo de layouts o Ab initio suporta?

Responda:

  • Suporta layouts seriais e paralelos.
  • Um layout gráfico suporta layouts seriais e paralelos ao mesmo tempo.
  • Um sistema com vários arquivos é um sistema paralelo de quatro vias
  • Um componente em um sistema gráfico pode executar um sistema paralelo de quatro vias.

7. Qual é a relação entre o ambiente de metadados da empresa (EME), o ambiente de desenvolvimento gráfico (GDE) e o sistema de cooperação?

Responda:
Sistema cooperativo: Opera sobre o sistema operacional e é fornecido pelo ab initio e é a base para todos os processos do Ab Initio. Os comandos aéreos são um dos recursos que podem ser instalados em diferentes sistemas operacionais, como UNIX, Linux, IBM etc.

Esses são os seguintes recursos que ele fornece,
- Gerencia e executa gráficos Ab Initio e controla os processos ETL
- Fornecendo as extensões
- Monitoramento e depuração de processos ETL
- Gerenciamento de metadados e interação com o EME

GDE: É um componente de design e usado para executar os gráficos ab initio.

Os gráficos são formados pelos componentes (predefinidos ou definidos pelo usuário) e fluxos e parâmetros. Ele fornece o processo ETL no Ab Initio que é representado por gráficos.

Capacidade de executar, depurar trabalhos de logs de processos e rastrear logs de execução

Meta-ambiente corporativo (EME): é um ambiente para armazenamento e também gerenciamento de metadados (metadados comerciais e técnicos). Os metadados são acessados ​​no ambiente de desenvolvimento gráfico e também no navegador da web ou na linha de comando que coopera. É um repositório ab initio para qualquer espaço reservado.

Vamos passar para as próximas perguntas da entrevista do Ab initio.

8.Como os dados são processados ​​e quais são os fundamentos dessa abordagem?

Responda:
Existem certas atividades que exigem a coleta de dados e o melhor a ser processado depende em grande parte do mesmo em muitos casos. Antes de processar os dados, eles precisam residir em algum espaço reservado, como um armazenamento bem definido. Essa tarefa depende de alguns fatores principais, pois eles são

1. Coleta de Dados
2. Apresentação
Resultados finais
4.Análise
5. Classificação

9. Qual é a diferença entre particionar com chave e round robin?

Resposta :
Estas são as perguntas avançadas da entrevista Ab initio feitas em uma entrevista. Partição por chave
Nisto, precisamos especificar a chave com base na qual a partição ocorrerá. Isso resulta em dados bem balanceados devido às partições baseadas em chaves. É útil para dependentes de chave
paralelismo.
Partição por round robin: nesse processo, distribuindo dados uniformemente em blocos de tamanho de bloco, os registros são particionados de maneira sequencial na partição de saída. Não é chave
com base e resultados são dados bem equilibrados, especialmente com um tamanho de bloco de 1. É útil para
registrar paralelismo independente.

10. Como você melhora o desempenho de um gráfico?

Resposta :
Existem várias maneiras de melhorar o desempenho do gráfico.
1) Reduza o uso de vários componentes em determinadas fases.
2) Use um valor refinado e bem definido de valores máximos de núcleo para classificar e unir componentes
3) Minimize o uso de funções de expressão regular como re_index nas funções de transferência
4) Minimize o componente de junção classificada e, se possível, substitua-o por junção na memória / junção de hash
5) Use apenas os campos obrigatórios na classificação, reformatação, junção de componentes
6) Usando Phase ou buffer de fluxo durante os casos de junções mescladas ou classificadas
7) Use junção de hash se os dois conjuntos de entrada forem pequenos ou melhor escolha a junção classificada para o tamanho de entrada enorme
8) Para um conjunto de dados grande, é melhor não usar a transmissão como particionada.
9) Reduza o número de componentes de classificação durante o processamento.
10) Evite reparticionar dados desnecessariamente

Artigo recomendado

Este foi um guia para as Perguntas e Respostas da Entrevista Ab initio, para que o candidato possa reprimir essas Perguntas da Entrevista Ab initio facilmente. Aqui neste post, estudamos as principais perguntas da entrevista Ab initio, que são frequentemente feitas em entrevistas. Você também pode consultar os seguintes artigos para saber mais -

  1. Perguntas da entrevista para Android - As 10 principais perguntas úteis
  2. Perguntas da entrevista estatística | Útil e mais solicitado
  3. Perguntas da entrevista do Minitab - As 7 principais perguntas úteis a aprender
  4. Perguntas e respostas da entrevista Splunk que você deve saber