Perguntas e respostas da entrevista do ab initio
Então você finalmente encontrou o emprego dos seus sonhos no Ab initio, mas está se perguntando como quebrar a Entrevista do Ab initio e quais poderiam ser as prováveis Perguntas da Entrevista do Ab initio para 2018. Cada entrevista é diferente e o escopo de um trabalho também. Tendo isso em mente, criamos as perguntas e respostas mais comuns da entrevista do Ab initio para 2018 para ajudá-lo a obter sucesso em sua entrevista.Abaixo, estão as principais perguntas da entrevista Ab initio, que são feitas com freqüência em uma entrevista. Essas perguntas da entrevista estão divididas em duas partes:
Parte 1 - Perguntas da entrevista ab initio (Básica)
Esta primeira parte aborda as perguntas e respostas básicas da entrevista do Ab initio.
1. Quais são os componentes ou funções disponíveis no ab initio?
Responda:
Os principais componentes do ab initio estão aqui abaixo,
Componente | Objetivo |
Dedup | Para remover duplicatas |
Junte-se | Para juntar vários conjuntos de dados de entrada com base em um valor de chave comum. |
Ordenar | Este componente reordena os dados. Leva a ordem de agrupamento e despeja dados na memória |
Filtro | Qualquer remoção relacionada condicional de dados. |
Replicar | Esse componente é principalmente para o paralelismo, pois uma cópia adicional dos dados é útil enquanto outros nós ficam indisponíveis. |
fundir | Este componente é para combinar vários dados de entrada. |
2. Quais são os tipos de processamento paralelo?
Responda:
Essas são as perguntas comuns da entrevista Ab initio feitas em uma entrevista. Diferentes tipos de processamento paralelo são,
- Paralelismo de componentes
- Paralelismo de dados
- Paralelismo de pipeline
Paralelismo de componentes: um aplicativo que possui vários componentes em execução no sistema simultaneamente. Mas os dados são separados. Isso é obtido através do processamento paralelo no nível do componente.
Paralelismo de dados: os dados são divididos em segmentos e executam as operações simultaneamente. Esse tipo de processo é alcançado usando o paralelismo de dados
Paralelismo de pipeline: um aplicativo com vários componentes, mas executando no mesmo conjunto de dados. Isso usa paralelismo de pipeline.
3. Qual é a maneira diferente de obter as partições?
Responda:
Existem várias maneiras de fazer as partições.
Partições | Descrição |
Expressão | Dados divididos de acordo com a linguagem de manipulação de dados. |
Chave | Agrupando os dados por chaves específicas |
Balanceamento de carga | Balanceamento de carga dinâmico |
Percentagem | Separe os dados em que o tamanho da saída está nas frações de 100 |
Alcance | Divida os dados uniformemente com base em uma chave e um intervalo entre os nós |
Pisco de peito vermelho redondo | Distribuir os dados uniformemente em tamanho de bloco nas partições de saída. |
Vamos passar para as próximas perguntas da entrevista do Ab initio.
4. O que é um sistema multifile?
Responda:
Multifile é um conjunto de diretórios em diferentes nós em um cluster. Eles possuem uma estrutura de diretório idêntica. O sistema multifile leva a um melhor desempenho, pois é um processamento paralelo em que os dados residem em vários discos.
Ele é criado com a partição de controle em um nó e as partições de dados nos outros nós para distribuir o processamento para melhorar o desempenho.
5. Diferença entre Hadoop e Ab initio?
Responda:
Hadoop | Ab initio |
Código aberto | Software proprietário |
Processamento paralelo através de mapeadores e redutores | Arquitetura de processamento paralelo |
Qualquer variedade de dados é mais adequada aqui | Melhor para implementações tradicionais de EDW |
A tolerância a falhas é alcançada | A tolerância a falhas não é alcançada |
O MapReduce é controlado em qualquer componente ou função | Componentes como ingresso, grupo e classificação são facilmente
realizado |
Barato como seu código aberto e pode experimentar qualquer caso de uso comercial. | Caro e aplicável em um caso de negócios de alto valor devido ao custo |
Componentes fracamente acoplados onde funções personalizadas são construídas | Acoplado firmemente entre os componentes, pois eles são altamente recomendados com base no caso de uso de negócios. |
Parte 2 - Perguntas da entrevista do Ab initio (avançado)
Vamos agora dar uma olhada nas perguntas avançadas da entrevista do Ab initio.
6. Que tipo de layouts o Ab initio suporta?
Responda:
- Suporta layouts seriais e paralelos.
- Um layout gráfico suporta layouts seriais e paralelos ao mesmo tempo.
- Um sistema com vários arquivos é um sistema paralelo de quatro vias
- Um componente em um sistema gráfico pode executar um sistema paralelo de quatro vias.
7. Qual é a relação entre o ambiente de metadados da empresa (EME), o ambiente de desenvolvimento gráfico (GDE) e o sistema de cooperação?
Responda:
Sistema cooperativo: Opera sobre o sistema operacional e é fornecido pelo ab initio e é a base para todos os processos do Ab Initio. Os comandos aéreos são um dos recursos que podem ser instalados em diferentes sistemas operacionais, como UNIX, Linux, IBM etc.
Esses são os seguintes recursos que ele fornece,
- Gerencia e executa gráficos Ab Initio e controla os processos ETL
- Fornecendo as extensões
- Monitoramento e depuração de processos ETL
- Gerenciamento de metadados e interação com o EME
GDE: É um componente de design e usado para executar os gráficos ab initio.
Os gráficos são formados pelos componentes (predefinidos ou definidos pelo usuário) e fluxos e parâmetros. Ele fornece o processo ETL no Ab Initio que é representado por gráficos.
Capacidade de executar, depurar trabalhos de logs de processos e rastrear logs de execução
Meta-ambiente corporativo (EME): é um ambiente para armazenamento e também gerenciamento de metadados (metadados comerciais e técnicos). Os metadados são acessados no ambiente de desenvolvimento gráfico e também no navegador da web ou na linha de comando que coopera. É um repositório ab initio para qualquer espaço reservado.
Vamos passar para as próximas perguntas da entrevista do Ab initio.
8.Como os dados são processados e quais são os fundamentos dessa abordagem?
Responda:
Existem certas atividades que exigem a coleta de dados e o melhor a ser processado depende em grande parte do mesmo em muitos casos. Antes de processar os dados, eles precisam residir em algum espaço reservado, como um armazenamento bem definido. Essa tarefa depende de alguns fatores principais, pois eles são
1. Coleta de Dados
2. Apresentação
Resultados finais
4.Análise
5. Classificação
9. Qual é a diferença entre particionar com chave e round robin?
Resposta :
Estas são as perguntas avançadas da entrevista Ab initio feitas em uma entrevista. Partição por chave
Nisto, precisamos especificar a chave com base na qual a partição ocorrerá. Isso resulta em dados bem balanceados devido às partições baseadas em chaves. É útil para dependentes de chave
paralelismo.
Partição por round robin: nesse processo, distribuindo dados uniformemente em blocos de tamanho de bloco, os registros são particionados de maneira sequencial na partição de saída. Não é chave
com base e resultados são dados bem equilibrados, especialmente com um tamanho de bloco de 1. É útil para
registrar paralelismo independente.
10. Como você melhora o desempenho de um gráfico?
Resposta :
Existem várias maneiras de melhorar o desempenho do gráfico.
1) Reduza o uso de vários componentes em determinadas fases.
2) Use um valor refinado e bem definido de valores máximos de núcleo para classificar e unir componentes
3) Minimize o uso de funções de expressão regular como re_index nas funções de transferência
4) Minimize o componente de junção classificada e, se possível, substitua-o por junção na memória / junção de hash
5) Use apenas os campos obrigatórios na classificação, reformatação, junção de componentes
6) Usando Phase ou buffer de fluxo durante os casos de junções mescladas ou classificadas
7) Use junção de hash se os dois conjuntos de entrada forem pequenos ou melhor escolha a junção classificada para o tamanho de entrada enorme
8) Para um conjunto de dados grande, é melhor não usar a transmissão como particionada.
9) Reduza o número de componentes de classificação durante o processamento.
10) Evite reparticionar dados desnecessariamente
Artigo recomendado
Este foi um guia para as Perguntas e Respostas da Entrevista Ab initio, para que o candidato possa reprimir essas Perguntas da Entrevista Ab initio facilmente. Aqui neste post, estudamos as principais perguntas da entrevista Ab initio, que são frequentemente feitas em entrevistas. Você também pode consultar os seguintes artigos para saber mais -
- Perguntas da entrevista para Android - As 10 principais perguntas úteis
- Perguntas da entrevista estatística | Útil e mais solicitado
- Perguntas da entrevista do Minitab - As 7 principais perguntas úteis a aprender
- Perguntas e respostas da entrevista Splunk que você deve saber