Introdução à entrevista com o porco Perguntas e respostas

O Apache Pig é uma plataforma de alto nível usada para criar programas executados no Hadoop. A língua do porco é conhecida como porco latim. O Pig foi escrito em Java e foi desenvolvido pela pesquisa do Yahoo e pela fundação de software Apache. Seu lançamento inicial ocorreu em 11 de setembro de 2008. Preparando-se para uma entrevista de emprego em Pig. Tenho certeza que você deseja conhecer as perguntas e respostas mais comuns da Entrevista com o Pig que o ajudarão a resolver a Entrevista com o Pig com facilidade.

Abaixo está a lista das principais perguntas e respostas da entrevista com o porco em seu resgate. essas perguntas da entrevista são divididas em duas partes:

  • Parte 1 - Perguntas da entrevista com o porco (básico)
  • Parte 2 - Perguntas da entrevista com o porco (avançado)

Parte 1 - Perguntas da entrevista com o porco (básico)

Esta primeira parte abrange perguntas e respostas básicas da entrevista com o Pig

Q1.Qual é a diferença entre Map Reduce e Pig?

Responda:
O Map Reduce é uma linguagem compilada e a eficiência do código é reduzida, e o Pig é uma linguagem de script com menos eficiência do código.

Q2.O que você quer dizer com bolsa no Pig?

Responda:
A coleção de tuplas é conhecida como uma bolsa em um porco.

Q3.Quais são os tipos de dados complexos no Pig?

Responda:
Map, Tuples e Bag são os tipos de dados complexos do Pig.

Q4.O que é achatado no porco?

Responda:
Quando queremos remover o aninhamento dos dados em tupla ou bolsa, usamos o Flatten.

Q5.Suponha que tenhamos um nome de arquivo com abc.csv e que tenha o atributo id, nome, ano, classificação, duração. Como você fará o upload deste arquivo para um porco?

Responda:
filmes = LOAD 'caminho de abc.csv' USANDO Armazenamento de Pig (', ') como (id, nome, ano, classificação, duração);

Q6.Qual é a diferença entre PigLatin e HIVEQL?

Responda:
HIVEQL é uma linguagem declarativa e PigLatin é uma correspondência procedural.

Vamos para as próximas perguntas da entrevista com o porco.

Q7.O que você quer dizer com bolsa interna e bolsa externa no porco?

Responda:
A relação dentro da bolsa é referida à bolsa interna e a relação normal é conhecida como bolsa externa.

Q8.Qual é a diferença entre grupo e COGROUP?

Responda:
O operador GROUP é usado para agrupar os dados em uma única relação e COGROUP é usado para fazer a relação em GROUP e JOIN.

Q9.Qual é a diferença entre COUNT e COUNT_STAR?

Responda:
A função COUNT não funciona com um valor NULL quando contamos um elemento em um saco, mas COUNT_STAR considerará o valor NULL.

Q10. Quais são os operadores de diagnóstico disponíveis no Apache Pig?

Responda:
Operador de despejo, Descreva o operador, Explique o operador, Ilustre o operador.

Q11.O que você entende por operador UNION e SPLIT?

Responda:
Usando um operador UNION, podemos mesclar o conteúdo de duas ou mais relações e um operador SPILLED é usado para dividir a única relação em duas ou mais relações.

Q12.Como obter as 10 principais tuplas da relação R?

Responda:
Usando a função TOP ().

Vamos para as próximas perguntas da entrevista com o porco.

Q13.Quais são as semelhanças entre Pig e Hive?

Responda:
Uso do porco O PigLatin e o Hive usam o HiveQL ambos convertem os comandos em tarefas do MapReduce.

Q14. Quais são os diferentes tipos de funções de JAVA da UDF que são suportados pelo Apache Pig?

Responda:
Funções algébricas, de avaliação e de filtro são os tipos de funções UDF.

Q15.Você tem um arquivo movies.txt no diretório HDFS com 1000 registros. Você deseja ver apenas os 10 primeiros registros do arquivo movies.txt. Como você vai fazer isso?

Responda:
Primeiro, você deve carregar o movies.txt com o nome da relação movie:
movies = LOAD 'caminho do movies.txt' USANDO Pig Storage (', ') as (attribute);
Resultado = limite de funcionário 10

Parte 2 - Perguntas da entrevista com o porco (avançado)

Vamos agora dar uma olhada nas perguntas avançadas da entrevista com o porco.

Q16.Como os usuários interagem com o Hadoop no Pig?

Responda:
Usando casca grunhida

Q17.O Pig suporta comandos de várias linhas?

Responda:
sim

Q18.Quais são todas as classes de estatísticas em um pacote pigstats?

Responda:
PigStats, JobStats, OutputStats, InputStats.

Q19.O que é UDF?

Responda:
A função que não é incorporada no operador, mas pode criar programaticamente uma função para ativar a funcionalidade.

Q20.Explicar a diferença entre maiúsculas e minúsculas no Pig Latin?

Responda:
As funções e os nomes das relações diferenciam maiúsculas de minúsculas no Pig Latin, mas um nome ou palavra-chave e parâmetro não diferenciam maiúsculas de minúsculas.

Q21.O que é Grunt no Pig?

Responda:
Grunt é um terminal de comando que é um shell interativo onde damos o comando do Pig.

Q22.Qual é o requisito do MapReduce na programação Pig?

Responda:
MapReduce é um mecanismo de execução.

Vamos para as próximas perguntas da entrevista com o porco.

Q23.O que é o motor Pig?

Responda:
O mecanismo Pig fornece o ambiente de execução para executar os programas pig. Ele converte as operações do pig em tarefas do MapReduce.

Q24.Quais são os modos de execução do Pig?

Responda:
Modo Local: A operação do porco será executada na JVM única.
Modo MapReduce: A execução será feita no cluster Hadoop.

Q25.Quais são as diferentes funções do Eval disponíveis no porco?

Responda:
AVG, CONCAT, MAX, MIN, SM, TAMANHO, CONTAGEM são diferentes funções de porco EVAL.

Q26.O que você quer dizer com LOAD e STORE no Pig?

Responda:
Estes são os operadores para carregar e armazenar os dados em hdfs.

Vamos para as próximas perguntas da entrevista com o porco.

Q27.Qual função matemática disponível no Pig?

Responda:
ABS, ACOS, LOG, ROUND, CBRT, SORT são as funções matemáticas disponíveis no Pig.

Q28.O que a palavra-chave distinta fez no Pig?

Responda:
Palavras-chave distintas removem as palavras-chave duplicadas dos registros. Por exemplo:
filmes = LOAD 'caminho de abc.csv' USANDO Armazenamento de Pig (', ') como (id, nome, ano, classificação, duração);
Novos filmes = distintos (id, nome, ano, classificação, duração);

Q29.O que você quer dizer com tipo de dados primitivo no Pig?

Responda:
Int, Long, Float, Double, Char, array Byte são os tipos de dados primitivos no Pig.

Q30.O que você quer dizer com tupla no Pig?

Responda:
Um conjunto ordenado de campo de um dado é chamado Tupla.

Conclusão

Se você estiver se preparando para os trabalhos relacionados ao Hadoop, deverá preparar o Pig para isso, pois esse tópico desempenhará o papel principal de garantir boas observações na entrevista. As perguntas da entrevista do porco, que foram compartilhadas acima, ajudarão você a preparar o básico e teoricamente o porco, mas você deve ter as mãos no porco. Isso ajudará você a criar confiança e conhecimento avançado.

Artigo recomendado

Este foi um guia para a Lista de perguntas e respostas para entrevistas com o porco, para que o candidato possa reprimir essas perguntas facilmente. Aqui abordamos as perguntas básicas e avançadas da entrevista com o porco. Você também pode consultar os seguintes artigos para saber mais -

  1. Perguntas úteis da entrevista sobre o Apache PIG
  2. Perguntas da entrevista em C ++
  3. Perguntas da entrevista do Spark que você deve saber
  4. Perguntas da entrevista do pepino