Aprenda a 10 melhor diferença entre MapReduce e Yarn

Índice:

Anonim

Diferença entre mapa reduzir e fios

Yarn significa Yet Another Resource Negotiator, é a nova estrutura para gerenciar recursos (Memória e CPU). Ele nos ajuda a desenvolver o aplicativo distribuído de qualquer tipo, fornece daemons e APIs necessários. Outro recurso importante do YARN é: ele lida e agenda a solicitação de recursos do aplicativo e ajuda o processo a executar a solicitação. O YARN é uma plataforma genérica para executar qualquer aplicativo distribuído, o Map Reduce versão 2 é o aplicativo distribuído executado em cima do YARN, enquanto o map redução é a unidade de processamento do componente Hadoop, mas processa dados em paralelo no ambiente distribuído. Portanto, basicamente reduz o trabalho de mapeamento em um enorme componente de dados; ele processa os dados e armazena no HDFS de forma que a recuperação seja mais fácil do que o armazenamento tradicional.

Comparação cara a cara entre MapReduce vs Yarn (Infographics)

Abaixo está a comparação top 10 entre o MapReduce vs Yarn

Diferença de chave entre MapReduce e Yarn

  1. No Hadoop 1, ele tem dois componentes, o primeiro é o HDFS (Hadoop Distributed File System) e o segundo é o Map Reduce. Enquanto no Hadoop 2 ele também possui dois componentes HDFS e YARN / MRv2 (geralmente chamamos YARN como o Map reduz a versão 2).
  2. No Map Reduce, quando o Map-reduzir pára de funcionar, automaticamente, todo o seu nó escravo para de funcionar. Esse é o único cenário em que a execução da tarefa pode ser interrompida e é chamado de ponto único de falha. O YARN supera esse problema devido à sua arquitetura, o YARN possui o conceito de nó de nome ativo e nó de nome em espera. Quando o nó ativo para de funcionar por algum tempo, o nó passivo começa a trabalhar como nó ativo e continua a execução.
  3. A redução de mapa tem arquitetura de mestre único e escravo múltiplo. Se o escravo mestre cair, o escravo inteiro deixará de funcionar, esse é o ponto único de falha no HADOOP1, enquanto o HADOOP2, que é baseado na arquitetura YARN, tem o conceito de mestre e escravo múltiplo, se um mestre cair, outro mestre retomará seu processo e continuará a execução.
  4. Como podemos ver no diagrama abaixo, a diferença nos ecossistemas HADOOP1 e HADOOP2. O Gerenciamento de Recursos YARN em nível de componente interage com Redução de Mapa e HDFS.

Então, basicamente, o YARN é responsável pelo gerenciamento de recursos, e qual tarefa será executada por qual sistema será decidido pelo YARN, enquanto o map redução é a estrutura de programação responsável por como executar uma tarefa específica, portanto, basicamente o map-red tem dois componentes de mapeador e redutor. para execução de um programa.

  1. No mapa, reduza cada nó de dados executado individualmente, enquanto no Yarn, cada nó de dados é executado por um gerenciador de nós.
  2. A redução de mapa usa o rastreador de tarefas para criar e atribuir uma tarefa ao rastreador de tarefas, devido aos dados que o gerenciamento do recurso não é impressionante, pois alguns dos nós de dados permanecerão ociosos e não serão úteis, enquanto no YARN há um Gerenciador de Recursos para cada um. cluster e cada nó de dados executa um Node Manager. Para cada tarefa, um nó escravo atuará como mestre de aplicativos, monitorando recursos / tarefas.

Tabela de Comparação MapReduce vs Yarn

Base para comparação FIO Mapa Reduzir
SignificadoYARN representa mais um negociador de recursos.Reduzir mapa é auto-definido.
VersãoIntroduzir no Hadoop 2.0Introduzir no Hadoop 1.0
ResponsabilidadeAgora o YARN é responsável pela parte de gerenciamento de recursos.A redução de mapa anterior era responsável pelo gerenciamento de recursos e pelo processamento de dados
Modelo de execuçãoO modelo de execução de fios é mais genérico, em comparação com o Mapa de reduçãoMenos genérico em comparação com YARN.
Execução de aplicativoO YARN também pode executar esses aplicativos que não seguem o modelo Map ReduceO Map Reduce pode executar seu próprio aplicativo baseado em modelo.
ArquiteturaO YARN é introduzido no MR2 na parte superior do rastreador de tarefas e rastreador de tarefas. No lugar do aplicativo rastreador de tarefas e rastreador de tarefas, o mestre entra em cena.Na versão anterior do MR1, o YARN não estava lá. No lugar do YARN, havia um rastreador de tarefas e um rastreador de tarefas que ajuda na execução de aplicativos ou tarefas.
FlexibilidadeYARN é mais isolado e escalávelMenos escalável quando comparado ao YARN.
DaemonsO YARN possui nó de nome, nó de dados, nó de nome secundário, gerenciador de recursos e gerenciador de nós.O Map Reduce possui o nó Nome, Dados, nó Nome Secundário, rastreador de tarefas e rastreador de tarefas.
LimitaçãoNão existe um conceito de ponto único de falha no YARN porque ele possui vários mestres; portanto, se um deles falhar, outro mestre irá buscá-lo e retomar a execução.Ponto único de falha, baixa utilização de recursos (máximo de 4200 clusters por YAHOO) e menor escalabilidade quando comparado ao YARN
TamanhoPor padrão, o tamanho de um nó de dados no YARN é de 128 MBPor padrão, o tamanho de um nó de dados na redução de mapa é de 64 MB.

Conclusão - MapReduce vs Yarn

No Hadoop 1, que é baseado no Map Reduce, há vários problemas que são superados no Hadoop 2 com o Yarn. Como no Hadoop 1, o rastreador de tarefas é responsável pelo gerenciamento de recursos, mas o YARN tem o conceito de gerenciador de recursos e de gerenciador de nós, que serão responsáveis ​​pelo gerenciamento de recursos. A redução de mapa tem um único ponto de falha, ou seja, Rastreador de trabalhos, se o rastreador parar de funcionar, precisamos reiniciar todo o cluster e executar nosso trabalho novamente a partir de Inicial. Em um cenário real, nenhuma organização não deseja correr esse tipo de risco, especialmente em um setor de defesa bancária. Essa organização que trabalha com a racionalização de dados não estará pronta para assumir esse tipo de risco. Por alguns minutos, eles perderão seus dados e poderão ter algum impacto crítico nos negócios. Portanto, o YARN tem um resultado melhor em relação à redução de mapa.

Artigo recomendado

Este foi um guia para o MapReduce vs Yarn, seu significado, comparação cara a cara, diferenças principais, tabela de comparação e conclusão. Você também pode consultar os seguintes artigos para saber mais -

  1. 15 melhores coisas para saber sobre o MapReduce vs Spark
  2. 5 melhores diferenças entre Hadoop e MapReduce
  3. 10 diferença útil entre Hadoop e Redshift
  4. Apache Hadoop vs Apache Spark | As 10 melhores comparações que você deve saber!
  5. Como o MapReduce funciona?