Introdução às perguntas da entrevista de Cassandra

O Apache Cassandra é um sistema de gerenciamento de banco de dados distribuído “NoSQL” altamente disponível. É um tipo de banco de dados NoSQL. O Cassandra é de código aberto e foi projetado de modo a lidar com grandes quantidades de dados, fornecendo alta disponibilidade que não possui um ponto único de falha. O Cassandra se tornou um projeto Apache de nível superior em 2010. O Cassandra foi escrito em linguagem java e, portanto, pode ser executado em vastos sistemas operacionais e plataformas de matriz. Pode ser flexível no armazenamento em tempo real dos dados para aplicativos on-line e também pode ler dados para o sistema de inteligência de negócios.

Lista das 10 principais perguntas e respostas mais frequentes da entrevista de Cassandra em 2019:

Então você finalmente encontrou o emprego dos seus sonhos em Cassandra, mas está se perguntando como quebrar a Entrevista Cassandra 2019 e quais poderiam ser as prováveis ​​perguntas da entrevista Cassandra. Cada entrevista da Cassandra é diferente e o escopo de um trabalho também é diferente. Tendo isso em mente, criamos as perguntas e respostas mais comuns da entrevista de Cassandra para ajudá-lo a obter sucesso em sua entrevista.

1. O que é o NoSQL? Quantos tipos de bancos de dados NoSQL existem?

Responda:
O NoSQL (às vezes expandido para "não apenas o SQL") poderia ser uma categoria ampla de sistemas de gerenciamento que discordam do modelo clássico do sistema de gerenciamento de banco de dados relacional (RDBMS) de algumas maneiras significativas.

Sistemas NoSQL:
- Projetado especificamente para carga máxima
- Suporte nativo à escalabilidade horizontal
- Geralmente não armazena dados em uma tabela
- Às vezes, oferecem consistência máxima em vez de transações ACID
- Tolerante a falhas
- Armazene dados da maneira desmoralizada

Ao contrário do RDBMS, os sistemas NoSQL:
• Geralmente não oferecem suporte para transações distribuídas
• Não garanta a consistência dos dados
• Às vezes, não use algumas idéias avançadas de RDBMS, como gatilhos, visualizações, procedimentos de espera

As implementações NoSQL podem ser categorizadas por sua maneira de implementação:
1. Armazéns de documentos (MongoDB, Couchbase)
2. Armazéns de valor-chave (Redis, Voldemort)
3. Armazéns de Colunas (Cassandra)
4. Lojas de Gráfico (Neo4j, Giraph)
5. Bancos de dados com valores múltiplos
6. Bancos de dados de objetos
7. Triplestore
8. Loja dupla

2. Explique o que é Cassandra? Por que o Cassandra é preferido em relação a diferentes bancos de dados NoSQL como o HBase?

Responda:
O Apache Cassandra é um sistema de gerenciamento de banco de dados distribuído “NoSQL”, altamente disponível, que é um código aberto e projetado para lidar com grandes quantidades de dados, fornecendo alta disponibilidade sem um único ponto de falha. O Cassandra foi desenvolvido no Facebook e, após o código de fonte aberta do Facebook, Cassandra se tornar um projeto Apache de nível superior em 2010. É um tipo de banco de dados NoSQL. O Cassandra é escrito em Java e pode ser executado em uma vasta gama de sistemas operacionais e plataformas. Pode servir como ambos
• Sistema de armazenamento de dados em tempo real para aplicativos online
• Leia também dados para o sistema de business intelligence

Para desempenho e disponibilidade, o Cassandra foi projetado para dados distribuídos em larga escala e otimizado para gravações muito rápidas.

Os vários fatores responsáveis ​​pelo uso do Cassandra são

• Escalabilidade de gigabytes a petabytes
• Pode ser uma informação orientada a colunas
• Nenhum objetivo único de falha
• Não há necessidade de uma camada de cache separada
• Estilo de esquema flexível
• Possui armazenamento de dados versátil, distribuição simples de conhecimento e gravações rápidas
• Suporta propriedades ACID (Atomicidade, Consistência, Isolamento e Durabilidade)
• Multi-datacentro e nuvem capaz
• Compressão de dados

3. O que é SSTable?

Responda:
SSTable também é conhecido como 'Tabela de cadeias classificadas'. Nele, as memórias são armazenadas no disco e existem para cada tabela do Cassandra. Por serem imutáveis, as SStables não permitem, de maneira alguma, a adição e remoção de itens de dados depois de gravadas. Para cada SSTable, três arquivos são criados pelo Cassandra como índice de partição, estrutura de tópicos da partição e um filtro de bloom.

4. Definir tabela de memórias no Cassandra?

Responda:
É uma estrutura de dados residente na memória. uma vez confirmado, as informações são gravadas na tabela de memórias. A tabela Mem é ​​uma casa de cache na memória / write-back que consiste em conteúdo no formato de chave e coluna. As informações na tabela de memórias são classificadas por chave e cada família de colunas consiste em uma tabela de memórias definida que recupera o conhecimento da coluna por meio da chave.

5. Como o Cassandra armazena dados?

Responda:
• Todos os dados permanecem em bytes
• Quando você especifica o validador, o Cassandra garante a medida quadrada dos bytes codificados conforme a demanda.
• Enquanto composto é apenas matrizes de bytes com uma codificação específica, para cada elemento ele armazena um comprimento de dois bytes seguido pelo elemento codificado da unidade de memória do computador seguido por um bit de terminação.

6. Mencione o que são coleções Cassandra-CQL?

Responda:
O Cassandra fornece um prompt da linguagem de consulta do Cassandra (cqlsh) usando o qual você pode executar o Cassandra Query Language (CQL). No Cassandra, você pode usar coleções CQL das seguintes maneiras
• Lista: é usada quando a ordem das informações precisa ser mantida e o valor deve ser mantido várias vezes (contém a lista de elementos distintos)
• SET: é usado para o cluster de componentes armazenar e voltou em ordens ordenadas
• MAP: É um tipo de dados usado para armazenar um par de elementos de valor-chave

7. Explique o modelo de dados Cassandra?

Responda:
O modelo de dados Cassandra consiste em 4 pilares principais: cluster, espaço de chave, coluna, coluna e família.
Clusters - Clusters contêm muitos nós (máquinas) e podem conter vários espaços de chave.
Espaço de chave - um espaço de chave é um espaço de nome para agrupar várias famílias de colunas.
Coluna - Uma coluna contém um nome, valor e carimbo de data / hora.
Família - uma família de colunas contém várias colunas referenciadas por uma linha de chaves.

8. Explique como Cassandra escreve?

Responda:
Cassandra primeiro grava dados em um log de confirmação e depois associa em memtable e em uma tabela. Uma gravação é bem-sucedida quando as duas confirmações estão concluídas. Memtables e SSTables são criadas por família de colunas. As gravações são gravadas no disco em uma estrutura de tabela chamada SSTable (tabela de seqüência de caracteres classificada). No caso de uma falha, uma vez gravada na SSTable Cassandra, apenas reproduzirá o log de confirmação. Com esse estilo, o Cassandra tem a E / S de disco mais baixa e oferece desempenho de gravação em alta velocidade, pois o log de confirmação é apenas anexado e o Cassandra não procura nas gravações.

9. Explique como o Cassandra exclui dados?

Responda:
As SSTables são tabelas imutáveis. Depois que uma linha precisa ser excluída, o Cassandra atribui o valor da coluna a um valor especial chamado Tombstone. Depois que os dados são lidos, o valor de Tombstone é levado em consideração como excluído.

10. Qual é a consistência ajustável no Cassandra? Quantos tipos de consistência ajustável são suportados no Cassandra?

Responda:
A consistência sintonizável pode ser uma característica fantástica do Cassandra que o torna uma seleção preferida. Consistência refere-se às linhas de dados síncronas e atualizadas em todas as suas réplicas. Ajustável do Cassandra A consistência ajustável do Cassandra facilita os usuários a escolher a consistência mais adequada aos seus casos de uso.
Ele suporta duas consistências: Consistência Eventual e Consistência Forte.
Consistência Eventual - A consistência eventual é empregada quando não são feitas novas atualizações em um determinado item de dados, todos os acessos retornam com a última atualização atualizada eventualmente. Sistemas com consistência eventual famosa por possuir convergência de reprodução alcançada.
Condições subsequentes do Cassandra para consistência robusta:
R + W> N
Aqui
N: Número de réplicas
W: Número de nós que precisam concordar para uma gravação bem-sucedida
R: Número de nós que precisam concordar para uma leitura bem-sucedida

Artigo recomendado

Este foi um guia para a lista de perguntas e respostas da entrevista de Cassandra, para que o candidato possa reprimir essas perguntas da entrevista de Cassandra facilmente. Este artigo consiste em todas as principais perguntas e respostas da entrevista de Cassandra. Você também pode consultar os seguintes artigos para saber mais -

  1. 5 perguntas interessantes da entrevista que você deve saber! (Lembrar)
  2. Perguntas da entrevista para um pesquisador de ações
  3. 20 emocionantes perguntas da entrevista para um trabalho de gerente de projeto
  4. Fatores sobre Entrevista Baseada em Competências (Guia)
  5. O que são as habilidades do NOSQL
  6. Cassandra é NoSQL?