Introdução à Hive Drop Table

A palavra-chave "DROP" refere-se à exclusão. Para a exclusão de dados, exigimos que os dados estejam presentes na seção.

No Hadoop, temos duas funcionalidades:

  1. Armazenamento de dados
  2. Processamento de dados

Para armazenamento de dados, o HDFS (Hadoop Distributed File System) entra em cena. Agora, quando dizemos que temos dados na tabela de colméias, isso significa duas coisas:

  1. Os dados estão no HDFS
  2. Temos uma tabela de seção criada sobre esse arquivo HDFS e carregamos os dados desse arquivo na tabela de seção.

Então, basicamente, para que a tabela de descarte da seção tenha os dados, o arquivo de dados é um pré-requisito. Neste artigo, veremos como descartar tabelas na seção, o que acontece quando a tabela é descartada e tudo relacionado à tabela de descarte na seção.

Tipos de tabela de soltar no Hive

Na seção, existem dois tipos de tabelas:

  1. Tabela interna ou tabela gerenciada
  2. Tabela externa ou tabela não gerenciada

Tabela gerenciada / tabela interna:

  1. No Hive, " user / hive / warehouse " é o diretório padrão. As tabelas internas são armazenadas neste diretório por padrão. Não precisamos fornecer o local manualmente durante a criação da tabela.
  2. O comando "Soltar tabela" exclui os dados permanentemente.
  3. O Hive gerencia toda a segurança das tabelas gerenciadas.

Eu tenho uma tabela já presente no diretório "user / hive / warehouse" chamado "codes".

Para verificar se a tabela existente é gerenciada ou não gerenciada, podemos usar o comando abaixo:

Sintaxe de comando:

Descrever tabela formatada;

Resultado:

Vamos ver, os dados apresentados na tabela "códigos".

Primeiro, usando o comando hive

Segundo, usando o Hue (experiência do usuário do Hadoop em uma interface da Web)

Comando Excluir: Solte a tabela nome_da_tabela;

Resultado:

Agora, se eu quiser selecionar os dados de "códigos", ocorrerá um erro porque a tabela foi excluída.

Além disso, não poderá ver esta tabela no diretório padrão que é

“Usuário / colméia / armazém”

Observe aqui,

Tabela não gerenciada / Tabela externa:

  1. Tabelas externas, somos obrigados a fornecer o caminho em que precisamos armazenar essa tabela usando a palavra-chave 'location' no comando create table.

Por exemplo:

CRIAR TABELA EXTERNA stg_s2_json.products

(produto sem cadeia, cadeia de nomes do produto, cadeia de descrição, cadeia ativa, cadeia de datas criada, cadeia de datas atualizada) campos delimitados por formato de linha terminados por ', '

LOCALIZAÇÃO '/user/data/hive/stg_s2_json.db/products';

  1. O Hive exclui apenas os metadados. Os dados são permanentes.
  2. Essas tabelas podem ser usadas por qualquer pessoa que tenha acesso ao HDFS, portanto, elas precisam gerenciar a segurança no nível da pasta.

Para entender a eliminação da tabela externa, usaremos a tabela "produtos".

Vamos verificar se a tabela é interna ou externa. Mais uma vez, "descreva o nome da tabela formatada".

Observe o "limite 10" no comando de seleção. A tabela Produtos contém os dados abaixo:

Para verificá-lo no Hue, é assim:

Vamos ver o que acontece quando descartamos esta tabela:

Sintaxe:

Drop table table_name;

Resultado:

Agora, se você estiver tentando recuperar os dados da tabela, gera um erro.

Primeiro, usando o comando “select” no terminal, isso gerará um erro, o que significa que os metadados da tabela externa são excluídos.

Observe o erro aqui:

Segundo, ao verificar o estado dos dados, o arquivo “products.json” ainda está presente no HDFS, o que significa que os dados são permanentes.

Conclusão

Vou facilitar e fornecer pontos-chave para os dois tipos de tabelas. Você decide qual tipo atenderá às suas necessidades.

Tabela interna

Tabela Externa

Também chamada de "tabela gerenciada"Também chamada "tabela não gerenciada"
Não há necessidade de fornecer local, o diretório padrão do Hive gerencia esses dadosPrecisa fornecer a localização
Exclui os metadados da tabela e (os dados são temporários)O Hive deixará os dados intocados (os dados são permanentes)
A própria colméia controla a segurança da tabelaPrecisa gerenciar a segurança no nível da pasta

Artigos recomendados

Este é um guia para Hive Drop Table. Aqui discutimos a introdução da tabela de descarte do Hive, tipos de tabela de descarte no Hive ao longo da sintaxe. Você também pode consultar nossos outros artigos sugeridos para saber mais -

  1. O que é uma colméia?
  2. Arquitetura do Hive
  3. Comandos do Hive
  4. O que é o banco de dados Oracle
  5. Hive Order By
  6. Instalação do Hive

Categoria: