10 perguntas essenciais da entrevista do Data Analytics (Atualizado para 2019)

Índice:

Anonim

Introdução às perguntas e respostas da entrevista do Data Analytics

Então, você finalmente encontrou o emprego dos seus sonhos no Data Analytics, mas está se perguntando como quebrar a entrevista do Data Analytics 2019 e quais poderiam ser as prováveis ​​perguntas da entrevista do Data Analytics. Cada entrevista do Data Analytics é diferente e o escopo de um trabalho também é diferente. Tendo isso em mente, criamos as perguntas e respostas mais comuns da entrevista do Data Analytics para ajudá-lo a obter sucesso em sua entrevista do Data Analytics.

Abaixo, estão as principais perguntas da entrevista de análise de dados de 2019, mais frequentes em uma entrevista

1. Qual é a diferença entre Data Mining e Data Analysis?

Responda:

Mineração de dadosAnálise de dados
Não é necessária uma hipótese para a mineração de dadosA análise dos dados começa com uma hipótese.
A Mineração de Dados exige dados limpos e bem documentados.A análise de dados envolve limpeza de dados.
Os resultados da mineração de dados nem sempre são fáceis de interpretar.Os analistas de dados interpretam os resultados e os apresentam às partes interessadas.
Os algoritmos de mineração de dados desenvolvem equações automaticamente.Os analistas de dados precisam desenvolver suas próprias equações.

2. Mencione quais são as várias etapas de um projeto de análise?

Responda:
A análise de dados lida com a coleta, limpeza, transformação e modelagem de dados para obter informações valiosas e oferecer suporte a melhores tomadas de decisão em uma organização. As etapas envolvidas no processo de análise de dados são as seguintes -

Exploração de dados - Depois de explorar o problema de negócios, um analista de dados precisa analisar a causa raiz do problema.
Preparação de dados - Nesta etapa do processo de análise de dados, encontramos anomalias de dados como valores ausentes nos dados.
Modelagem de dados - A etapa de modelagem começa após a preparação dos dados. A modelagem é um processo iterativo em que o modelo é executado repetidamente para melhorias. A modelagem de dados garante o melhor resultado possível para um problema de negócios.
Validação - Nesta etapa, o modelo fornecido pelo cliente e o modelo desenvolvido pelo analista de dados são validados entre si para descobrir se o modelo desenvolvido atenderá aos requisitos de negócios.
Implementação do Modelo e Rastreamento - Nesta etapa final da implementação do modelo de análise de dados está sendo realizada e após esse rastreamento, para garantir que o modelo seja implementado corretamente ou não?

3.Qual é a responsabilidade de um analista de dados?

Responda:
• Resolva problemas associados aos negócios dos clientes e execute operações de auditoria de dados.
• Interpretar dados usando técnicas estatísticas.
• Identifique áreas para oportunidades de melhoria.
• Analisar, identificar e interpretar tendências ou padrões em conjuntos de dados complexos.
• Adquira dados de fontes de dados primárias ou secundárias.
• Manter bancos de dados / sistemas de dados.
• Localize e corrija problemas de código usando indicadores de desempenho.
• Protegendo o banco de dados através do desenvolvimento do sistema de acesso.

4.O que são colisões de tabela de hash? Como é evitado?

Responda:
Uma colisão de tabela de hash acontece quando duas chaves diferentes se misturam ao mesmo valor. Existem muitas técnicas para evitar a colisão de tabelas de hash, aqui listamos duas:
Encadeamento separado: ele usa a estrutura de dados que faz o hash no mesmo slot para armazenar vários itens.
Endereçamento aberto: procura outros slots usando uma segunda função e armazena itens no primeiro slot vazio.

5. Lista de algumas das melhores ferramentas que podem ser úteis para análise de dados?

Responda:
•Quadro
• RapidMiner
• OpenRefine
• KNIME
• Operadores de pesquisa do Google
• Solver
• NodeXL
• io
• Wolfram Alpha
Tabelas do Google Fusion

6. Qual é a diferença entre mineração de dados e criação de perfil de dados?

Responda:
A diferença entre mineração de dados e criação de perfil de dados é a seguinte -
• Criação de perfil de dados: tem como objetivo a análise instantânea de atributos individuais, como variação de preço, preço distinto e frequência, incidência de valores nulos, tipo de dados, duração etc.
• Mineração de dados: concentra-se em dependências, descoberta de sequência, retenção de relação entre vários atributos, análise de cluster, detecção de registros incomuns etc.

7. Explique o algoritmo K-mean e o algoritmo de cluster hierárquico?

Responda:
Algoritmo K-Mean - K mean é um método de particionamento famoso. No algoritmo K-mean, os clusters são esféricos, ou seja, os pontos de dados em um cluster estão centralizados nesse cluster. Além disso, a variação dos clusters é semelhante, ou seja, cada ponto de dados pertence ao cluster mais próximo
Algoritmo de cluster hierárquico - O algoritmo de cluster hierárquico combina e divide os grupos existentes e cria uma estrutura hierárquica para eles mostrarem a ordem em que os grupos estão divididos.

8.O que é limpeza de dados? Mencione algumas práticas recomendadas que você precisa seguir ao fazer a limpeza de dados?

Responda:
De um determinado conjunto de dados, é extremamente importante classificar as informações necessárias para a análise dos dados. A limpeza de dados é uma etapa crucial na qual os dados são inspecionados para encontrar anomalias, remover informações repetitivas e incorretas etc. A limpeza de dados não envolve a remoção de nenhuma informação existente do banco de dados, apenas melhora a qualidade dos dados para que possam ser usados ​​para análise .
Algumas das práticas recomendadas para limpeza de dados incluem:
• Desenvolvimento de um plano de qualidade de dados para identificar onde ocorrem os erros máximos de qualidade de dados, para que você possa avaliar a causa raiz e planejar de acordo com isso.
• Siga um método usual de comprovar as informações necessárias antes de inseri-las.
• Identifique quaisquer dados duplicados e valide a precisão dos dados, pois isso economizará muito tempo durante a análise.
• O rastreamento de todas as operações de aprimoramento realizadas nas informações é incrivelmente necessário para que você repita ou faça as operações necessárias.

9. Quais são alguns dos métodos estatísticos úteis para o analista de dados?

Responda:
Os métodos estatísticos úteis para o cientista de dados são:
• método bayesiano
• processo de Markov
• Processos espaciais e de cluster
• Estatísticas de classificação, percentil, detecção de outlier
• Técnicas de imputação, etc.
• algoritmo simplex
• otimização matemática

10. Explique o que é imputação? Listar diferentes tipos de técnicas de imputação? Qual método de imputação é mais favorável?

Responda:
Durante a imputação, temos a tendência de substituir as informações ausentes por valores substituídos. Os tipos de técnicas de imputação envolvem são -
• Imputação única: a imputação única indica que o valor ausente é substituído por um valor. Nesse método, o tamanho da amostra é recuperado.
• Imputação de hot-deck: um valor ausente é imputado de um registro semelhante selecionado aleatoriamente usando cartão perfurado
• Imputação de plataforma fria: Funciona da mesma forma que a imputação de plataforma quente, mas um pouco mais avançada e escolhe doadores de outros conjuntos de dados
• Imputação média: envolve a substituição do valor ausente pelos valores previstos de outras variáveis.
• Imputação de regressão: envolve a substituição do valor ausente pelos valores previstos de um determinado valor, dependendo de outras variáveis.
• Regressão estocástica: é o mesmo que imputação de regressão, no entanto, adiciona a variação de regressão comum à imputação de regressão
• Imputação múltipla: diferente da imputação única, várias imputações estimam os valores várias vezes

Embora a imputação única seja amplamente usada, ela não reflete a incerteza criada pela falta de dados aleatoriamente. Portanto, múltiplas imputações são mais favoráveis ​​que uma única imputação no caso de dados ausentes aleatoriamente.

Artigos recomendados

Este foi um guia abrangente para as perguntas e respostas da entrevista do Data Analytics, para que o candidato possa reprimir essas perguntas da entrevista do Data Analytics facilmente. Você também pode consultar os seguintes artigos para saber mais -

  1. 10 perguntas e respostas úteis sobre entrevistas ágeis
  2. 8 perguntas impressionantes da entrevista do algoritmo
  3. As 25 perguntas mais importantes sobre entrevistas em ciência da computação
  4. 10 perguntas e respostas surpreendentes da entrevista do engenheiro de dados