O que é visualização de dados?

E por que não nos importamos mais com gráficos de pizza,

A visualização de dados não é apenas uma simples tradução de pontos de dados em gráficos de barras e gráficos de linhas. É como um mergulho em um oceano que esconde tesouros em cada nível. Desde o início, temos a delimitação direta de dados em figuras de livros didáticos viz. gráficos de dispersão, gráficos de linhas, gráficos de pizza e gráficos de barras. Os gráficos de linhas geralmente são usados ​​para representar uma tendência de dados ao longo do tempo. Neste tópico do que é visualização de dados, limpamos todo o conceito adiante com o gráfico e os gráficos de pizza fornecidos.

Gráfico de setores

Um dos gráficos mais onipresentes em uso é o gráfico de pizza ou o gráfico de pizza.

Proporção de gases em uma mistura.

Fonte : plotly

Comumente usado durante as eleições para mostrar qual partido tem os leões para compartilhar votos, este gráfico, embora extremamente popular, tem algumas desvantagens. Estatísticos como Edward Tufte, Leland Wilkinson e Gerald van Belle expressaram sua falta de interesse em relação ao uso de gráficos de pizza. A evidência mais conclusiva contra gráficos de pizza provavelmente foi fornecida por Stephen Few, o fundador da Perceptual Edge. Em seu artigo, “Salve a Torta para a Sobremesa”, publicado no Visual Business Intelligence Newsletter, Stephen explica por que, para surpresa de seus colegas e alunos, ele sente que os gráficos de pizza são um meio ineficaz de visualizar dados.

Dê uma olhada no gráfico de pizza abaixo.

Neste gráfico, representando a proporção de itens encomendados após as 21h, é fácil estimar a porcentagem de sorvete - 25%. No entanto, após pequenas modificações, não é mais possível determinar facilmente a porcentagem de pedidos de sorvetes.

Embora a porcentagem de sorvetes ainda seja a mesma em 25%. É difícil entender do diagrama acima. No diagrama anterior, era fácil adivinhar a porcentagem, porque a sombra do sorvete começava na posição das 6 horas e se estendia até a posição das 9 horas. Como nossos olhos são treinados para ver os relógios de 12, 3, 6 e 9 - um gráfico de pizza também é mais fácil de interpretar se suas regiões aderem às quatro posições do relógio. Um ávido defensor do gráfico de pizza se apresentaria e sugeriria que esse problema poderia ser facilmente evitado usando rótulos e marcando a porcentagem em cada região.

Gráfico de pizza com rótulos de dados

Mas, novamente, para mapear o valor com o item, nossos olhos precisam mudar o foco da legenda na parte inferior do gráfico para os rótulos no gráfico. A solução para isso seria anexar também o nome do item, juntamente com os valores - para obter algo semelhante a este:

Perfeito, você diria. Mas então eu pergunto: agora que anexamos os nomes dos itens e os valores, como o gráfico de pizza acima é diferente da tabela abaixo:

Tabela limpa com os dados classificados em Porcentagem de pedido

Essas informações não parecem muito melhores do que os rótulos e legendas espalhadas pelo gráfico de pizza. Para que serve um gráfico de pizza então? As visualizações devem agregar valor, são agentes de conclusões, devem fazer com que os dados exponham seus segredos. Mas, neste caso, o gráfico de pizza não cumpre sua promessa.

Entrar no gráfico de barras de visualização de dados

A alternativa mais enxuta e muito mais elegante ao gráfico de pizza é o gráfico de barras, capaz de expressar tudo o que a pizza diz e muito mais, sem fazer uma bagunça de rótulos e lendas.

Gráfico de barras representando o mesmo - fácil de comparar, contrastar e concluir

Esta é a mesma informação agora apresentada gentilmente ao observador. Além de mostrar os valores individuais, este gráfico nos permite comparar rapidamente a popularidade de cada item alimentar e até comparar a diferença relativa de valor entre itens consecutivos. Os mesmos dados estariam disponíveis na tabela, mas nossos cérebros são melhores no processamento de imagens do que decifrando o texto. É por isso que o uso do gráfico de pizza diminuiu com o tempo. Embora seja um visual favorito na indústria da mídia, isso foi substituído por representações melhores e mais sofisticadas. Além de gráficos de linhas, tortas e gráficos de barras, há uma infinidade de outros gráficos que são úteis. Um gráfico interessante, mas não tão popular para os não iniciados, é o Diagrama de Sankey. Este diagrama é usado para expressar a distribuição e o fluxo da matéria. O assunto em questão pode ser energia, dinheiro ou até água.

Sankey Diagrama do fluxo e distribuição de energia de um funcionário de TI típico.

Acima está um diagrama fictício da Sankey que expressa como e onde a maior parte da energia de um funcionário de TI é distribuída.

Ferramentas mais recentes

Com o advento das mídias sociais e as diferentes plataformas nas quais as pessoas podem escrever seus sentimentos, avaliações e opiniões, uma ferramenta de visualização de dados que se tornou bastante comum é a nuvem de palavras. As nuvens de palavras nos ajudam a descobrir do que as pessoas estão falando.

Uma representação em nuvem de palavras ao vivo muito real dos comentários dos usuários do PUBG na google play store

Se olharmos para a nuvem de palavras aqui, criada com base nas 80 principais análises do jogo PUBG na loja do Google Play, veremos que a resposta geral ao jogo é "boa", algumas pessoas até a chamam de "melhor" . No entanto, parece que há um problema com algumas "atualizações" que as pessoas estão pedindo aos criadores do jogo para corrigir. De fato, quando verificamos as resenhas da play store naquele dia, vemos a mesma coisa refletida.

O problema com as atualizações. Além disso, veja se você pode encontrar uma ocorrência da palavra "por favor" aqui

O futuro

Isso está apenas arranhando a ponta do iceberg. Bibliotecas como plotly e D3 levaram a visualização de dados para um nível diferente. Isso aconteceu por causa da demanda também mudaram. Como você visualizaria uma cidade inteligente em um painel? Uma tela gigante na qual os sinais vitais de uma cidade inteira podem ser exibidos. O tráfego, o uso de energia, as condições de saúde de diferentes áreas, a qualidade do ar e vários outros parâmetros precisam ser exibidos em uma única página. Esse requisito implora uma abordagem diferente para a visualização de dados. Portanto, aprendemos que o que é visualização de dados com a ajuda desse conceito. Não podemos mais ficar com tabelas e gráficos. É necessária uma nova abordagem onde os gráficos encontrem arte e imaginação, criando uma experiência visual enriquecedora. Essa discussão implora por um artigo completamente diferente. Até a próxima.

Artigos recomendados

Este artigo é um guia útil sobre o que é uma visualização de dados. Aqui discutimos os conceitos básicos com tabelas e gráficos para que você possa entender facilmente a visualização de dados. Você também pode consultar o seguinte artigo para saber mais -

  1. Carreira no Oracle Database Administrator
  2. 7 Diferença mais útil entre mineração de dados e mineração da Web
  3. Perguntas da entrevista do Data Analytics
  4. Exemplos de análise de big data

Categoria: