Cursar o Índice do Pacote Python e você encontrará bibliotecas para praticamente todas as necessidades de visualização de dados – desde GazeParser para pesquisa de movimento dos olhos até o pastalog para visualizações em tempo real do treinamento da rede neural. E enquanto muitas dessas bibliotecas estão intensamente focadas em realizar uma tarefa específica, algumas podem ser usadas não importa o seu campo.
Esta lista é uma visão geral de 10 bibliotecas interdisciplinares de visualização de dados Python, desde as mais conhecidas até as mais obscuras. A Mode Python Notebooks suporta três bibliotecas nesta lista – matplotlib, Seaborn, e Plotly – e mais de 60 outras que você pode explorar na nossa página de suporte a Notebooks.
Esperamos que estas listas o inspirem, e se quiser adicionar uma biblioteca que não esteja listada, use as nossas instruções para instalar bibliotecas adicionais ou envie uma nota para a modeanalytics de sucesso .
- Matplotlib
- Seaborn
- ggplotlib
- Bokeh
- pygal
- Plotly
- geoplotlib
- Gleam
- missingno
- Couro
matplotlib
Dois histogramas (matplotlib)
matplotlib é o O.G. das bibliotecas de visualização de dados Python. Apesar de ter mais de uma década, ainda é a biblioteca mais amplamente utilizada para plotagem na comunidade Python. Foi concebida para se assemelhar muito ao MATLAB, uma linguagem de programação proprietária desenvolvida na década de 1980.
Porque matplotlib foi a primeira biblioteca de visualização de dados Python, muitas outras bibliotecas são construídas em cima dela ou projetadas para trabalhar em conjunto com ela durante a análise. Algumas bibliotecas como pandas e Seaborn são “wrappers” sobre o matplotlib. Elas permitem o acesso a uma série de métodos matplotlib com menos código.
Embora o matplotlib seja bom para obter uma noção dos dados, não é muito útil para criar gráficos de qualidade de publicação de forma rápida e fácil. Como Chris Moffitt aponta em sua visão geral das ferramentas de visualização Python, matplotlib “é extremamente poderoso, mas com esse poder vem a complexidade”
matplotlib tem sido criticado há muito tempo por seus estilos padrão, que têm uma sensação distinta dos anos 90. O próximo lançamento do matplotlib 2.0 promete muitas mudanças de estilo para resolver este problema.
Criado por: John D. Hunter, disponível em Mode
Onde aprender mais: matplotlib.org
Try matplotlib in Mode.
Seaborn
Violinplot (Michael Waskom)
Seaborn aproveita o poder do matplotlib para criar belos gráficos em algumas linhas de código. A diferença chave é o estilo padrão e as paletas de cores da Seaborn, que são projetadas para serem esteticamente mais agradáveis e modernas. Como o Seaborn é construído em cima do matplotlib, você precisará conhecer o matplotlib para ajustar os padrões do Seaborn.
Criado por: Michael Waskom, disponível em Mode
Onde aprender mais: http://web.stanford.edu/~mwaskom/software/seaborn/index.html
Try Seaborn no Modo.
ggplot
Small multiples (ŷhat)
ggplot é baseado no ggplot2, um sistema de plotagem R, e conceitos da Gramática Gráfica. ggplot funciona de forma diferente do matplotlib: ele permite que você crie componentes para criar um plot completo. Por exemplo, você pode começar com eixos, depois adicionar pontos, depois uma linha, uma linha de tendência, etc. Embora a Gramática dos Gráficos tenha sido elogiada como um método “intuitivo” para plotagem, usuários experientes do matplotlib podem precisar de tempo para se ajustar a esta nova mentalidade.
De acordo com o criador, o ggplot não foi projetado para criar gráficos altamente personalizados. Ele sacrifica a complexidade por um método mais simples de plotting.
ggplot é fortemente integrado com pandas, então é melhor armazenar seus dados em um DataFrame quando usar o ggplot.
Criado por: ŷhat
Onde aprender mais: http://ggplot.yhathq.com/
Bokeh
Estatísticas meteorológicas interativas para três cidades (Continuum Analytics)
Como o ggplot, Bokeh é baseado na Gramática Gráfica, mas ao contrário do ggplot, ele é nativo de Python, não portado de R. Sua força está na capacidade de criar gráficos interativos, prontos para a web, que podem ser facilmente produzidos como objetos JSON, documentos HTML, ou aplicações web interativas. Bokeh também suporta streaming e dados em tempo real.
Bokeh fornece três interfaces com diferentes níveis de controle para acomodar diferentes tipos de usuários. O nível mais alto é para criar gráficos rapidamente. Ele inclui métodos para criar gráficos comuns como gráficos de barra, gráficos de caixa e histogramas. O nível médio tem a mesma especificidade do matplotlib e permite controlar os blocos básicos de construção de cada gráfico (os pontos em um gráfico de dispersão, por exemplo). O nível mais baixo é voltado para desenvolvedores e engenheiros de software. Não tem predefinições predefinidas e requer que você defina cada elemento do gráfico.
Criado por: Continuum Analytics
Onde aprender mais: http://bokeh.pydata.org/en/latest/
pygal
Box plot (Florian Mounier)
Like Bokeh and Plotly, pygal oferece gráficos interativos que podem ser embutidos no web browser. O seu principal diferencial é a capacidade de produzir gráficos como SVGs. Desde que você esteja trabalhando com conjuntos de dados menores, os SVGs lhe farão muito bem. Mas se você estiver fazendo gráficos com centenas de milhares de pontos de dados, eles terão problemas de renderização e se tornarão lentos.
Desde que cada tipo de gráfico é empacotado em um método e os estilos embutidos são bonitos, é fácil criar um gráfico bonito em algumas linhas de código.
Criado por: Florian Mounier
Onde aprender mais: http://www.pygal.org/en/latest/index.html
Plotly
Line plot (Plotly)
Você pode conhecer o Plotly como uma plataforma online para visualização de dados, mas você também sabia que pode acessar suas capacidades a partir de um notebook Python? Como Bokeh, o forte de Plotly é fazer gráficos interativos, mas ele oferece alguns gráficos que você não encontrará na maioria das bibliotecas, como gráficos de contorno, dendogramas e gráficos 3D.
Criado por: Plotly, disponível em Mode
Onde aprender mais: https://plot.ly/python/
Try Plotly in Mode.
geoplotlib
Choropleth (Andrea Cuttone)
geoplotlib é uma caixa de ferramentas para a criação de mapas e plotagem de dados geográficos. Você pode usá-la para criar uma variedade de tipos de mapas, como coropletos, heatmaps e mapas de densidade de pontos. Você deve ter o Pyglet (uma interface de programação orientada a objetos) instalado para usar o geoplotlib. No entanto, como a maioria das bibliotecas de visualização de dados Python não oferecem mapas, é bom ter uma biblioteca dedicada exclusivamente a eles.
Criado por: Andrea Cuttone
Onde aprender mais: https://github.com/andrea-cuttone/geoplotlib
Gleam
Plotagem de dispersão com linha de tendência (David Robinson)
Gleam é inspirado no pacote R’s Shiny. Ele permite que você transforme análises em aplicativos web interativos usando apenas scripts Python, assim você não precisa conhecer nenhuma outra linguagem como HTML, CSS, ou JavaScript. Gleam funciona com qualquer biblioteca de visualização de dados Python. Depois de criar um gráfico, você pode construir campos em cima dele para que os usuários possam filtrar e classificar os dados.
Criado por: David Robinson
Onde aprender mais: https://github.com/dgrtwo/gleam
missingno
Matriz de nulidade (Aleksey Bilogur)
O tratamento de dados em falta é uma dor. missingno permite que você rapidamente avalie a integridade de um conjunto de dados com um resumo visual, em vez de percorrer uma tabela. Você pode filtrar e classificar os dados com base na conclusão ou correlações pontuais com um heatmap ou um dendrogram.
Criado por: Aleksey Bilogur
Onde aprender mais: https://github.com/ResidentMario/missingno
Couro
Rede com escalas consistentes (Christopher Groskopf)
O criador do couro, Christopher Groskopf, coloca-o melhor: “Leather é a biblioteca de gráficos Python para aqueles que precisam de gráficos agora e não se importam se são perfeitos.” Foi concebida para trabalhar com todos os tipos de dados e produz gráficos como SVGs, para que você possa escalá-los sem perder a qualidade da imagem. Como esta biblioteca é relativamente nova, parte da documentação ainda está em andamento. Os gráficos que você pode fazer são bastante básicos – mas essa é a intenção.
Criado por: Christopher Groskopf
Onde aprender mais: https://leather.readthedocs.io/en/latest/index.html
Outras grandes leituras sobre visualização de dados Python
Há uma tonelada de grandes avaliações e visões gerais das bibliotecas de visualização de dados Python por aí. Veja alguns de nossos favoritos:
- One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
- Visão geral das ferramentas de visualização Python (Practical Business Python)
- Visualização de dados Python: Comparação de 7 ferramentas (Dataquest.io)