Défilez dans l’index des paquets Python et vous trouverez des bibliothèques pour pratiquement tous les besoins de visualisation de données – de GazeParser pour la recherche sur les mouvements oculaires à pastalog pour les visualisations en temps réel de l’entraînement des réseaux neuronaux. Et si beaucoup de ces bibliothèques sont intensément concentrées sur l’accomplissement d’une tâche spécifique, certaines peuvent être utilisées quel que soit votre domaine.
Cette liste est un aperçu de 10 bibliothèques de visualisation de données Python interdisciplinaires, des plus connues aux plus obscures. Mode Python Notebooks supporte trois bibliothèques de cette liste – matplotlib, Seaborn et Plotly – et plus de 60 autres que vous pouvez explorer sur notre page de support Notebook.
Nous espérons que ces listes vous inspirent, et si vous voulez ajouter une bibliothèque qui n’est pas listée, utilisez nos instructions pour installer des bibliothèques supplémentaires ou envoyez une note au succès modeanalytics .
- Matplotlib
- Seaborn
- ggplot
- Bokeh
- pygal
- Plotly
- geoplotlib
- Gleam
- missingno
- Leather
.
matplotlib
Deux histogrammes (matplotlib)
matplotlib est le O.G. des bibliothèques de visualisation de données Python. Bien qu’elle ait plus de dix ans, c’est toujours la bibliothèque la plus utilisée pour le traçage dans la communauté Python. Elle a été conçue pour ressembler étroitement à MATLAB, un langage de programmation propriétaire développé dans les années 1980.
Parce que matplotlib a été la première bibliothèque de visualisation de données Python, de nombreuses autres bibliothèques sont construites au-dessus d’elle ou conçues pour fonctionner en tandem avec elle pendant l’analyse. Certaines bibliothèques comme pandas et Seaborn sont des « enveloppes » de matplotlib. Elles vous permettent d’accéder à un certain nombre de méthodes de matplotlib avec moins de code.
Alors que matplotlib est bon pour avoir un sens des données, il n’est pas très utile pour créer rapidement et facilement des graphiques de qualité publication. Comme Chris Moffitt le souligne dans son aperçu des outils de visualisation Python, matplotlib « est extrêmement puissant, mais avec cette puissance vient la complexité. »
matplotlib a longtemps été critiqué pour ses styles par défaut, qui ont une sensation distincte des années 1990. La prochaine version de matplotlib 2.0 promet de nombreux changements de style pour résoudre ce problème.
Créé par : John D. Hunter, disponible en Mode
Où en savoir plus : matplotlib.org
Essayez matplotlib en Mode.
Seaborn
Violinplot (Michael Waskom)
Seaborn exploite la puissance de matplotlib pour créer de magnifiques graphiques en quelques lignes de code. La principale différence réside dans les styles et les palettes de couleurs par défaut de Seaborn, qui sont conçus pour être plus esthétiques et modernes. Puisque Seaborn est construit au-dessus de matplotlib, vous devrez connaître matplotlib pour modifier les valeurs par défaut de Seaborn.
Créé par : Michael Waskom, disponible en mode
Où en savoir plus : http://web.stanford.edu/~mwaskom/software/seaborn/index.html
Essayer Seaborn dans Mode.
ggplot
Petits multiples (ŷhat)
ggplot est basé sur ggplot2, un système de traçage R, et des concepts de The Grammar of Graphics. ggplot fonctionne différemment de matplotlib : il vous permet de superposer des composants pour créer un tracé complet. Par exemple, vous pouvez commencer par des axes, puis ajouter des points, puis une ligne, une ligne de tendance, etc. Bien que The Grammar of Graphics ait été loué comme une méthode « intuitive » pour le traçage, les utilisateurs chevronnés de matplotlib pourraient avoir besoin de temps pour s’adapter à ce nouvel état d’esprit.
Selon le créateur, ggplot n’est pas conçu pour créer des graphiques hautement personnalisés. Il sacrifie la complexité pour une méthode plus simple de traçage.
ggplot est étroitement intégré avec pandas, il est donc préférable de stocker vos données dans un DataFrame lorsque vous utilisez ggplot.
Créé par : ŷhat
Où en savoir plus : http://ggplot.yhathq.com/
Bokeh
Statistiques météorologiques interactives pour trois villes (Continuum Analytics)
Comme ggplot, Bokeh est basé sur The Grammar of Graphics, mais contrairement à ggplot, il est natif de Python, et non porté depuis R. Sa force réside dans la capacité à créer des tracés interactifs, prêts pour le web, qui peuvent être facilement sortis sous forme d’objets JSON, de documents HTML ou d’applications web interactives. Bokeh prend également en charge le streaming et les données en temps réel.
Bokeh fournit trois interfaces avec différents niveaux de contrôle pour s’adapter à différents types d’utilisateurs. Le niveau le plus élevé est destiné à la création rapide de graphiques. Il comprend des méthodes pour créer des graphiques courants tels que des diagrammes à barres, des diagrammes en boîte et des histogrammes. Le niveau intermédiaire a la même spécificité que matplotlib et vous permet de contrôler les éléments de base de chaque graphique (les points dans un nuage de points, par exemple). Le niveau le plus bas est destiné aux développeurs et aux ingénieurs logiciels. Il n’a pas de valeurs par défaut préétablies et vous oblige à définir chaque élément du graphique.
Créé par : Continuum Analytics
Où en savoir plus : http://bokeh.pydata.org/en/latest/
pygal
Box plot (Florian Mounier)
Comme Bokeh et Plotly, pygal propose des tracés interactifs qui peuvent être intégrés dans le navigateur web. Son principal différentiateur est la possibilité de sortir les graphiques sous forme de SVG. Tant que vous travaillez avec de petits ensembles de données, les SVG vous conviendront parfaitement. Mais si vous réalisez des graphiques avec des centaines de milliers de points de données, ils auront des difficultés de rendu et deviendront lents.
Comme chaque type de graphique est emballé dans une méthode et que les styles intégrés sont jolis, il est facile de créer un graphique de belle apparence en quelques lignes de code.
Créé par : Florian Mounier
Où en savoir plus : http://www.pygal.org/en/latest/index.html
Plotly
Line plot (Plotly)
Vous connaissez peut-être Plotly comme une plateforme en ligne pour la visualisation de données, mais saviez-vous également que vous pouvez accéder à ses capacités depuis un notebook Python ? Comme Bokeh, le point fort de Plotly est de faire des graphiques interactifs, mais il offre certains graphiques que vous ne trouverez pas dans la plupart des bibliothèques, comme les tracés de contour, les dendogrammes et les graphiques 3D.
Créé par : Plotly, disponible en Mode
Où en savoir plus : https://plot.ly/python/
Essayer Plotly en Mode.
geoplotlib
Choroplèthe (Andrea Cuttone)
geoplotlib est une boîte à outils pour créer des cartes et tracer des données géographiques. Vous pouvez l’utiliser pour créer une variété de types de cartes, comme les choroplèthes, les heatmaps et les cartes de densité de points. Vous devez avoir installé Pyglet (une interface de programmation orientée objet) pour utiliser geoplotlib. Néanmoins, comme la plupart des bibliothèques de visualisation de données Python ne proposent pas de cartes, il est agréable d’avoir une bibliothèque qui leur est uniquement dédiée.
Créé par : Andrea Cuttone
Où en savoir plus : https://github.com/andrea-cuttone/geoplotlib
Gleam
Graphe de dispersion avec ligne de tendance (David Robinson)
Gleam est inspiré du paquet Shiny de R. Il vous permet de transformer des analyses en applications web interactives en utilisant uniquement des scripts Python, vous n’avez donc pas besoin de connaître d’autres langages comme HTML, CSS ou JavaScript. Gleam fonctionne avec n’importe quelle bibliothèque de visualisation de données Python. Une fois que vous avez créé un graphe, vous pouvez construire des champs par-dessus pour que les utilisateurs puissent filtrer et trier les données.
Créé par : David Robinson
Où en savoir plus : https://github.com/dgrtwo/gleam
missingno
Matrice de nullité (Aleksey Bilogur)
Gérer les données manquantes est une douleur. missingno vous permet de jauger rapidement l’exhaustivité d’un ensemble de données avec un résumé visuel, au lieu de se frayer un chemin dans un tableau. Vous pouvez filtrer et trier les données en fonction de leur complétude ou repérer les corrélations avec une carte thermique ou un dendrogramme.
Créé par : Aleksey Bilogur
Où en savoir plus : https://github.com/ResidentMario/missingno
Leather
Grille de graphiques avec des échelles cohérentes (Christopher Groskopf)
Le créateur de Leather, Christopher Groskopf, le dit bien : « Leather est la bibliothèque de graphiques Python pour ceux qui ont besoin de graphiques maintenant et ne se soucient pas de savoir s’ils sont parfaits. » Elle est conçue pour fonctionner avec tous les types de données et produit des graphiques au format SVG, de sorte que vous pouvez les mettre à l’échelle sans perdre la qualité de l’image. Cette bibliothèque étant relativement récente, une partie de la documentation est encore en cours d’élaboration. Les graphiques que vous pouvez faire sont assez basiques – mais c’est l’intention.
Créé par : Christopher Groskopf
Où en savoir plus : https://leather.readthedocs.io/en/latest/index.html
Autres bonnes lectures sur la visualisation de données Python
Il existe une tonne d’excellentes évaluations et d’aperçus des bibliothèques de visualisation de données Python. Jetez un coup d’œil à certains de nos favoris :
- Un graphique, douze bibliothèques de graphiques (Lisa Charlotte Rost)
- Vue d’ensemble des outils de visualisation Python (Practical Business Python)
- Visualisation de données Python : Comparaison de 7 outils (Dataquest.io)
Articles recommandés
.