Scrollen Sie durch den Python Package Index und Sie werden Bibliotheken für praktisch jeden Bedarf an Datenvisualisierung finden – von GazeParser für die Augenbewegungsforschung bis hin zu pastalog für die Echtzeitvisualisierung des Trainings neuronaler Netzwerke. Viele dieser Bibliotheken sind zwar auf eine bestimmte Aufgabe ausgerichtet, einige können jedoch unabhängig von Ihrem Fachgebiet verwendet werden.
Diese Liste gibt einen Überblick über 10 interdisziplinäre Python-Bibliotheken zur Datenvisualisierung, von den bekannten bis zu den unbekannten. Mode Python Notebooks unterstützt drei Bibliotheken auf dieser Liste – matplotlib, Seaborn und Plotly – und mehr als 60 weitere, die Sie auf unserer Notebook-Support-Seite entdecken können.
Wir hoffen, dass diese Listen Sie inspirieren, und wenn Sie eine Bibliothek hinzufügen möchten, die nicht aufgelistet ist, verwenden Sie unsere Anweisungen, um zusätzliche Bibliotheken zu installieren, oder senden Sie eine Nachricht an den Erfolg modeanalytics .
- Matplotlib
- Seaborn
- ggplot
- Bokeh
- pygal
- Plotly
- geoplotlib
- Gleam
- missingno
- Leather
matplotlib
Zwei Histogramme (matplotlib)
matplotlib ist das O.G. der Python-Datenvisualisierungsbibliotheken. Obwohl sie schon über ein Jahrzehnt alt ist, ist sie immer noch die am häufigsten verwendete Bibliothek für Plots in der Python-Community. Sie wurde entwickelt, um MATLAB, einer in den 1980er Jahren entwickelten proprietären Programmiersprache, sehr ähnlich zu sein.
Da matplotlib die erste Python-Bibliothek zur Datenvisualisierung war, bauen viele andere Bibliotheken auf ihr auf oder wurden entwickelt, um bei der Analyse mit ihr zusammenzuarbeiten. Einige Bibliotheken wie pandas und Seaborn sind „Wrapper“ über matplotlib. Sie ermöglichen den Zugriff auf eine Reihe von matplotlibs Methoden mit weniger Code.
Während matplotlib gut ist, um einen Eindruck von den Daten zu bekommen, ist es nicht sehr nützlich, um schnell und einfach Diagramme in Publikationsqualität zu erstellen. Wie Chris Moffitt in seinem Überblick über Python-Visualisierungstools feststellt, ist matplotlib „extrem leistungsfähig, aber mit dieser Leistungsfähigkeit geht auch Komplexität einher.“
matplotlib wird seit langem für seine Standardstile kritisiert, die einen deutlichen 1990er-Jahre-Stil aufweisen. Die bevorstehende Veröffentlichung von matplotlib 2.0 verspricht viele neue Stiländerungen, um dieses Problem anzugehen.
Erstellt von: John D. Hunter, verfügbar in Mode
Wo erfahren Sie mehr: matplotlib.org
Try matplotlib in Mode.
Seaborn
Violinplot (Michael Waskom)
Seaborn macht sich die Leistungsfähigkeit von matplotlib zunutze, um mit wenigen Zeilen Code schöne Diagramme zu erstellen. Der Hauptunterschied liegt in den Standardstilen und Farbpaletten von Seaborn, die ästhetisch ansprechender und moderner gestaltet sind. Da Seaborn auf matplotlib aufbaut, müssen Sie matplotlib kennen, um die Standardeinstellungen von Seaborn zu verändern.
Created by: Michael Waskom, verfügbar in Mode
Wo man mehr erfahren kann: http://web.stanford.edu/~mwaskom/software/seaborn/index.html
Try Seaborn in Mode.
ggplot
Kleine Multiplikatoren (ŷhat)
ggplot basiert auf ggplot2, einem R-Plotingsystem, und Konzepten aus The Grammar of Graphics. ggplot arbeitet anders als matplotlib: Es erlaubt Ihnen, Komponenten zu schichten, um ein komplettes Diagramm zu erstellen. Sie können zum Beispiel mit Achsen beginnen, dann Punkte hinzufügen, dann eine Linie, eine Trendlinie usw. Obwohl The Grammar of Graphics als „intuitive“ Methode zum Plotten gelobt wurde, brauchen erfahrene matplotlib-Benutzer vielleicht etwas Zeit, um sich an diese neue Denkweise zu gewöhnen.
Nach Angaben des Erstellers ist ggplot nicht für die Erstellung hochgradig individueller Grafiken gedacht. Es opfert die Komplexität für eine einfachere Methode des Plottens.
ggplot ist eng mit Pandas integriert, so dass es am besten ist, Ihre Daten in einem DataFrame zu speichern, wenn Sie ggplot verwenden.
Created by: ŷhat
Wo man mehr erfahren kann: http://ggplot.yhathq.com/
Bokeh
Interaktive Wetterstatistiken für drei Städte (Continuum Analytics)
Wie ggplot basiert Bokeh auf The Grammar of Graphics, aber im Gegensatz zu ggplot ist es nativ in Python und nicht aus R portiert. Seine Stärke liegt in der Fähigkeit, interaktive, webfähige Plots zu erstellen, die einfach als JSON-Objekte, HTML-Dokumente oder interaktive Webanwendungen ausgegeben werden können. Bokeh unterstützt auch Streaming- und Echtzeitdaten.
Bokeh bietet drei Schnittstellen mit unterschiedlichen Kontrollniveaus, um verschiedenen Benutzertypen gerecht zu werden. Die höchste Stufe ist für die schnelle Erstellung von Diagrammen gedacht. Sie umfasst Methoden zur Erstellung gängiger Diagramme wie Balkenplots, Boxplots und Histogramme. Die mittlere Ebene hat die gleiche Spezifität wie matplotlib und ermöglicht es Ihnen, die grundlegenden Bausteine jedes Diagramms zu steuern (z. B. die Punkte in einem Streudiagramm). Die unterste Ebene richtet sich an Entwickler und Softwareingenieure. Sie hat keine voreingestellten Vorgaben und erfordert, dass Sie jedes Element des Diagramms definieren.
Created by: Continuum Analytics
Wo man mehr erfahren kann: http://bokeh.pydata.org/en/latest/
pygal
Box-Plot (Florian Mounier)
Wie Bokeh und Plotly bietet pygal interaktive Plots, die in den Webbrowser eingebettet werden können. Sein Hauptunterscheidungsmerkmal ist die Möglichkeit, Diagramme als SVGs auszugeben. Solange Sie mit kleineren Datensätzen arbeiten, reichen SVGs völlig aus. Wenn Sie jedoch Diagramme mit Hunderttausenden von Datenpunkten erstellen, werden sie Probleme beim Rendern haben und träge werden.
Da jeder Diagrammtyp in eine Methode verpackt ist und die eingebauten Stile hübsch sind, ist es einfach, mit ein paar Zeilen Code ein hübsches Diagramm zu erstellen.
Erstellt von: Florian Mounier
Wo man mehr erfahren kann: http://www.pygal.org/en/latest/index.html
Plotly
Liniendiagramm (Plotly)
Sie kennen Plotly vielleicht als Online-Plattform für Datenvisualisierung, aber wussten Sie auch, dass Sie von einem Python-Notizbuch aus auf seine Funktionen zugreifen können? Wie Bokeh liegt die Stärke von Plotly in der Erstellung interaktiver Diagramme, aber es bietet einige Diagramme, die Sie in den meisten Bibliotheken nicht finden, wie Konturdiagramme, Dendogramme und 3D-Diagramme.
Erstellt von: Plotly, verfügbar in Mode
Wo man mehr erfahren kann: https://plot.ly/python/
Try Plotly in Mode.
geoplotlib
Choropleth (Andrea Cuttone)
geoplotlib ist ein Werkzeugkasten zum Erstellen von Karten und zum Plotten von geografischen Daten. Sie können damit eine Vielzahl von Kartentypen erstellen, wie Choroplethen, Heatmaps und Punktdichtekarten. Sie müssen Pyglet (eine objektorientierte Programmierschnittstelle) installiert haben, um geoplotlib verwenden zu können. Da die meisten Python-Bibliotheken zur Datenvisualisierung keine Karten anbieten, ist es dennoch schön, eine Bibliothek zu haben, die sich ausschließlich diesen widmet.
Erstellt von: Andrea Cuttone
Wo man mehr erfahren kann: https://github.com/andrea-cuttone/geoplotlib
Gleam
Streudiagramm mit Trendlinie (David Robinson)
Gleam ist inspiriert vom Shiny-Paket von R. Es ermöglicht Ihnen, Analysen in interaktive Webanwendungen zu verwandeln, indem Sie nur Python-Skripte verwenden, so dass Sie keine anderen Sprachen wie HTML, CSS oder JavaScript beherrschen müssen. Gleam funktioniert mit jeder Python-Datenvisualisierungsbibliothek. Sobald Sie ein Diagramm erstellt haben, können Sie Felder darauf aufbauen, damit die Benutzer Daten filtern und sortieren können.
Erstellt von: David Robinson
Wo man mehr erfahren kann: https://github.com/dgrtwo/gleam
missingno
Nullstellenmatrix (Aleksey Bilogur)
Der Umgang mit fehlenden Daten ist mühsam. missingno ermöglicht es Ihnen, die Vollständigkeit eines Datensatzes schnell mit einer visuellen Zusammenfassung zu beurteilen, anstatt sich durch eine Tabelle zu quälen. Sie können Daten nach Vollständigkeit filtern und sortieren oder Korrelationen mit einer Heatmap oder einem Dendrogramm aufdecken.
Erstellt von: Aleksey Bilogur
Wo man mehr erfahren kann: https://github.com/ResidentMario/missingno
Leather
Diagrammgitter mit konsistenten Skalen (Christopher Groskopf)
Der Schöpfer von Leather, Christopher Groskopf, drückt es am besten aus: „Leather ist die Python-Diagrammbibliothek für alle, die sofort Diagramme brauchen und denen es egal ist, ob sie perfekt sind.“ Sie kann mit allen Datentypen arbeiten und erzeugt Diagramme als SVGs, so dass man sie ohne Qualitätsverlust skalieren kann. Da diese Bibliothek relativ neu ist, befindet sich ein Teil der Dokumentation noch in Arbeit. Die Diagramme, die man erstellen kann, sind ziemlich einfach, aber das ist die Absicht.
Created by: Christopher Groskopf
Wo man mehr erfahren kann: https://leather.readthedocs.io/en/latest/index.html
Weitere gute Lektüre zur Datenvisualisierung mit Python
Es gibt eine Menge großartiger Bewertungen und Übersichten über Python-Bibliotheken zur Datenvisualisierung da draußen. Sehen Sie sich einige unserer Favoriten an:
- One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
- Overview of Python Visualization Tools (Practical Business Python)
- Python data visualization: 7 Tools im Vergleich (Dataquest.io)