Mode Blog

Wandel door de Python Package Index en je vindt bibliotheken voor praktisch elke datavisualisatie-behoefte – van GazeParser voor oogbewegingsonderzoek tot pastalog voor realtime visualisaties van neurale netwerktraining. En terwijl veel van deze bibliotheken intens gericht zijn op het uitvoeren van een specifieke taak, kunnen sommige worden gebruikt ongeacht uw vakgebied.

Deze lijst is een overzicht van 10 interdisciplinaire Python-gegevensvisualisatiebibliotheken, van de bekende tot de obscure. Mode Python-notebooks ondersteunen drie bibliotheken op deze lijst – matplotlib, Seaborn, en Plotly – en meer dan 60 anderen die u kunt verkennen op onze Notebook-ondersteuningspagina.

We hopen dat deze lijsten u inspireren, en als u een bibliotheek wilt toevoegen die niet in de lijst staat, gebruik dan onze instructies om extra bibliotheken te installeren of stuur een notitie naar succes modeanalytics .

  • Matplotlib
  • Seaborn
  • ggplot
  • Bokeh
  • pygal
  • Plotly
  • geoplotlib
  • Gleam
  • missingno
  • Leather

matplotlib

Twee histogrammen (matplotlib)

matplotlib is de O.G. van de Python data visualisatie bibliotheken. Ondanks het feit dat het meer dan een decennium oud is, is het nog steeds de meest gebruikte bibliotheek voor plotten in de Python gemeenschap. Het is ontworpen om sterk te lijken op MATLAB, een propriëtaire programmeertaal ontwikkeld in de jaren 1980.

Omdat matplotlib de eerste Python datavisualisatiebibliotheek was, zijn veel andere bibliotheken erop gebouwd of ontworpen om ermee samen te werken tijdens analyse. Sommige bibliotheken zoals pandas en Seaborn zijn “wrappers” over matplotlib. Ze geven je toegang tot een aantal van matplotlib’s methoden met minder code.

Hoewel matplotlib goed is om een gevoel te krijgen van de data, is het niet erg bruikbaar om snel en gemakkelijk grafieken van publicatie-kwaliteit te maken. Zoals Chris Moffitt aangeeft in zijn overzicht van Python visualisatie tools, matplotlib “is extreem krachtig, maar met die kracht komt complexiteit.”

matplotlib is lang bekritiseerd om zijn standaard stijlen, die een duidelijke jaren ’90 uitstraling hebben. De aankomende release van matplotlib 2.0 belooft veel nieuwe stijl veranderingen om dit probleem aan te pakken.

Created by: John D. Hunter, beschikbaar in Mode
Waar vindt u meer informatie: matplotlib.org

Probeer matplotlib in Mode.

Wilt u uw Python-vaardigheden opfrissen? Bekijk onze tutorial om te leren hoe u gegevens kunt analyseren en visualiseren met Python.

Seaborn

Violinplot (Michael Waskom)

Seaborn maakt gebruik van de kracht van matplotlib om prachtige grafieken te maken in een paar regels code. Het belangrijkste verschil is Seaborn’s standaard stijlen en kleurenpaletten, die zijn ontworpen om meer esthetisch aangenaam en modern te zijn. Omdat Seaborn is gebouwd bovenop matplotlib, moet je matplotlib kennen om de standaardinstellingen van Seaborn aan te passen.

Created by: Michael Waskom, beschikbaar in Mode
Waar vindt u meer informatie? http://web.stanford.edu/~mwaskom/software/seaborn/index.html

Probeer Seaborn in Mode.

ggplot

Kleine veelvouden (ŷhat)

ggplot is gebaseerd op ggplot2, een R-plotsysteem, en concepten uit The Grammar of Graphics. ggplot werkt anders dan matplotlib: het laat je componenten in lagen aanbrengen om een complete plot te maken. Je kan bijvoorbeeld beginnen met assen, dan punten toevoegen, dan een lijn, een trendlijn, enz. Hoewel The Grammar of Graphics is geprezen als een “intuïtieve” methode voor plotten, hebben doorgewinterde matplotlib gebruikers misschien tijd nodig om aan deze nieuwe denkwijze te wennen.

Volgens de maker is ggplot niet ontworpen om sterk aangepaste graphics te maken. Het offert complexiteit op voor een eenvoudigere methode van plotten.

ggplot is nauw geïntegreerd met pandas, dus het is het beste om uw gegevens op te slaan in een DataFrame wanneer u ggplot gebruikt.

Created by: ŷhat
Waar vindt u meer informatie? http://ggplot.yhathq.com/

Bokeh

Interactieve weerstatistieken voor drie steden (Continuum Analytics)

Net als ggplot is Bokeh gebaseerd op The Grammar of Graphics, maar in tegenstelling tot ggplot is het in Python ingebouwd en niet overgezet vanuit R. De kracht van Bokeh ligt in de mogelijkheid om interactieve, webklare plots te maken, die eenvoudig kunnen worden uitgevoerd als JSON-objecten, HTML-documenten of interactieve webtoepassingen. Bokeh ondersteunt ook streaming en real-time data.

Bokeh biedt drie interfaces met verschillende niveaus van controle om verschillende soorten gebruikers tegemoet te komen. Het hoogste niveau is voor het snel maken van grafieken. Het bevat methoden voor het maken van veel voorkomende grafieken, zoals staafplots, boxplots en histogrammen. Het middelste niveau heeft dezelfde specificiteit als matplotlib en stelt u in staat om de basis bouwstenen van elke grafiek te controleren (de punten in een scatter plot, bijvoorbeeld). Het laagste niveau is gericht op ontwikkelaars en software ingenieurs. Het heeft geen vooraf ingestelde standaardwaarden en vereist dat u elk element van de grafiek definieert.

Created by: Continuum Analytics
Waar vindt u meer informatie? http://bokeh.pydata.org/en/latest/

Wilt u uw Python-vaardigheden bijspijkeren? Bekijk onze tutorial om te leren hoe u gegevens kunt analyseren en visualiseren met Python.

pygal

Kaderplot (Florian Mounier)

Net als Bokeh en Plotly biedt pygal interactieve plots die in de webbrowser kunnen worden ingebed. Het belangrijkste verschil is de mogelijkheid om diagrammen als SVG’s uit te voeren. Zolang je met kleinere datasets werkt, is SVGs prima. Maar als je grafieken maakt met honderdduizenden datapunten, zullen ze moeite hebben met renderen en traag worden.

Dankzij het feit dat elk grafiektype is verpakt in een methode en de ingebouwde stijlen mooi zijn, is het eenvoudig om een mooi ogende grafiek te maken in een paar regels code.

Created by: Florian Mounier
Waar vindt u meer informatie? http://www.pygal.org/en/latest/index.html

Plotly

Line plot (Plotly)

Je kent Plotly misschien als een online platform voor datavisualisatie, maar wist je ook dat je toegang hebt tot de mogelijkheden van Plotly vanuit een Python-notebook? Net als Bokeh is Plotly’s kracht het maken van interactieve plots, maar het biedt een aantal grafieken die je niet in de meeste bibliotheken zult vinden, zoals contourplots, dendogrammen en 3D-diagrammen.

Created by: Plotly, beschikbaar in Mode
Waar vindt u meer informatie? https://plot.ly/python/

Probeer Plotly in Modus.

geoplotlib

Choropleth (Andrea Cuttone)

geoplotlib is een toolbox voor het maken van kaarten en het plotten van geografische gegevens. U kunt het gebruiken om verschillende kaarttypes te maken, zoals choropleths, heatmaps, en dot density maps. Je moet Pyglet (een object-georiënteerde programmeer interface) geïnstalleerd hebben om geoplotlib te kunnen gebruiken. Desalniettemin, omdat de meeste Python data visualisatie bibliotheken geen kaarten aanbieden, is het leuk om een bibliotheek te hebben die alleen aan hen gewijd is.

Created by: Andrea Cuttone
Waar vindt u meer informatie: https://github.com/andrea-cuttone/geoplotlib

Gleam

Spreidingsplot met trendlijn (David Robinson)

Gleam is geïnspireerd op het Shiny-pakket van R. Het stelt je in staat om analyses om te zetten in interactieve web apps met alleen Python scripts, dus je hoeft geen andere talen te kennen zoals HTML, CSS, of JavaScript. Gleam werkt met elke Python data visualisatie bibliotheek. Als je eenmaal een plot hebt gemaakt, kun je er velden bovenop bouwen zodat gebruikers gegevens kunnen filteren en sorteren.

Created by: David Robinson
Waar vindt u meer informatie? https://github.com/dgrtwo/gleam

missingno

Nullity matrix (Aleksey Bilogur)

Het is vervelend om met ontbrekende gegevens om te gaan. Met missingno kunt u snel de volledigheid van een gegevensset meten met een visueel overzicht, in plaats van door een tabel te ploeteren. Je kunt gegevens filteren en sorteren op basis van volledigheid of correlaties spotten met een heatmap of een dendrogram.

Created by: Aleksey Bilogur
Waar vindt u meer informatie? https://github.com/ResidentMario/missingno

Leather

Grafiekraster met consistente schalen (Christopher Groskopf)

De maker van Leather, Christopher Groskopf, verwoordt het het beste: “Leather is de Python grafiekenbibliotheek voor degenen die nu grafieken nodig hebben en het niet kan schelen of ze perfect zijn.” Het is ontworpen om met alle datatypes te werken en produceert grafieken als SVGs, zodat je ze kunt schalen zonder verlies van beeldkwaliteit. Omdat deze bibliotheek relatief nieuw is, is een deel van de documentatie nog in ontwikkeling. De grafieken die je kunt maken zijn vrij eenvoudig, maar dat is ook de bedoeling.

Created by: Christopher Groskopf
Waar kunt u meer informatie vinden: https://leather.readthedocs.io/en/latest/index.html

Andere nuttige informatie over Python-gegevensvisualisatie

Er zijn tal van goede evaluaties en overzichten van Python-bibliotheken voor gegevensvisualisatie. Bekijk enkele van onze favorieten:

  • One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
  • Overzicht van Python Visualization Tools (Practical Business Python)
  • Python-gegevensvisualisatie: 7 tools vergelijken (Dataquest.io)
Geen codeerervaring? Geen probleem. Leer Python met behulp van real-world data met onze gratis tutorial.

Aanbevolen artikelen

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.