Mode Blog

Skroll gennem Python Package Index, og du vil finde biblioteker til praktisk talt alle behov for datavisualisering – fra GazeParser til forskning i øjenbevægelser til pastalog til realtidsvisualiseringer af neurale netværkstræning. Og mens mange af disse biblioteker er intenst fokuseret på at udføre en specifik opgave, kan nogle af dem bruges uanset dit område.

Denne liste er en oversigt over 10 tværfaglige Python-biblioteker til datavisualisering, fra de velkendte til de obskure. Mode Python Notebooks understøtter tre biblioteker på denne liste – matplotlib, Seaborn og Plotly – og mere end 60 andre, som du kan udforske på vores side om understøttelse af Notebook.

Vi håber, at disse lister inspirerer dig, og hvis du ønsker at tilføje et bibliotek, der ikke er opført på listen, kan du bruge vores instruktioner til at installere yderligere biblioteker eller sende en note til succes modeanalytics .

  • Matplotlib
  • Seaborn
  • ggplot
  • Bokeh
  • pygal
  • Plotly
  • geoplotlib
  • geoplotlib
  • Gleam
  • missingno
  • Leather

matplotlib

To histogrammer (matplotlib)

matplotlib er den O.G. af Python-biblioteker til datavisualisering. Selv om det er over et årti gammelt, er det stadig det mest anvendte bibliotek til plotting i Python-fællesskabet. Det blev designet til at ligne MATLAB, et proprietært programmeringssprog, der blev udviklet i 1980’erne, meget.

Da matplotlib var det første Python-bibliotek til datavisualisering, er mange andre biblioteker bygget oven på det eller designet til at arbejde sammen med det under analysen. Nogle biblioteker som pandas og Seaborn er “wrappers” over matplotlib. De giver dig mulighed for at få adgang til en række af matplotlibs metoder med mindre kode.

Matplotlib er godt til at få en fornemmelse af dataene, men det er ikke særlig nyttigt til at skabe diagrammer af publikationskvalitet hurtigt og nemt. Som Chris Moffitt påpeger i sin oversigt over Python-visualiseringsværktøjer, er matplotlib “ekstremt kraftfuld, men med denne kraft følger kompleksitet.”

matplotlib er længe blevet kritiseret for sine standardstile, som har en tydelig 1990’er-fornemmelse. Den kommende udgivelse af matplotlib 2.0 lover mange nye stilændringer for at løse dette problem.

Created by: Hvor kan du få mere at vide: matplotlib.org

Prøv matplotlib i Mode.

Vil du opfriske dine Python-færdigheder? Tjek vores vejledning for at lære at analysere og visualisere data ved hjælp af Python.

Seaborn

Violinplot (Michael Waskom)

Seaborn udnytter matplotlib til at skabe smukke diagrammer på få linjer kode. Den vigtigste forskel er Seaborns standard stilarter og farvepaletter, som er designet til at være mere æstetisk tiltalende og moderne. Da Seaborn er bygget oven på matplotlib, skal du kende matplotlib for at kunne justere Seaborns standardindstillinger.

Skabt af: Michael Waskom, tilgængelig i Mode
Hvor kan du få mere at vide? http://web.stanford.edu/~mwaskom/software/seaborn/index.html

Prøv Seaborn i Mode.

ggplot

Små multipla (ŷhat)

ggplot er baseret på ggplot2, et R-plottsystem, og koncepter fra The Grammar of Graphics. ggplot fungerer anderledes end matplotlib: det giver dig mulighed for at lægge komponenter i lag for at skabe et komplet plot. Du kan f.eks. starte med akser, derefter tilføje punkter, derefter en linje, en trendlinje osv. Selv om The Grammar of Graphics er blevet rost som en “intuitiv” metode til plotning, kan erfarne matplotlib-brugere have brug for tid til at vænne sig til denne nye tankegang.

I henhold til skaberen er ggplot ikke designet til at skabe meget tilpassede grafikker. Den ofrer kompleksiteten til fordel for en enklere metode til plotning.

ggplot er tæt integreret med pandas, så det er bedst at gemme dine data i et DataFrame, når du bruger ggplot.

Skabt af:

ŷhat
Hvor du kan få mere at vide: http://ggplot.yhathq.com/

Bokeh

Interaktive vejrstatistikker for tre byer (Continuum Analytics)

Lige ggplot er Bokeh baseret på The Grammar of Graphics, men i modsætning til ggplot er den indbygget i Python og ikke porteret over fra R. Dens styrke ligger i evnen til at oprette interaktive, webklare plots, som nemt kan udgives som JSON-objekter, HTML-dokumenter eller interaktive webapplikationer. Bokeh understøtter også streaming og realtidsdata.

Bokeh tilbyder tre grænseflader med varierende kontrolniveauer for at imødekomme forskellige brugertyper. Det højeste niveau er til hurtig oprettelse af diagrammer. Det indeholder metoder til at oprette almindelige diagrammer som f.eks. søjlediagrammer, boksdiagrammer og histogrammer. Det mellemste niveau har samme specificitet som matplotlib og giver dig mulighed for at kontrollere de grundlæggende byggesten i hvert diagram (f.eks. prikkerne i et scatter plot). Det laveste niveau er rettet mod udviklere og softwareingeniører. Det har ingen forudindstillede standardindstillinger og kræver, at du definerer hvert enkelt element i diagrammet.

Skabt af:

Created by: Continuum Analytics
Hvor kan du få mere at vide? http://bokeh.pydata.org/en/latest/

Vil du opfriske dine Python-færdigheder? Tjek vores tutorial for at lære at analysere og visualisere data ved hjælp af Python.

pygal

Box plot (Florian Mounier)

Lige Bokeh og Plotly tilbyder pygal interaktive plots, der kan indlejres i webbrowseren. Dens primære forskel er muligheden for at udgive diagrammer som SVG’er. Så længe du arbejder med mindre datasæt, vil SVG’er være helt fint nok. Men hvis du laver diagrammer med hundredtusindvis af datapunkter, vil de få problemer med at rendere og blive langsomme.

Da hver diagramtype er pakket ind i en metode, og de indbyggede stilarter er flotte, er det nemt at lave et flot diagram på få linjer kode.

Oprettet af: Florian Mounier
Hvor du kan få mere at vide: http://www.pygal.org/en/latest/index.html

Plotly

Line plot (Plotly)

Du kender måske Plotly som en onlineplatform til datavisualisering, men vidste du også, at du kan få adgang til dens muligheder fra en Python-notebook? Ligesom Bokeh er Plotlys styrke at lave interaktive plot, men den tilbyder nogle diagrammer, som du ikke finder i de fleste biblioteker, f.eks. konturplots, dendogrammer og 3D-diagrammer.

Created by: Plotly, tilgængelig i Mode
Hvor kan du få mere at vide? https://plot.ly/python/

Prøv Plotly i Mode.

geoplotlib

Choropleth (Andrea Cuttone)

geoplotlib er en værktøjskasse til at oprette kort og plotte geografiske data. Du kan bruge den til at oprette en række forskellige korttyper, f.eks. choropleths, heatmaps og dot density maps. Du skal have Pyglet (en objektorienteret programmeringsgrænseflade) installeret for at kunne bruge geoplotlib. Ikke desto mindre, da de fleste Python-biblioteker til datavisualisering ikke tilbyder kort, er det rart at have et bibliotek, der udelukkende er dedikeret til dem.

Created by: Andrea Cuttone
Hvor du kan få mere at vide: https://github.com/andrea-cuttone/geoplotlib

Gleam

Scatter plot with trend line (David Robinson)

Gleam er inspireret af R’s Shiny-pakke. Den giver dig mulighed for at omdanne analyser til interaktive webapps udelukkende ved hjælp af Python-scripts, så du behøver ikke at kunne andre sprog som HTML, CSS eller JavaScript. Gleam fungerer med ethvert Python-bibliotek til datavisualisering. Når du har oprettet et plot, kan du bygge felter oven på det, så brugerne kan filtrere og sortere data.

Skabt af: David Robinson
Hvor du kan få mere at vide: https://github.com/dgrtwo/gleam

missingno

Nullitetsmatrix (Aleksey Bilogur)

Håndtering af manglende data er en smerte. missingno giver dig mulighed for hurtigt at vurdere fuldstændigheden af et datasæt med et visuelt resumé i stedet for at skulle gennem en tabel. Du kan filtrere og sortere data baseret på fuldstændighed eller se korrelationer med et varmekort eller et dendrogram.

Created by: Hvor kan du få mere at vide: Skabt af: Aleksey Bilogur
https://github.com/ResidentMario/missingno

Leather

Diagramgitter med konsistente skalaer (Christopher Groskopf)

Leather’s skaber, Christopher Groskopf, udtrykker det bedst:

“Leather er Python-diagrambiblioteket for dem, der har brug for diagrammer nu, og som er ligeglade med, om de er perfekte.” Det er designet til at arbejde med alle datatyper og producerer diagrammer som SVG’er, så du kan skalere dem uden at miste billedkvalitet. Da dette bibliotek er relativt nyt, er en del af dokumentationen stadig under udarbejdelse. De diagrammer, du kan lave, er ret enkle – men det er hensigten.

Created by: Christopher Groskopf
Hvor du kan få mere at vide: https://leather.readthedocs.io/en/latest/index.html

Andre gode læsninger om Python-datavisualisering

Der er et væld af gode evalueringer og oversigter over Python-datavisualiseringsbiblioteker derude. Tjek nogle af vores favoritter:

  • One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
  • Overview of Python Visualization Tools (Practical Business Python)
  • Python datavisualisering: Comparing 7 tools (Dataquest.io)
Ingen erfaring med kodning? Intet problem. Lær Python ved hjælp af data fra den virkelige verden med vores gratis tutorial.

Anbefalede artikler

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.