Mode Blog

Călătoriți prin Indexul pachetelor Python și veți găsi biblioteci pentru practic orice nevoie de vizualizare a datelor – de la GazeParser pentru cercetarea mișcărilor oculare la pastalog pentru vizualizări în timp real ale instruirii rețelelor neuronale. Și în timp ce multe dintre aceste biblioteci se concentrează intens pe îndeplinirea unei sarcini specifice, unele pot fi utilizate indiferent de domeniul dumneavoastră.

Această listă este o prezentare generală a 10 biblioteci de vizualizare a datelor Python interdisciplinare, de la cele mai cunoscute la cele mai obscure. Mode Python Notebooks suportă trei biblioteci din această listă – matplotlib, Seaborn și Plotly – și peste 60 de alte biblioteci pe care le puteți explora pe pagina noastră de suport pentru notebook-uri.

Sperăm că aceste liste vă inspiră, iar dacă doriți să adăugați o bibliotecă care nu este listată, utilizați instrucțiunile noastre pentru a instala biblioteci suplimentare sau trimiteți o notă la succes modeanalytics .

  • Matplotlib
  • Seaborn
  • ggplot
  • Bokeh
  • pygal
  • Plotly
  • geoplotlib
  • .

  • Gleam
  • missingno
  • Leather

matplotlib

Două histograme (matplotlib)

matplotlib este O.G. al bibliotecilor de vizualizare a datelor Python. În ciuda faptului că este veche de peste un deceniu, este încă cea mai utilizată bibliotecă pentru reprezentarea grafică în comunitatea Python. A fost proiectată pentru a semăna foarte mult cu MATLAB, un limbaj de programare proprietar dezvoltat în anii 1980.

Pentru că matplotlib a fost prima bibliotecă Python de vizualizare a datelor, multe alte biblioteci sunt construite pe baza ei sau sunt concepute pentru a lucra în tandem cu ea în timpul analizei. Unele biblioteci, cum ar fi pandas și Seaborn, sunt „învelitori” peste matplotlib. Acestea vă permit să accesați o serie de metode ale matplotlib cu mai puțin cod.

În timp ce matplotlib este bun pentru a obține un sens al datelor, nu este foarte util pentru a crea rapid și ușor grafice de calitate pentru publicații. După cum subliniază Chris Moffitt în prezentarea sa generală a instrumentelor de vizualizare Python, matplotlib „este extrem de puternic, dar odată cu această putere vine și complexitatea.”

matplotlib a fost mult timp criticat pentru stilurile sale implicite, care au un aer distinct al anilor 1990. Viitoarea lansare a matplotlib 2.0 promite multe schimbări de stiluri noi pentru a rezolva această problemă.

Creat de: Matplotlib 2.0: John D. Hunter, disponibil în Mode
Unde puteți afla mai multe: matplotlib.org

Încercați matplotlib în Mode.

Vreți să vă îmbunătățiți cunoștințele de Python? Consultați tutorialul nostru pentru a învăța cum să analizați și să vizualizați date folosind Python.

Seaborn

Violinplot (Michael Waskom)

Seaborn exploatează puterea matplotlib pentru a crea grafice frumoase în câteva linii de cod. Diferența cheie este reprezentată de stilurile și paletele de culori implicite ale lui Seaborn, care sunt concepute pentru a fi mai plăcute din punct de vedere estetic și mai moderne. Deoarece Seaborn este construit pe matplotlib, va trebui să cunoașteți matplotlib pentru a modifica setările implicite ale lui Seaborn.

Creat de:

Creat de: Michael Waskom, disponibil în Mode
Unde puteți afla mai multe: http://web.stanford.edu/~mwaskom/software/seaborn/index.html

Încercați Seaborn în Mode.

ggplot

Multiplii mici (ŷhat)

ggplot se bazează pe ggplot2, un sistem de trasare în R, și pe concepte din The Grammar of Graphics. ggplot funcționează diferit de matplotlib: vă permite să stratificați componente pentru a crea un traseu complet. De exemplu, puteți începe cu axe, apoi adăugați puncte, apoi o linie, o linie de tendință etc. Deși The Grammar of Graphics a fost lăudată ca fiind o metodă „intuitivă” de trasare a graficelor, utilizatorii experimentați ai matplotlib ar putea avea nevoie de timp pentru a se adapta la această nouă mentalitate.

Potrivit creatorului, ggplot nu este conceput pentru a crea grafice foarte personalizate. Acesta sacrifică complexitatea pentru o metodă mai simplă de reprezentare grafică.

ggplot este strâns integrat cu pandas, așa că cel mai bine este să vă stocați datele într-un DataFrame atunci când utilizați ggplot.

Creat de:

Creat de: ŷhat
Unde puteți afla mai multe: http://ggplot.yhathq.com/

Bokeh

Statistici meteo interactive pentru trei orașe (Continuum Analytics)

Ca și ggplot, Bokeh se bazează pe The Grammar of Graphics, dar, spre deosebire de ggplot, este nativ pentru Python, nu este portat din R. Punctul său forte constă în capacitatea de a crea diagrame interactive, pregătite pentru web, care pot fi ușor de ieșit ca obiecte JSON, documente HTML sau aplicații web interactive. Bokeh suportă, de asemenea, streaming și date în timp real.

Bokeh oferă trei interfețe cu diferite niveluri de control pentru a se adapta diferitelor tipuri de utilizatori. Cel mai înalt nivel este pentru crearea rapidă de grafice. Acesta include metode pentru crearea de diagrame comune, cum ar fi diagramele de bare, diagramele de cutie și histogramele. Nivelul mediu are aceeași specificitate ca și matplotlib și vă permite să controlați elementele de bază ale fiecărui grafic (punctele dintr-un grafic de dispersie, de exemplu). Nivelul cel mai de jos este orientat către dezvoltatori și ingineri de software. Nu are valori implicite prestabilite și vă cere să definiți fiecare element al graficului.

Creat by: Continuum Analytics
Unde puteți afla mai multe: http://bokeh.pydata.org/en/latest/

Vreți să vă perfecționați cunoștințele de Python? Consultați tutorialul nostru pentru a învăța cum să analizați și să vizualizați date folosind Python.

pygal

Box plot (Florian Mounier)

Ca Bokeh și Plotly, pygal oferă diagrame interactive care pot fi încorporate în browserul web. Principalul său diferențiator este capacitatea de a scoate diagrame ca SVG-uri. Atâta timp cât lucrați cu seturi de date mai mici, SVG-urile vă vor fi de ajuns. Dar dacă realizați diagrame cu sute de mii de puncte de date, acestea vor avea probleme de redare și vor deveni leneșe.

Din moment ce fiecare tip de diagramă este împachetat într-o metodă și stilurile încorporate sunt frumoase, este ușor să creați o diagramă cu aspect plăcut în câteva linii de cod.

Creat de: Florian Mounier
Unde puteți afla mai multe: http://www.pygal.org/en/latest/index.html

Plotly

Line plot (Plotly)

Poate cunoașteți Plotly ca o platformă online pentru vizualizarea datelor, dar știați că puteți accesa capacitățile sale și dintr-un notebook Python? La fel ca Bokeh, punctul forte al lui Plotly este realizarea de diagrame interactive, dar oferă unele diagrame pe care nu le veți găsi în majoritatea bibliotecilor, cum ar fi diagramele de contur, dendogramele și diagramele 3D.

Creat de: Plotly, disponibil în Mode
Unde puteți afla mai multe: https://plot.ly/python/https://plot.ly/python/

Încercați Plotly în Mode.

geoplotlib

Choropleth (Andrea Cuttone)

geoplotlib este o cutie de instrumente pentru crearea de hărți și reprezentarea grafică a datelor geografice. Îl puteți utiliza pentru a crea o varietate de tipuri de hărți, cum ar fi choropleths, heatmaps și hărți de densitate a punctelor. Trebuie să aveți instalat Pyglet (o interfață de programare orientată pe obiecte) pentru a utiliza geoplotlib. Cu toate acestea, din moment ce majoritatea bibliotecilor Python de vizualizare a datelor nu oferă hărți, este plăcut să ai o bibliotecă dedicată exclusiv acestora.

Creat de:

Creat de: P: Andrea Cuttone
Unde puteți afla mai multe: https://github.com/andrea-cuttone/geoplotlib

Gleam

Plotul de dispersie cu linie de tendință (David Robinson)

Gleam este inspirat de pachetul Shiny al lui R. Acesta vă permite să transformați analizele în aplicații web interactive folosind doar scripturi Python, astfel încât nu trebuie să cunoașteți alte limbaje precum HTML, CSS sau JavaScript. Gleam funcționează cu orice bibliotecă Python de vizualizare a datelor. După ce ați creat un complot, puteți construi câmpuri deasupra acestuia, astfel încât utilizatorii să poată filtra și sorta datele.

Creat de: David Robinson
Unde puteți afla mai multe: https://github.com/dgrtwo/gleam

missingno

Matrice de nulitate (Aleksey Bilogur)

Afacerea cu datele lipsă este o pacoste. missingno vă permite să evaluați rapid gradul de completitudine a unui set de date cu un rezumat vizual, în loc să vă chinuiți să parcurgeți un tabel. Puteți să filtrați și să sortați datele pe baza completării sau să reperați corelațiile cu o hartă termică sau o dendrogramă.

Creat de: Aleksey Bilogur
Unde puteți afla mai multe: https://github.com/ResidentMario/missingno

Leather

Grilă de diagrame cu scări consistente (Christopher Groskopf)

Creatorul lui Leather, Christopher Groskopf, o spune cel mai bine: „Leather este biblioteca de grafice Python pentru cei care au nevoie de grafice acum și nu le pasă dacă sunt perfecte.” Este concepută pentru a funcționa cu toate tipurile de date și produce diagrame ca SVG-uri, astfel încât să le puteți scala fără a pierde calitatea imaginii. Deoarece această bibliotecă este relativ nouă, o parte din documentație este încă în curs de realizare. Graficele pe care le puteți realiza sunt destul de elementare – dar aceasta este intenția.

Creat de:

Creat de: Christopher Groskopf
Unde puteți afla mai multe: https://leather.readthedocs.io/en/latest/index.html

Alte lecturi grozave despre vizualizarea datelor Python

Există o tonă de evaluări grozave și prezentări de ansamblu ale bibliotecilor de vizualizare a datelor Python. Consultați câteva dintre preferatele noastre:

  • One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
  • Overview of Python Visualization Tools (Practical Business Python)
  • Vizualizare de date Python: Compararea a 7 instrumente (Dataquest.io)
Nu aveți experiență de codare? Nicio problemă. Învățați Python folosind date din lumea reală cu tutorialul nostru gratuit.

Articole recomandate

Lasă un răspuns

Adresa ta de email nu va fi publicată.