Prolistujte si Rejstřík balíčků Pythonu a najdete knihovny prakticky pro každou potřebu vizualizace dat – od GazeParseru pro výzkum pohybů očí po pastalog pro vizualizaci trénování neuronových sítí v reálném čase. A přestože se mnohé z těchto knihoven intenzivně zaměřují na plnění konkrétního úkolu, některé lze použít bez ohledu na obor.
Tento seznam je přehledem 10 mezioborových knihoven pro vizualizaci dat v jazyce Python, od těch známých až po obskurní. Sešity Mode Python podporují tři knihovny z tohoto seznamu – matplotlib, Seaborn a Plotly – a více než 60 dalších, které si můžete prohlédnout na naší stránce podpory sešitů.
Doufáme, že vás tyto seznamy inspirují, a pokud chcete přidat knihovnu, která není v seznamu, použijte naše pokyny k instalaci dalších knihoven nebo pošlete poznámku na adresu success modeanalytics .
- Matplotlib
- Seaborn
- ggplot
- Bokeh
- pygal
- Plotly
- geoplotlib
- Gleam
- missingno
- Leather
matplotlib
Dva histogramy (matplotlib)
matplotlib je O.G. knihoven pro vizualizaci dat v jazyce Python. Přestože je stará více než deset let, je stále nejpoužívanější knihovnou pro vykreslování v komunitě Pythonu. Byla navržena tak, aby se co nejvíce podobala MATLABu, proprietárnímu programovacímu jazyku vyvinutému v 80. letech 20. století.
Protože matplotlib byla první knihovnou pro vizualizaci dat v jazyce Python, je nad ní postaveno mnoho dalších knihoven nebo je navržena tak, aby s ní při analýze spolupracovala. Některé knihovny, například pandas a Seaborn, jsou „obaly“ nad knihovnou matplotlib. Umožňují přístup k řadě metod knihovny matplotlib s menším množstvím kódu.
Ačkoli je matplotlib dobrý pro získání představy o datech, není příliš užitečný pro rychlé a snadné vytváření grafů v publikační kvalitě. Jak upozorňuje Chris Moffitt ve svém přehledu vizualizačních nástrojů v jazyce Python, matplotlib „je extrémně výkonný, ale s touto silou přichází i složitost.“
Matplotlib byl dlouho kritizován za své výchozí styly, které mají výrazný nádech devadesátých let. Nadcházející vydání matplotlib 2.0 slibuje mnoho nových změn stylů, které tento problém vyřeší.
Vytvořil: Hunter, k dispozici v režimu
Kde se dozvědět více: matplotlib.org
Vyzkoušejte matplotlib v režimu.
Seaborn
Violinplot (Michael Waskom)
Seaborn využívá sílu matplotlib k vytváření krásných grafů v několika řádcích kódu. Klíčovým rozdílem jsou výchozí styly a barevné palety Seabornu, které jsou navrženy tak, aby byly estetičtější a modernější. Protože je Seaborn postaven nad matplotlib, budete muset znát matplotlib, abyste mohli upravit výchozí nastavení Seabornu.
Vytvořil: Michael Waskom, k dispozici v režimu
Kde se dozvíte více: http://web.stanford.edu/~mwaskom/software/seaborn/index.html
Vyzkoušejte Seaborn v Mode.
ggplot
Malé násobky (ŷhat)
ggplot je založen na ggplot2, systému pro vykreslování v R, a konceptech z The Grammar of Graphics. ggplot pracuje jinak než matplotlib: umožňuje vrstvit komponenty a vytvořit tak kompletní graf. Můžete například začít s osami, pak přidat body, pak přímku, trendovou čáru atd. Ačkoli byla Gramatika grafiky chválena jako „intuitivní“ metoda vykreslování, zkušení uživatelé matplotlibu budou možná potřebovat čas, aby si na tento nový způsob myšlení zvykli.
Podle tvůrce není ggplot určen k vytváření vysoce přizpůsobené grafiky. Obětuje složitost ve prospěch jednoduššího způsobu vykreslování.
ggplot je úzce integrován s programem pandas, takže při použití ggplot je nejlepší ukládat data do DataFrame.
Vytvořil: ŷhat
Kde se dozvíte více: http://ggplot.yhathq.com/
Bokeh
Interaktivní statistiky počasí pro tři města (Continuum Analytics)
Stejně jako ggplot je i Bokeh založen na The Grammar of Graphics, ale na rozdíl od ggplot je nativním prostředím jazyka Python, nikoli portován z R. Jeho síla spočívá ve schopnosti vytvářet interaktivní grafy připravené pro web, které lze snadno vyvést jako objekty JSON, dokumenty HTML nebo interaktivní webové aplikace. Bokeh také podporuje streamování a data v reálném čase.
Bokeh poskytuje tři rozhraní s různou úrovní ovládání, aby vyhovoval různým typům uživatelů. Nejvyšší úroveň je určena pro rychlé vytváření grafů. Obsahuje metody pro vytváření běžných grafů, jako jsou sloupcové grafy, krabicové grafy a histogramy. Střední úroveň má stejná specifika jako matplotlib a umožňuje ovládat základní stavební prvky každého grafu (například body v grafu rozptylu). Nejnižší úroveň je zaměřena na vývojáře a softwarové inženýry. Nemá žádné přednastavené výchozí hodnoty a vyžaduje, abyste definovali každý prvek grafu.
Vytvořil: Mgr: Continuum Analytics
Kde se dozvíte více: http://bokeh.pydata.org/en/latest/
pygal
Box plot (Florian Mounier)
Podobně jako Bokeh a Plotly nabízí pygal interaktivní grafy, které lze vložit do webového prohlížeče. Jeho hlavním rozlišovacím znakem je možnost výstupu grafů ve formátu SVG. Pokud pracujete s menšími soubory dat, SVG vám budou stačit. Pokud však vytváříte grafy se stovkami tisíc datových bodů, budou mít problémy s vykreslováním a budou pomalé.
Protože je každý typ grafu zabalen do metody a vestavěné styly jsou pěkné, je snadné vytvořit pěkně vypadající graf na několika řádcích kódu.
Vytvořil: Florian Mounier
Kde se dozvíte více: http://www.pygal.org/en/latest/index.html
Plotly
Čárový graf (Plotly)
Možná znáte Plotly jako online platformu pro vizualizaci dat, ale věděli jste také, že k jejím možnostem můžete přistupovat ze zápisníku Pythonu? Stejně jako Bokeh je silnou stránkou Plotly tvorba interaktivních grafů, ale nabízí i některé grafy, které ve většině knihoven nenajdete, například obrysové grafy, dendogramy a 3D grafy.
Vytvořil: Plotly, k dispozici v režimu
Kde se dozvíte více:
geoplotlib
Choropleth (Andrea Cuttone)
geoplotlib je sada nástrojů pro vytváření map a vykreslování geografických dat. Můžete jej použít k vytváření různých typů map, jako jsou choroplety, heatmapy a mapy hustoty bodů. Abyste mohli geoplotlib používat, musíte mít nainstalovaný Pyglet (objektově orientované programovací rozhraní). Nicméně vzhledem k tomu, že většina knihoven pro vizualizaci dat v Pythonu mapy nenabízí, je příjemné mít knihovnu určenou výhradně pro ně.
Vytvořil: Andrea Cuttone
Kde se dozvíte více: https://github.com/andrea-cuttone/geoplotlib
Gleam
Kresba rozptylu s čárou trendu (David Robinson)
Gleam je inspirován balíčkem Shiny z programu R. V tomto balíčku jsou obsaženy všechny potřebné informace. Umožňuje proměnit analýzy v interaktivní webové aplikace pouze pomocí skriptů Pythonu, takže nemusíte znát žádné další jazyky, jako je HTML, CSS nebo JavaScript. Gleam pracuje s libovolnou knihovnou pro vizualizaci dat v jazyce Python. Jakmile vytvoříte graf, můžete nad ním vytvořit pole, aby uživatelé mohli filtrovat a třídit data.
Vytvořil: Mgr: David Robinson
Kde se dozvíte více: https://github.com/dgrtwo/gleam
missingno
Matrika chybějících dat (Aleksey Bilogur)
Práce s chybějícími daty je otrava. missingno vám umožní rychle posoudit úplnost datové sady pomocí vizuálního shrnutí, místo abyste se museli prodírat tabulkou. Můžete filtrovat a třídit data na základě úplnosti nebo si všimnout korelací pomocí tepelné mapy nebo dendrogramu.
Vytvořil: Aleksey Bilogur
Kde se dozvíte více: https://github.com/ResidentMario/missingno
Leather
Mřížka grafu s konzistentními měřítky (Christopher Groskopf)
Tvůrce programu Leather, Christopher Groskopf, to vystihl nejlépe: „Leather je knihovna pro tvorbu grafů v Pythonu pro ty, kteří potřebují grafy hned a nezáleží jim na tom, jestli jsou dokonalé.“ Je navržena pro práci se všemi typy dat a grafy vytváří jako SVG, takže je můžete škálovat bez ztráty kvality obrazu. Protože je tato knihovna relativně nová, na některých částech dokumentace se stále pracuje. Grafy, které můžete vytvářet, jsou poměrně jednoduché – ale to je záměr.
Vytvořil: Christopher Groskopf
Kde se dozvíte více: https://leather.readthedocs.io/en/latest/index.html
Další skvělé čtení o vizualizaci dat v jazyce Python
Existuje spousta skvělých hodnocení a přehledů knihoven pro vizualizaci dat v jazyce Python. Podívejte se na některé z našich oblíbených:
- Jeden graf, dvanáct knihoven pro tvorbu grafů (Lisa Charlotte Rost)
- Přehled vizualizačních nástrojů Pythonu (Practical Business Python)
- Vizualizace dat v Pythonu: (Dataquest.io)
Doporučené články
.