Python Package Index をスクロールすると、眼球運動研究のための GazeParser からニューラルネットワーク学習のリアルタイム視覚化のための pastalog まで、事実上あらゆるデータ視覚化ニーズに対応したライブラリが見つかります。 そして、これらのライブラリの多くは、特定のタスクの達成に強く焦点を当てていますが、いくつかは、あなたの分野に関係なく使用できます。
このリストは、有名なものから無名のものまで、10の学際的な Python データ可視化ライブラリの概観です。 Mode Python Notebooks は、このリストにある 3 つのライブラリ – matplotlib、Seaborn、Plotly – をサポートしており、その他 60 以上のライブラリを Notebook サポートページで調べることができます。
これらのリストがあなたの刺激になることを願っています。もしリストにないライブラリを追加したい場合は、追加ライブラリをインストールする手順を使用するか、成功モード解析にメモを送信してください。
- Matplotlib
- Seaborn
- ggplot
- Bokeh
- pygal
- Plotly
- geoplotlib
- Gleam
- missingno
- Leather
matplotlib
Two histograms (matplotlib)
matplotlib は O. K. です。G. of Python データ可視化ライブラリです。 10 年以上前のものであるにもかかわらず、Python コミュニティでプロットするために最も広く使用されているライブラリです。 1980年代に開発されたプロプライエタリなプログラミング言語であるMATLABに酷似するように設計されています。
Matplotlib は最初の Python データ視覚化ライブラリなので、他の多くのライブラリはその上に構築されているか、分析中にそれと連動して動作するように設計されています。 pandas や Seaborn のようなライブラリは、matplotlib の「ラッパー」です。 これらは、より少ないコードで matplotlib の多くのメソッドにアクセスすることを可能にしてくれます。
matplotlibはデータの感覚をつかむには良いのですが、出版品質のチャートを素早く簡単に作成するにはあまり役に立ちません。 Chris Moffitt が Python 可視化ツールの概要で指摘しているように、matplotlib は「非常にパワフルだが、そのパワーには複雑さが伴う」
matplotlib は、そのデフォルトスタイルが1990年代の独特の雰囲気を持つことから長い間批判され続けています。 今度リリースされる matplotlib 2.0 は、この問題に対処するために多くの新しいスタイルの変更を約束しています。 John D. Hunter, available in Mode
Where to learn more: matplotlib.org
Try matplotlib in Mode.
Seaborn
Violinplot (Michael Waskom)
Seaborn は matplotlib の力を利用して、数行のコードで美しいグラフを作成します。 重要な違いは、Seaborn のデフォルトのスタイルとカラーパレットで、これはより美的に美しく、現代的になるように設計されています。 Seaborn は matplotlib の上に構築されているので、Seaborn のデフォルトをいじるには matplotlib の知識が必要になります。
作成者。 Michael Waskom、Mode
で利用可能です。
ggplot
Small multiples (ŷhat)
ggplot は ggplot2, R プロットシステムおよび The Grammar of Graphics の概念に基づきます。 例えば、軸から始めて、点を加え、線、トレンドラインなどを加えることができます。 The Grammar of Graphics はプロットするための「直感的」な方法として賞賛されていますが、熟練の matplotlib ユーザーはこの新しい考え方に適応するのに時間がかかるかもしれません。
ggplot は pandas と密接に統合されているので、ggplot を使用するときは DataFrame にデータを格納するのがベストでしょう。
作成者:(株)エヌ・ティ・ティ・ドコモ ŷhat
もっと知りたい方はこちらへ。 http://ggplot.yhathq.com/
Bokeh
Interactive weather statistics for three cities (Continuum Analytics)
ggplotと同様にBokehはThe Grammar of Graphicsに基づいていますが、ggplotと異なりRから移植したのではなくPythonにネイティブなものです。 8030>
Bokehは、異なるユーザータイプに対応するために、制御のレベルが異なる3つのインターフェースを提供します。 最も高いレベルは、チャートを素早く作成するためのものです。 棒グラフ、箱ひげ図、ヒストグラムなどの一般的なグラフを作成するためのメソッドが含まれています。 中間のレベルでは、matplotlib と同様の特殊性を持ち、各チャートの基本的な構成要素(例えば、散布図のドット)を制御することが可能です。 最下位レベルは、開発者やソフトウェアエンジニア向けです。 あらかじめ設定されたデフォルトはなく、チャートのすべての要素を定義する必要があります。
Created by: Continuum Analytics
詳細はこちら。 http://bokeh.pydata.org/en/latest/
pygal
Box plot (Florian Mounier)
Bokeh や Plotly のように、pygal は Web ブラウザに埋め込むことができる対話型のプロットを提供します。 その主な差別化要因は、グラフを SVG として出力する能力です。 より小さなデータセットで作業している限り、SVG で十分でしょう。 しかし、何十万ものデータ点を持つチャートを作ると、レンダリングがうまくいかず、動作が重くなる。
各チャート タイプはメソッドにパッケージ化されており、組み込みのスタイルもきれいなので、数行のコードで見栄えのよいチャートを簡単に作成できます。 Florian Mounier
Where to learn more: http://www.pygal.org/en/latest/index.html
Plotly
Line plot (Plotly)
データ視覚化のためのオンライン プラットフォームとして Plotly をご存知かもしれませんが、その機能に Python ノートブックからアクセスできることもご存知ですか? Bokeh のように、Plotly の得意分野は対話的なプロットの作成ですが、等高線プロット、デンドグラム、および 3D チャートなど、ほとんどのライブラリでは見つけられないチャートを提供します。 Plotly、Mode
で利用可能。 https://plot.ly/python/
Plotly を Mode で試す。
geoplotlib
Choropleth (Andrea Cuttone)
geoplotlib は地図を作成し地理データをプロットするためのツールボックスです。 これを用いて、choropleth, heatmaps, dot density maps のような、様々な種類の地図を作ることができます。 geoplotlib を使うには Pyglet (オブジェクト指向プログラミングインタフェース) がインストールされている必要があります。 それにもかかわらず、ほとんどの Python データ可視化ライブラリは地図を提供していないので、 地図だけに特化したライブラリがあるのは良いことです。 Andrea Cuttone
Where to learn more: https://github.com/andrea-cuttone/geoplotlib
Gleam
Scatter plot with trend line (David Robinson)
Gleam は R の Shiny パッケージにインスパイアされています。 これは、Python スクリプトのみを使用して、分析をインタラクティブな Web アプリケーションに変えることができるので、HTML、CSS、または JavaScript のような他の言語を知っている必要はありません。 Gleamは、あらゆるPythonデータ可視化ライブラリと連動しています。 一度プロットを作成すれば、その上にフィールドを構築することができ、ユーザーはデータをフィルタリングしたりソートしたりすることができます。 David Robinson
Where to learn more: https://github.com/dgrtwo/gleam
missingno
Nullity matrix (Aleksey Bilogur)
欠損データを扱うのは苦痛です。missingno により、テーブルで苦労する代わりに、視覚的に要約してデータセットの完全性を迅速に評価することができます。 完成度に基づいてデータをフィルタリングおよびソートしたり、ヒートマップやデンドログラムで相関を見出したりできます。 Aleksey Bilogur
もっと詳しく知りたい方はこちら。 https://github.com/ResidentMario/missingno
Leather
Chart grid with consistent scales (Christopher Groskopf)
Leather の開発者である Christopher Groskopf はそれを最もうまく表現しています。 「Leather は、今すぐチャートを必要とし、それが完璧であるかどうかを気にしない人のための Python チャートライブラリである”。 あらゆるデータ型で動作するように設計されており、チャートを SVG として生成するため、画質を落とすことなく拡大縮小が可能です。 このライブラリは比較的新しいので、ドキュメントの一部はまだ進行中です。 作成できるグラフはかなり基本的なものですが、それが意図するところです。
Created by: Christopher Groskopf
Where to learn more: https://leather.readthedocs.io/en/latest/index.html
Python データ可視化に関する他の素晴らしい本
Python データ可視化ライブラリの素晴らしい評価と概要は、そこにたくさんあります。 私たちのお気に入りのいくつかをチェックしてください:
- One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
- Overview of Python Visualization Tools (Practical Business Python)
- Python data visualization: 7つのツールを比較する(Dataquest.io)
推薦記事
実世界のデータを使ってPythonを学びましょう。