Mode Blog

Przewertuj indeks pakietów Pythona, a znajdziesz biblioteki do praktycznie każdej wizualizacji danych – od GazeParser do badań ruchu gałek ocznych po pastalog do wizualizacji w czasie rzeczywistym treningu sieci neuronowych. I chociaż wiele z tych bibliotek jest intensywnie skupionych na wykonywaniu konkretnych zadań, niektóre z nich mogą być używane bez względu na dziedzinę, którą się zajmujesz.

Niniejsza lista stanowi przegląd 10 interdyscyplinarnych bibliotek Pythona do wizualizacji danych, od dobrze znanych do mało znanych. Notebooki Pythona Mode obsługują trzy biblioteki z tej listy – matplotlib, Seaborn i Plotly – oraz ponad 60 innych, które można poznać na naszej stronie obsługi Notebooków.

Mamy nadzieję, że te listy Cię zainspirują, a jeśli chcesz dodać bibliotekę, której nie ma na liście, skorzystaj z naszych instrukcji, aby zainstalować dodatkowe biblioteki, lub wyślij wiadomość na adres sukces modeanalytics .

  • Matplotlib
  • Seaborn
  • ggplot
  • Bokeh
  • pygal
  • Plotly
  • geoplotlib
  • .

  • Gleam
  • missingno
  • Leather

matplotlib

Dwa histogramy (matplotlib)

matplotlib jest O.G. bibliotek do wizualizacji danych w Pythonie. Pomimo tego, że ma już ponad dekadę, nadal jest najczęściej używaną biblioteką do tworzenia wykresów w społeczności Pythona. Została zaprojektowana tak, aby przypominała MATLABa, prawnie zastrzeżony język programowania opracowany w latach osiemdziesiątych.

Ponieważ matplotlib był pierwszą biblioteką do wizualizacji danych w Pythonie, wiele innych bibliotek zostało zbudowanych na jego bazie lub zaprojektowanych do pracy z nim podczas analizy. Niektóre biblioteki, takie jak pandas i Seaborn, są „wrapperami” dla matplotliba. Pozwalają one na dostęp do wielu metod matplotliba z mniejszą ilością kodu.

Pomimo że matplotlib jest dobry do zapoznania się z danymi, nie jest zbyt użyteczny do szybkiego i łatwego tworzenia wykresów o jakości publikacji. Jak zauważa Chris Moffitt w swoim przeglądzie narzędzi wizualizacyjnych Pythona, matplotlib „jest niezwykle potężny, ale z tą mocą przychodzi złożoność.”

matplotlib od dawna jest krytykowany za swoje domyślne style, które mają wyraźny charakter lat 90. Nadchodzące wydanie matplotlib 2.0 obiecuje wiele nowych zmian w stylach, aby rozwiązać ten problem.

Created by: John D. Hunter, dostępne w Mode
Gdzie dowiedzieć się więcej: matplotlib.org

Wypróbuj matplotlib w Mode.

Chcesz podszlifować swoje umiejętności posługiwania się językiem Python? Sprawdź nasz samouczek, aby dowiedzieć się, jak analizować i wizualizować dane przy użyciu Pythona.

Seaborn

Violinplot (Michael Waskom)

Seaborn wykorzystuje możliwości matplotlib do tworzenia pięknych wykresów w kilku liniach kodu. Kluczową różnicą są domyślne style i palety kolorów Seaborna, które zostały zaprojektowane tak, aby były bardziej estetyczne i nowoczesne. Ponieważ Seaborn jest zbudowany na matplotlib, będziesz musiał znać matplotlib, aby dostosować domyślne ustawienia Seaborna.

Created by: Michael Waskom, dostępny w Trybie
Gdzie dowiedzieć się więcej: http://web.stanford.edu/~mwaskom/software/seaborn/index.html

Wypróbuj Seaborn w Mode.

gggplot

Małe wielokrotności (ŷhat)

gggplot jest oparty na ggplot2, systemie wykresów R, i koncepcjach z The Grammar of Graphics. ggplot działa inaczej niż matplotlib: pozwala na warstwowanie komponentów w celu utworzenia kompletnego wykresu. Na przykład, można zacząć od osi, potem dodać punkty, następnie linię, linię trendu, itd. Chociaż The Grammar of Graphics jest chwalona jako „intuicyjna” metoda tworzenia wykresów, doświadczeni użytkownicy matplotlib mogą potrzebować czasu, aby dostosować się do tego nowego sposobu myślenia.

Według twórcy, ggplot nie jest przeznaczony do tworzenia wysoce spersonalizowanych grafik. Poświęca on złożoność na rzecz prostszej metody tworzenia wykresów.

gggplot jest ściśle zintegrowany z pandas, więc najlepiej jest przechowywać dane w DataFrame podczas używania ggplot.

Created by: ŷhat
Gdzie dowiedzieć się więcej: http://ggplot.yhathq.com/

Bokeh

Interaktywne statystyki pogodowe dla trzech miast (Continuum Analytics)

Podobnie jak ggplot, Bokeh bazuje na The Grammar of Graphics, ale w przeciwieństwie do ggplot, jest natywny dla Pythona, a nie przeniesiony z R. Jego siła leży w zdolności do tworzenia interaktywnych, gotowych do pracy w sieci działek, które można łatwo wyprowadzać jako obiekty JSON, dokumenty HTML lub interaktywne aplikacje internetowe. Bokeh obsługuje również dane strumieniowe i dane czasu rzeczywistego.

Bokeh udostępnia trzy interfejsy o różnych poziomach kontroli, aby dostosować się do różnych typów użytkowników. Najwyższy poziom służy do szybkiego tworzenia wykresów. Zawiera on metody tworzenia typowych wykresów, takich jak wykresy słupkowe, pudełkowe i histogramy. Środkowy poziom ma taką samą specyfikę jak matplotlib i pozwala kontrolować podstawowe elementy składowe każdego wykresu (na przykład kropki w wykresie rozrzutu). Najniższy poziom jest skierowany do programistów i inżynierów oprogramowania. Nie ma wstępnie ustawionych domyślnych ustawień i wymaga zdefiniowania każdego elementu wykresu.

Created by: Continuum Analytics
Gdzie dowiedzieć się więcej: http://bokeh.pydata.org/en/latest/

Chcesz podszlifować swoje umiejętności posługiwania się językiem Python? Sprawdź nasz tutorial, aby dowiedzieć się, jak analizować i wizualizować dane przy użyciu Pythona.

pygal

Box plot (Florian Mounier)

Podobnie jak Bokeh i Plotly, pygal oferuje interaktywne wykresy, które można osadzić w przeglądarce internetowej. Jego głównym wyróżnikiem jest zdolność do wyprowadzania wykresów jako SVGs. Tak długo, jak pracujesz z mniejszymi zestawami danych, SVGs wystarczą Ci w sam raz. Ale jeśli tworzysz wykresy z setkami tysięcy punktów danych, będą one miały problemy z renderowaniem i staną się powolne.

Ponieważ każdy typ wykresu jest opakowany w metodę, a wbudowane style są ładne, łatwo jest stworzyć ładnie wyglądający wykres w kilku liniach kodu.

Created by: Florian Mounier
Gdzie dowiedzieć się więcej: http://www.pygal.org/en/latest/index.html

Plotly

Line plot (Plotly)

Możesz znać Plotly jako platformę online do wizualizacji danych, ale czy wiedziałeś również, że możesz uzyskać dostęp do jego możliwości z notatnika Pythona? Podobnie jak w przypadku Bokeh, mocną stroną Plotly jest tworzenie interaktywnych wykresów, ale oferuje on również wykresy, których nie znajdziesz w większości bibliotek, takie jak wykresy konturowe, dendogramy i wykresy 3D.

Created by: Plotly, dostępny w trybie
Gdzie dowiedzieć się więcej: https://plot.ly/python/

Try Plotly in Mode.

geoplotlib

Choropleth (Andrea Cuttone)

geoplotlib to zestaw narzędzi do tworzenia map i wykreślania danych geograficznych. Można go używać do tworzenia różnych typów map, takich jak choroplety, mapy cieplne i mapy gęstości punktów. Musisz mieć zainstalowany Pyglet (zorientowany obiektowo interfejs programowania), aby używać geoplotlib. Niemniej jednak, ponieważ większość bibliotek Pythona do wizualizacji danych nie oferuje map, miło jest mieć bibliotekę poświęconą wyłącznie im.

Created by: Andrea Cuttone
Gdzie dowiedzieć się więcej: https://github.com/andrea-cuttone/geoplotlib

Gleam

Scatter plot with trend line (David Robinson)

Gleam jest inspirowany pakietem Shiny firmy R. Pozwala on na przekształcenie analiz w interaktywne aplikacje internetowe przy użyciu wyłącznie skryptów Pythona, więc nie trzeba znać żadnych innych języków, takich jak HTML, CSS czy JavaScript. Gleam współpracuje z każdą biblioteką Pythona służącą do wizualizacji danych. Po utworzeniu wykresu można zbudować na nim pola, dzięki którym użytkownicy mogą filtrować i sortować dane.

Created by: David Robinson
Gdzie dowiedzieć się więcej: https://github.com/dgrtwo/gleam

missingno

Macierz zerowa (Aleksey Bilogur)

Uporanie się z brakującymi danymi to ból. missingno pozwala szybko ocenić kompletność zbioru danych za pomocą wizualnego podsumowania, zamiast męczyć się z tabelą. Możesz filtrować i sortować dane w oparciu o kompletność lub zauważać korelacje za pomocą mapy ciepła lub dendrogramu.

Created by: Aleksey Bilogur
Gdzie dowiedzieć się więcej: https://github.com/ResidentMario/missingno

Leather

Siatka wykresów ze spójnymi skalami (Christopher Groskopf)

Twórca Leather, Christopher Groskopf, ujmuje to najlepiej: „Leather to biblioteka Pythona do tworzenia wykresów dla tych, którzy potrzebują wykresów teraz i nie obchodzi ich, czy są doskonałe”. Została zaprojektowana do pracy ze wszystkimi typami danych i tworzy wykresy jako SVGs, więc można je skalować bez utraty jakości obrazu. Ponieważ ta biblioteka jest stosunkowo nowa, część dokumentacji jest wciąż w toku. Wykresy, które można tworzyć, są dość podstawowe – ale taki jest zamiar.

Created by: Christopher Groskopf
Gdzie dowiedzieć się więcej: https://leather.readthedocs.io/en/latest/index.html

Inne świetne lektury na temat wizualizacji danych w Pythonie

Istnieje mnóstwo świetnych ocen i przeglądów bibliotek do wizualizacji danych w Pythonie. Sprawdź niektóre z naszych ulubionych:

  • One Chart, Twelve Charting Libraries (Lisa Charlotte Rost)
  • Przegląd narzędzi do wizualizacji w Pythonie (Practical Business Python)
  • Wizualizacja danych w Pythonie: Porównanie 7 narzędzi (Dataquest.io)
Brak doświadczenia w kodowaniu? Nie ma problemu. Naucz się Pythona, korzystając z rzeczywistych danych, dzięki naszemu darmowemu samouczkowi.

Zalecane artykuły

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.