Plotly Expressによるデータの可視化
Contents
Plotly Expressによるデータの可視化#
Ploty Expressはインタラクティブな可視化を簡潔なコードで実装できます。pandasのDataFrameに対応しており、関数の引数に列名を渡すだけでさまざまなグラフが描画できます。
本節ではサンプルデータとして、 Gapminder のデータを利用します。
import pandas as pd
import plotly.express as px
gapminder = px.data.gapminder()
gapminder.head()
country | continent | year | lifeExp | pop | gdpPercap | iso_alpha | iso_num | |
---|---|---|---|---|---|---|---|---|
0 | Afghanistan | Asia | 1952 | 28.801 | 8425333 | 779.445314 | AFG | 4 |
1 | Afghanistan | Asia | 1957 | 30.332 | 9240934 | 820.853030 | AFG | 4 |
2 | Afghanistan | Asia | 1962 | 31.997 | 10267083 | 853.100710 | AFG | 4 |
3 | Afghanistan | Asia | 1967 | 34.020 | 11537966 | 836.197138 | AFG | 4 |
4 | Afghanistan | Asia | 1972 | 36.088 | 13079460 | 739.981106 | AFG | 4 |
gapminder_2007 = gapminder.groupby("year").get_group(2007).sort_values("pop", ascending=False)
散布図#
散布図は横軸と縦軸にそれぞれ別の変数をとり、データが当てはまるところに点を描画するグラフです。2つの変数に関係があるかを確認するために利用されます。
散布図を描画するには scatter
関数の第1引数にDataFrame、引数 x
にX値、引数 y
にY値を渡します
px.scatter(gapminder_2007, x="gdpPercap", y="lifeExp", log_x=True, hover_name="country")