Open In Colab

Plotly Expressによるデータの可視化#

Ploty Expressはインタラクティブな可視化を簡潔なコードで実装できます。pandasのDataFrameに対応しており、関数の引数に列名を渡すだけでさまざまなグラフが描画できます。

本節ではサンプルデータとして、 Gapminder のデータを利用します。

import pandas as pd
import plotly.express as px

gapminder = px.data.gapminder()
gapminder.head()
country continent year lifeExp pop gdpPercap iso_alpha iso_num
0 Afghanistan Asia 1952 28.801 8425333 779.445314 AFG 4
1 Afghanistan Asia 1957 30.332 9240934 820.853030 AFG 4
2 Afghanistan Asia 1962 31.997 10267083 853.100710 AFG 4
3 Afghanistan Asia 1967 34.020 11537966 836.197138 AFG 4
4 Afghanistan Asia 1972 36.088 13079460 739.981106 AFG 4
gapminder_2007 = gapminder.groupby("year").get_group(2007).sort_values("pop", ascending=False)

散布図#

散布図は横軸と縦軸にそれぞれ別の変数をとり、データが当てはまるところに点を描画するグラフです。2つの変数に関係があるかを確認するために利用されます。

散布図を描画するには scatter 関数の第1引数にDataFrame、引数 x にX値、引数 y にY値を渡します

px.scatter(gapminder_2007, x="gdpPercap", y="lifeExp", log_x=True, hover_name="country")