seabornを使用すると、Pythonを使用してデータを可視化することができます。
本記事では、seabornのrelplotによる複数グラフの描画方法について、詳しくご説明します。
seabornとは
seabornは、Pythonを使用してデータを可視化するための外部ライブラリの1つです。
データ可視化用ライブラリは他にも複数あり、その中でも特にMatplotlibが有名です。
seabornはMatplotlibをベースに作られており、Matplotlibの描画機能を利用しています。
seabornの長所は、Matplotlibよりも美しい図を、より少ないコードで簡単に描ける点です。
本記事では、seabornのrelplotによる複数グラフの描画方法をご紹介します。
seabornのインストール
「seaborn」は、以下コマンドを入力することで、インストールすることができます。
コマンドの入力は、コマンドプロンプトあるいはターミナルから行います。
pip install seaborn
動作確認として、試しに以下を入力します。
import seaborn as sns
上記を入力してもエラーが発生しなければ、正常にインストールされています。
relplotによる複数グラフの描画方法
seaborn.relplot()関数を使用することで、散布図と折れ線グラフの複数グラフを描画することができます。
relplot()関数の引数には、x軸(横軸)の変数、y軸(縦軸)の変数、データセット等を指定します。
データセットの「tips」を用いて、まずは散布図を作成してみます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
tips = sns.load_dataset("tips")
# relplotの指定・描画
sns.relplot(data=tips, x="total_bill", y="tip", hue="day")
plt.show()
colを指定すると、列方向に複数のサブプロットを持つ複数グラフを描画できます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
tips = sns.load_dataset("tips")
# relplotの指定・描画
sns.relplot(data=tips, x="total_bill", y="tip", hue="day", col="time")
plt.show()
rowを指定すると、行方向に複数のサブプロットを持つ複数グラフを描画できます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
tips = sns.load_dataset("tips")
# relplotの指定・描画
sns.relplot(data=tips, x="total_bill", y="tip", hue="day", row="sex")
plt.show()
colの指定変数が多い場合、col_wrapを指定することで複数行での描画を指定することができます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
tips = sns.load_dataset("tips")
# relplotの指定・描画
sns.relplot(data=tips, x="total_bill", y="tip", hue="time", col="day", col_wrap=2)
plt.show()
sizeやstyleを指定することで、視覚的に比較しやすいグラフを描画することができます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
tips = sns.load_dataset("tips")
# relplotの指定・描画
sns.relplot(data=tips, x="total_bill", y="tip", col="time",
hue="time", size="size", style="sex",
palette=["b", "r"], sizes=(10, 100))
plt.show()
連続性のあるデータでは折れ線グラフによる描画が適しています。
データセットの「fmri」を用いて、折れ線グラフの複数グラフを作成してみます。
kind=”line”を指定することで折れ線グラフを描画します。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
fmri = sns.load_dataset("fmri")
# relplotの指定・描画
sns.relplot(data=fmri, x="timepoint", y="signal", col="region",
hue="event", style="event", kind="line")
plt.show()
heightやaspectを指定することで、グラフの高さやアスペクト比を指定することができます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
fmri = sns.load_dataset("fmri")
# relplotの指定・描画
sns.relplot(data=fmri, x="timepoint", y="signal",
hue="event", style="event", col="region",
height=4, aspect=.7, kind="line")
plt.show()
relplot().mapを指定することで、タイトルやラベルなどを指定することができます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
fmri = sns.load_dataset("fmri")
# relplotの指定・描画
g = sns.relplot(data=fmri, x="timepoint", y="signal",
hue="event", style="event", col="region",
height=4, aspect=.7, kind="line")
(g.map(plt.axhline, y=0, color=".7", dashes=(2, 1), zorder=0)
.set_axis_labels("Timepoint", "Percent signal change")
.set_titles("Region: {col_name} cortex")
.tight_layout(w_pad=0))
plt.show()
まとめ
この記事では、seabornのrelplotによる複数グラフの描画方法について、ご説明しました。
本記事を参考に、ぜひ試してみて下さい。
参考
Python学習用おすすめ教材
Pythonの基本を学びたい方向け
統計学基礎を学びたい方向け
Pythonの統計解析を学びたい方向け
おすすめプログラミングスクール
Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。
私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。
現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。
無料体験ができますので、まずは試してみてください!