seabornを使用すると、Pythonを使用してデータを可視化することができます。
本記事では、seabornのcatplotによる複数グラフの描画方法について、詳しくご説明します。
seabornとは
seabornは、Pythonを使用してデータを可視化するための外部ライブラリの1つです。
データ可視化用ライブラリは他にも複数あり、その中でも特にMatplotlibが有名です。
seabornはMatplotlibをベースに作られており、Matplotlibの描画機能を利用しています。
seabornの長所は、Matplotlibよりも美しい図を、より少ないコードで簡単に描ける点です。
本記事では、seabornのcatplotによる複数グラフの描画方法をご紹介します。
seabornのインストール
「seaborn」は、以下コマンドを入力することで、インストールすることができます。
コマンドの入力は、コマンドプロンプトあるいはターミナルから行います。
pip install seaborn
動作確認として、試しに以下を入力します。
import seaborn as sns
上記を入力してもエラーが発生しなければ、正常にインストールされています。
catplotによる複数グラフの描画方法
seaborn.catplot()関数を使用することで、ストリッププロットや箱ひげ図など分布グラフの複数グラフを描画することができます。
catplot()関数の引数には、x軸(横軸)の変数、y軸(縦軸)の変数、データセット等を指定します。
データセットの「titanic」を用いて、まずはデフォルトのストリッププロットを作成してみます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
sns.catplot(data=titanic, x="age", y="class")
plt.show()
kindを指定すると、グラフ種を指定することができます。箱ひげ図を描画してみます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
sns.catplot(data=titanic, x="age", y="class", kind="box")
plt.show()
hueを指定すると、カテゴリ別に描画できます。凡例はグラフの外側に描画されます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
sns.catplot(data=titanic, x="age", y="class", hue="sex", kind="boxen")
plt.show()
追加キーワード引数も指定することができます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
sns.catplot(data=titanic, x="age", y="class",
hue="sex", kind="violin", bw=.25, cut=0, split=True)
plt.show()
colを指定すると、列方向に複数のサブプロットを持つ複数グラフを描画できます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
sns.catplot(data=titanic, x="class", y="survived",
col="sex", kind="bar", height=4, aspect=.6)
plt.show()
単一サブプロットの図の場合、さまざまな表現を簡単に階層化できます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
sns.catplot(data=titanic, x="class", y="survived",
col="sex", kind="bar", height=4, aspect=.6)
plt.show()
条件付き関係をプロットするためのマルチプロットグリッドも指定することができます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
titanic = sns.load_dataset("titanic")
# catplotの指定・描画
g = sns.catplot(data=titanic, x="who", y="survived",
col="class", kind="bar", height=4, aspect=.6)
g.set_axis_labels("", "Survival Rate")
g.set_xticklabels(["Men", "Women", "Children"])
g.set_titles("{col_name} {col_var}")
g.set(ylim=(0, 1))
g.despine(left=True)
plt.show()
まとめ
この記事では、seabornのcatplotによる複数グラフの描画方法について、ご説明しました。
本記事を参考に、ぜひ試してみて下さい。
参考
Python学習用おすすめ教材
Pythonの基本を学びたい方向け
統計学基礎を学びたい方向け
Pythonの統計解析を学びたい方向け
おすすめプログラミングスクール
Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。
私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。
現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。
無料体験ができますので、まずは試してみてください!