PR

【Python】カーネル密度推定グラフの描画方法|seaborn基礎

カーネル密度推定グラフの描画方法|seaborn基礎_アイキャッチ プログラミング

※ 当サイトはアフィリエイト広告を利用しています。

levtech-ad
スポンサーリンク

seabornを使用すると、Pythonを使用してデータを可視化することができます。

本記事では、seabornによるカーネル密度推定グラフの描画方法について、詳しくご説明します。

こんな人に読んでほしい
  • Pythonを使用したデータの可視化方法を知りたい人
  • seabornによるカーネル密度推定グラフの描画方法を知りたい人
levtech-ad

seabornとは

seabornは、Pythonを使用してデータを可視化するための外部ライブラリの1つです。

データ可視化用ライブラリは他にも複数あり、その中でも特にMatplotlibが有名です。

seabornはMatplotlibをベースに作られており、Matplotlibの描画機能を利用しています。

seabornの長所は、Matplotlibよりも美しい図を、より少ないコードで簡単に描ける点です。

本記事では、seabornによるカーネル密度推定グラフの描画方法をご紹介します。

seabornのインストール

「seaborn」は、以下コマンドを入力することで、インストールすることができます。

コマンドの入力は、コマンドプロンプトあるいはターミナルから行います。

pip install seaborn

動作確認として、試しに以下を入力します。

import seaborn as sns

上記を入力してもエラーが発生しなければ、正常にインストールされています。

カーネル密度推定グラフの描画方法

seaborn.kdeplot()関数を使用することで、カーネル密度推定グラフを描画することができます。

カーネル密度推定グラフとは、ノンパラメトリックに推定された確率密度関数グラフの1つです。

kdeplot()関数の引数には、x軸(横軸)の変数、y軸(縦軸)の変数、データセット等を指定します。

データセットの「tips」を用いて、カーネル密度推定グラフを作成してみます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill")
plt.show()
カーネル密度推定グラフの描画(seaborn_tips)

y軸に指定すると、以下のようになります。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, y="total_bill")
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_y)

bw_adjustを指定すると、スムージング処理を調整することができます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", bw_adjust=.2)
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_bw_adjust=.2)

cutを指定することで、データ制限を指定することができます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", bw_adjust=5, cut=0)
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_cut=0)

hueを指定することで、カテゴリ別に描画することができます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", hue="time")
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_hue="time")

multipleを指定することで、レイヤーの描画方法を指定することができます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", hue="time", multiple="stack")
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_hue="time"_multiple="stack")

multiple=”fill”を指定すると、以下のような描画になります。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", hue="time", multiple="fill")
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_hue="time"_multiple="fill")

cumulative=Trueを指定することで、累積分布関数を推定することができます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", hue="time",
            cumulative=True, common_norm=False, common_grid=True)
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_hue="time"_cumulative=True)

paletteでパレット色、alphaで透明度、linewidthで線の太さをそれぞれ指定することができます。

#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# カーネル密度推定グラフの指定・描画
sns.kdeplot(data=tips, x="total_bill", hue="size", fill=True, 
            common_norm=False, palette="bright", alpha=.5, linewidth=0)
plt.show()
カーネル密度推定グラフの描画(seaborn_tips_hue="size"_palette="brigh"_talpha=.5_linewidth=0)

まとめ

この記事では、seabornによるカーネル密度推定グラフの描画方法について、ご説明しました。

本記事を参考に、ぜひ試してみて下さい。

参考

Python学習用おすすめ教材

Pythonの基本を学びたい方向け

統計学基礎を学びたい方向け

Pythonの統計解析を学びたい方向け

おすすめプログラミングスクール

Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。

私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。

現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。

無料体験ができますので、まずは試してみてください!

\まずは無料体験!/
スポンサーリンク
タイトルとURLをコピーしました