seabornを使用すると、Pythonを使用してデータを可視化することができます。
本記事では、seabornによるヒートマップの描画方法について、詳しくご説明します。
seabornとは
seabornは、Pythonを使用してデータを可視化するための外部ライブラリの1つです。
データ可視化用ライブラリは他にも複数あり、その中でも特にMatplotlibが有名です。
seabornはMatplotlibをベースに作られており、Matplotlibの描画機能を利用しています。
seabornの長所は、Matplotlibよりも美しい図を、より少ないコードで簡単に描ける点です。
本記事では、seabornによるヒートマップの描画方法をご紹介します。
seabornのインストール
「seaborn」は、以下コマンドを入力することで、インストールすることができます。
コマンドの入力は、コマンドプロンプトあるいはターミナルから行います。
pip install seaborn
動作確認として、試しに以下を入力します。
import seaborn as sns
上記を入力してもエラーが発生しなければ、正常にインストールされています。
ヒートマップの描画方法
seaborn.heatmap()関数を使用することで、ヒートマップを描画することができます。
ヒートマップは、2次元データの1つ1つの値を色や濃淡として表現したグラフです。
heatmap()関数の引数には、pivot()で変換した行列データを指定します。
データセットの「flights」を用いて、ヒートマップを作成してみます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
flights = sns.load_dataset("flights")
flights = flights.pivot(index='month', columns='year', values='passengers')
# ヒートマップの指定・描画
sns.heatmap(flights)
plt.show()
cmapを指定することで、ヒートマップの色を変更することができます。
鮮やかな「rainbow」を指定してみます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
flights = sns.load_dataset("flights")
flights = flights.pivot(index='month', columns='year', values='passengers')
# ヒートマップの指定・描画
sns.heatmap(flights, cmap="rainbow")
plt.show()
annot=Trueを指定することで、各セルの値を表示することができます。
またfmtで数値の表示形式を指定できます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
flights = sns.load_dataset("flights")
flights = flights.pivot(index='month', columns='year', values='passengers')
# ヒートマップの指定・描画
sns.heatmap(flights, cmap="rainbow", annot=True, fmt='d')
plt.show()
linewidthを指定することで、セル同士の間隔を指定する(セルを切り離す)ことが出来ます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
flights = sns.load_dataset("flights")
flights = flights.pivot(index='month', columns='year', values='passengers')
# ヒートマップの指定・描画
sns.heatmap(flights, cmap="rainbow", annot=True, fmt='d', linewidths=3)
plt.show()
vmaxとvminを指定することで、最大と最小の閾値を指定できます。
#input
import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# データセットの読み込み
flights = sns.load_dataset("flights")
flights = flights.pivot(index='month', columns='year', values='passengers')
# ヒートマップの指定・描画
sns.heatmap(flights, cmap="rainbow", annot=True, fmt='d', linewidths=3,
vmin=200, vmax=400)
plt.show()
まとめ
この記事では、seabornによるヒートマップの描画方法について、ご説明しました。
本記事を参考に、ぜひ試してみて下さい。
参考
Python学習用おすすめ教材
Pythonの基本を学びたい方向け
統計学基礎を学びたい方向け
Pythonの統計解析を学びたい方向け
おすすめプログラミングスクール
Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。
私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。
現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。
無料体験ができますので、まずは試してみてください!