plotly.express 複数の散布図を一気に描く方法(scatter_matrix)

Python

plotly.expressを使用して、エネルギーデータの散布図を描く方法をご紹介します。今回は、電力量とガス量、熱源出口温度、熱源入口温度をそれぞれx,yとして一気にすべての散布図を描きます。

メリット
  • エクセルと異なり、すべてのデータを一気に可視化できる。
  • 表示されたグラフを連動して動かす(拡大・縮小)ことができる。
  • 描画が手軽にできるにできるため作業時間の大幅削減が可能

使用するエネルギーデータ

今回は、こちらのデータを使用します。

使用データ

plotly.expressで多次元散布図(scatter_matrix)を作成する

SampleCode

  1. ライブラリをimportする
  2. csvファイルを読み込んでデータフレームにする
  3. px.scatter_matrixで散布図を描画する
# ライブラリのimport
import pandas as pd
import plotly.express as px

#csvファイルの読み込み
df = pd.read_csv('./sample.csv',encoding='shift-jis',index_col=[0],parse_dates=[0])

# データフレームを1日毎のデータにリサンプリングする
df_d = df.resample('d').mean()

# plotly.expressで散布図の描画
# 今回は、x='電力量',y='ガス量',z='熱源出口温度'としました
# colorには、タイムスタンプを月毎の数値で表したものを指定しています。
px.scatter_matrix(data_frame=df_d)
項目説明
data_frameデータフレームの指定します。(今回は、df_d)

TIPS:年月日ごとにプロットの色を変更する

colorを指定するだけで、簡単に色分けすることができます。今回は、データフレームのindexをyyyy/mm別に色分けしたいと思います。

px.scatter_matrix(data_frame=df_d,color=df_d.index.strftime("%Y/%m"))
項目説明
data_frameデータフレームの指定します。(今回は、df_d)
colorcolorに指定するカラムを指定します。(今回は、「タイムスタンプの月」)

コメント

タイトルとURLをコピーしました