相関ヒートマップ
テーブルに含まれる複数の変数間の相関関係を計算し、その結果をヒートマップとして可視化します。 相関ヒートマップは、どの変数が互いに強く関連しているか(または関連していないか)を一覧するのに役立ちます。
操作デモ動画
以下の動画で、相関ヒートマップの作成方法をご確認いただけます。
操作方法
-
処理タイプ>可視化、グラフタイプ>相関ヒートマップ を選択します。
-
相関を計算したい列を 「変数」 で選択します。
計算される相関指標について選択された変数の組み合わせ(数値型かカテゴリ型か)によって、自動的に異なる相関指標が計算されます。
-
数値列 vs 数値列: 相関係数(ピアソン) または 順位相関係数(スピアマン)
-
相関係数(ピアソン) 2つの変数の間にどれくらい直線的な関係があるかを示す指標で、-1から1の間の値をとります。
- +1に近い(赤色系): 強い正の相関 (一方が増えるともう一方も増える)
- -1に近い(青色系): 強い負の相関 (一方が増えるともう一方は減る)
- 0に近い(白色系): ほぼ相関なし
-
順位相関係数(スピアマン) 2つの変数を順位に変換してから相関を計算する指標で、-1から1の間の値をとります。
- 特徴: 外れ値の影響を受けにくく、直線的な関係でなくても「一方が増えれば、もう一方も増える(または減る)」という単調な関係を捉えることができます。
-
-
数値列 vs カテゴリ列: 相関比 (η) カテゴリ(グループ)によって、数値の平均値がどれだけ異なるか(ばらついているか)を示す指標で、0から1の間の値をとります。
- 1に近い: カテゴリ間の平均値の差が大きい(カテゴリが数値の予測に役立つ)。
- 0に近い: カテゴリ間の平均値にほとんど差がない(関連が薄い)。
-
カテゴリ列 vs カテゴリ列: クラメールのV (V) 2つのカテゴリ変数の間にどれくらいの関連性があるかを示す指標で、0から1の間の値をとります。 _ 1に近い: 2つのカテゴリ間に強い関連性がある(一方のカテゴリが分かれば、もう一方のカテゴリが強く予測できる)。 _ 0に近い: 2つのカテゴリはほぼ独立しており、関連性が薄い。
-
-
「プロットを更新」 をクリックします。
-
実行が完了すると、プロットエリア左に相関ヒートマップ・右に散布図がプロットされます。 ヒートマップ上のセルをクリックすると、その変数ペアの散布図に切り替わります。これにより、相関の強さと実際のデータ分布を同時に確認できます。
散布図確認の重要性少数の外れ値によって、相関係数が実態よりも大きく/小さく計算されることがあります。 そのため、散布図の分布を確認することが重要です。
相関関係は因果関係を意味しない相関ヒートマップは、あくまで「2つの変数が連動して動いている」ことを示すものであり、「一方がもう一方の原因である」ことを直接示すものではありません(疑似相関の可能性があります)。 解釈には注意が必要です。
オプション設定
グラフの層別
カテゴリ列(例: 「系列」 「銘柄」など)を指定すると、そのカテゴリのグループごとに個別の相関ヒートマップが作成されます。

ヒートマップの設定
-
数値列同士の相関係数計算方法を指定できます。
-
係数を表示 ボタンで相関ヒートマップ上に相関係数の値を表示するか選択できます。

-
相関係数を選ぶ時:
- 関係性が直線的(散布図がまっすぐ)に見える場合。
- データに外れ値(異常値)がない、または少ない場合。
- データが正規分布に近い場合。
-
順位相関係数を選ぶ時:
- データに外れ値が含まれる場合。
- 関係性が単調(一貫して増加または減少)だが、曲線的な場合。
- データが正規分布に従わない場合。
散布図の設定
-
散布図のプロットカラー・サイズ・透明度を指定できます。
-
プロット点を散らすボタンでジッターの設定ができます。ジッターとは、カテゴリカル変数のプロット点の重なりを防ぐために、プロット位置を意図的に散らして可視化する機能です。

ホバー設定
散布図にホバーした時に表示される項目の選択ができます。
デフォルトでは散布X、Y軸の2変数が指定されています。

相関係数テーブルのダウンロード
相関係数をまとめた相関行列をcsvでダウンロードすることができます。
