メインコンテンツまでスキップ

主成分分析(PCA)

多変量データを主成分に変換し、バイプロット・寄与率・主成分負荷量を可視化できます。
データの構造や変数間の関係を把握するのに役立ちます。

操作デモ動画

以下の動画で、操作方法をご確認いただけます。

操作方法

処理タイプ>分析タイプ>主成分分析(PCA) を選択します。

グラフタイプの選択

基本設定

注記

以下の説明では、サンプルデータ「医薬品の有効成分」を使用しています。

  1. 分析する変数 を選択します。数値列から複数選択できます。

    分析する変数の選択
  2. 必要に応じて カラー基準 を設定します。数値型・カテゴリ型のどちらも指定できます。

    カラー基準の設定
    カラー詳細設定

    カラー基準列の右にある設定ボタンから、カラーの詳細設定ができます。

    • 数値型の場合:カラーパレット・カラーレンジ(最小値・最大値)を設定できます。
    • カテゴリ型の場合:クラスごとにカラーと透明度を設定できます。
  3. 必要に応じて シェイプ基準 を設定します。カテゴリ列を指定できます。

    シェイプ基準の設定
    シェイプ詳細設定

    シェイプ基準列の右にある設定ボタンから、クラスごとにマーカーの形状を設定できます。
    選択できる形状は●、■、▲、+、×、★です。

    オプションの設定
    オプションの設定
    • バイプロットに主成分負荷量を表示:バイプロット上に各変数の主成分負荷量ベクトルを矢印で表示します。
    • 主成分得点をテーブルに追加:PC1・PC2・・・の列として主成分得点をテーブルに追加します。
  4. プロット ボタンを押して解析を実行します。

プロットボタン

結果の見方

解析結果(バイプロット・寄与率グラフ・主成分負荷量テーブル)
バイプロット(左)
バイプロット
  • サンプルを主成分空間に射影した散布図です。点どうしが近いほど、特徴が似ていると解釈します。
  • X軸・Y軸のドロップダウンで、表示する主成分(PC1, PC2, ...)の組み合わせを切り替えられます。
  • カラー基準が数値型の場合は連続カラースケール、カテゴリ型の場合はカテゴリ別の色で表示されます。
  • 「主成分負荷量を表示」を有効にした場合、黒いベクトルで各変数の寄与方向を確認できます。
    • 向き:どの方向に値が大きくなる変数かを示します。ベクトルの向きにあるサンプルほど、その変数の値が高い傾向です。
    • 長さ:表示中の2軸(例: PC1-PC2)に対する寄与の強さの目安です。長いほど、その平面での説明力が大きいと解釈します。
    • 軸との関係:横方向に近いベクトルはX軸側の主成分への寄与が強く、縦方向に近いベクトルはY軸側の主成分への寄与が強いことを示します。
    • ベクトル同士の角度:角度が小さいほど正の相関、180度に近いほど負の相関、90度前後なら相関が弱い(またはほぼ無い)と解釈できます。
    • サンプル点との位置関係:ある点をベクトル方向へ射影したときに先端側へ大きく伸びるほど、その変数の寄与を強く受けていると考えられます。
寄与率グラフ(右上)
寄与率グラフ
  • 棒グラフは各主成分の寄与率、折れ線は累積寄与率を示します。
  • 寄与率は「その主成分が全体分散をどれだけ説明するか」の割合です。
  • 累積寄与率が高いほど、少ない主成分で元データの情報を保てていると判断できます。
  • 一般的には、累積寄与率が 80〜90% 程度に達する主成分数が次元圧縮の目安です。
主成分負荷量テーブル(下)
主成分負荷量テーブル
  • 行は説明変数、列は主成分(PC1, PC2, ...)です。
  • 値(負荷量)の絶対値が大きいほど、その変数が該当主成分の軸を強く特徴づけています。
  • 正負の符号は寄与方向を示します(正側に効くか、負側に効くか)。
  • バイプロット上の変数ベクトルと併せて見ると、主成分の意味づけがしやすくなります。
    • 列方向に見る(PCごとの解釈):その主成分を構成している主要変数を把握したいときに使います。 例: PC1 列で絶対値が大きい変数(培養液濃度、培養時間、培養液温度)を見ると、PC1 がどんな軸かを解釈できます。
    • 行方向に見る(変数ごとの寄与先):その変数がどの主成分に強く効いているかを確認したいときに使います。 例: 「培養液PH」行では PC2 の絶対値が大きいので、この変数は PC2 の解釈に効いていると読めます。
    • 符号の読み方:同じ主成分内で符号が同じ変数どうしは同方向、符号が逆の変数どうしは逆方向に作用します。
    • 実務では、まず列方向で主成分の意味づけを行い、次に行方向で重要変数の寄与先を確認する順序が分かりやすいです。
実務での使い方(カラー基準と併用)
  • PCAで「どの変数がどの主成分に寄与しているか」を見る目的は、主成分軸に現場の意味を与えることです。
  • 目的変数や品質指標をカラー基準にすると、色の変化方向と同方向のベクトルから「効いていそうな変数」の仮説を立てやすくなります。
  • この解釈は因果の証明ではなく、関連の強さ・方向の把握です。確証が必要な場合は回帰分析(線形回帰/PLS/ロジスティック回帰)で確認してください。