Origin: 動画で学ぶ操作方法

主成分分析(Principal Component Analysis)

概要 OriginPRO8.6から搭載された、主成分分析(PCA)の実行方法を紹介します。
  OriginサンプルファイルSamples\Statistics\Protein Consumption in Europe.datを使用

YouTube

右下の拡大ボタンボタンで画面を大きくし、で解像度720の設定にしてご覧いただくことをお勧めします。

操作方法

  1. OriginサンプルファイルSamples\Statistics\Protein Consumption in Europe.datをインポートします。
  2. このワークシートにはヨーロッパ25か国における9種類の食品群ごとの消費量データが入力されています。このデータで主成分分析を実行します。
  3. まず、ワークシート全体を選択します。「統計」メニューから「多変量分析」、「主成分分析」を選択します。このダイアログでは、主成分分析を実行する際の設定や、計算する値などを変更できます。ここでは、デフォルトのまま「OK」ボタンを押します。
  4. 元データがあるワークブック内、レポートシートが出力されます。「相関行列の固有値」の表と「スクリ―プロット」を参照し、どの主成分までを解析対象にするか決定します。
  5. 表の上から4つの主成分データの「分散の割合」(寄与率)を足し合わせると、85%となり、さらに残りの成分はそれぞれ5%程度かそれ以下であることがわかります。このことから、第4主成分までを解析対象とすると良いことがわかります。
  6. スクロールしてレポートシートの中間をみてみると、「スクリ―プロット」があり、ダブルクリックすると、グラフウィンドウとして開けます。スクリープロットとは、抽出された各因子が全体をどのくらい説明することができるのか、折れ線グラフで示したものです。
  7. スクリ―プロットを参照して、解析対象を視覚的に判断できます。4番目のプロットをみると、固有値が1を切っていることがわかるので、ここまでを解析対象とすればいい(カイザー基準)ことがわかりました。
  8. これらの結果をもとに再度、主成分分析を実行します。
  9. グラフウィンドウを閉じ、レポートシートに戻ります。レポートシート左上の鍵のアイコンをクリックして「パラメータの変更」を選択し、主成分分析のダイアログを開きます。
  10. 「抽出する成分の数」に4を入力します。「OK」ボタンをクリックして、レポートシートを更新します。
  11. 「期待固有ベクトル」(抽出された主成分の得点係数)の表では、各食品群が主成分にどのような影響を受けているか示しています。
  12. PC1の中で大きな係数を示しているのは、動物性たんぱく質を含む食物が中心です。PC2では、魚や野菜などが多きい係数を示しています。PC3とPC4については、係数にあまり変化が見られません。
  13. 次に「プロットのローディング」をダブルクリックで表示します。これは先ほどの係数をもとにグラフ化したものです。X軸はPC1、Y軸はPC2です。
  14. 「バイプロット」をダブルクリックして表示させます。このグラフでは、元データの25カ国の主成分スコアをプロットしたものが散布図として表示されています。
  15. プロットをダブルクリックし、「作図の詳細」ダイアログを開きます。「ラベル」タブを開き、「有効にする」にチェックを付け、「ラベル形式」でCountryを選択し、プロットに国の名称のラベルを付けます。「OK」ボタンを押すとラベル付けされます。
  16. フォントサイズを変更します。ラベルをダブルクリックして「作図の詳細」ダイアログを再度開き、「ラベル」タブの「サイズ」で、フォントサイズを小さくします。
  17. この散布図から、西ヨーロッパでは動物性たんぱく質を多く摂取していることがわかり、スペインやポルトガルでは魚や野菜などが多く、東ヨーロッパではシリアルやナッツなどの植物性タンパク質を多いことがわかります。

以上でこのチュートリアルは終了です。お疲れ様でした。

統計のTOP

すべての動画リスト

page_top_icon