多変量解析 (Pro版のみ)

多変量解析は、1つ以上の変数を持つデータの分析に使用されます。これは、変数間での関連を調べ、それらを組み合わせて複数の観測例を区別するために使用されます。
多変量解析では以下のことを行えます。

  • データ削減や構造の単純化
  • 大きな多変量データセットを削減し、基本的な線形構造で説明します。そして、明らかになっていないあるいは、予想もしていなかった関係性を発見します。

  • 分類
  • 測定された特性に基づき、似たようなオブジェクトや変数のグループを作成します。

  • 予測
  • 識別子を取得し、新しい観測値が何に分類されるか予測するために使用します。

OriginProでは、以下の多変量解析の手法を利用できます。
※通常版のOriginでは多変量解析の機能は使用できません。

 

主成分分析

主成分分析(PCA)は線形の組み合わせから、ある値のセットの分散―共分散の構造を説明するために使用されます。そのため、PCAは次元を減らすためのテクニックとして使用されます。

  • データ削減
  • 多変量のデータの情報を、できるだけ少ない情報の損失で、少数個の合成変数に縮約して、分析を行うことができます。

  • 解釈
  • 大きなデータセットの重要な要素を発見するのに使用できます。以前は見つからなかった関係性を明らかにし、その結果、一般的には結論付けられないような解釈が可能です。PCAは、別の方法で分析をする際に入力変数が大きすぎる場合、データ解析における中間ステップとして使用されます。

Originの主成分分析では、以下の項目を出力できます。

  • 記述統計
  • 相関行列
  • 相関行列の固有値
  • 固有ベクトル
  • 各観測値のスコア
  • グラフ(スクリ―プロット、ローディングプロット、バイプロット)

クラスター分析

クラスター分析は、性質の異なる大きなデータセットを似たような特性を持った小さなグループ(クラスター)に要約します。大きな変数や観測値がある場合にその関係性を見つける際の効果的な分析手法です。

Originは、以下2通りのクラスター分析を提供しています。

  • K-Means法クラスター分析
  • K-Means法クラスター分析では、K個のクラスターを使用して観測値を分類します。この方法では、データとクラスターの中心との距離を最小になるようにします。K-Means法分析はクラスター分析の中では簡単なアルゴリズムの使用する方法なので、階層的クラスター分析よりも早く分析が可能です。
    一般に、サンプルサイズが100を超える場合にK-means法を使用します。しかし、この方法の場合、クラスターの数または観測値の中心が分かっていることを前提としています。

  • 階層的クラスター分析
  • この方法では、各要素がその類似性や距離の程度によって段階的に分類されます。クラスターの数は、樹形図から決定することができます。
    階層的クラスター分析は変数、観測値(カテゴリデータ)、連続変数を分析するのに適していますが、K-Means法に比べて解析に時間がかかります。

    K-Means法クラスター分析

    K-Means法クラスター分析

    階層的クラスター分析

    階層的クラスター分析

 

判別分析

判別分析は、明確な違いがある観測値を識別し、新たな観測データを既存のグループに分類するために使用されます。この方法は生物学の種の分類や、医学分野における腫瘍の分類、顔認識のテクノロジー、クレジットカードや保険業界でリスクを割り出すのに使用されます。

判別分析を行う場合、2つの大きな目的があります。

  • 識別
  • 既に分類のわかっている全ての観測データを使用して分類子を組み立てる

  • 分類
  • 分類子を使用してグループ分けされていないデータを分類する

部分最小二乗(PLS, Partial Least Squares Regression)

高い共線性のある要因が多くある時の予測モデルを構築するために使用されます。

page_top_icon