Vol.28 Originでt検定にトライ!

Originには沢山の統計メニューがあります。その中でも良く使われる仮説検定(t検定)の基本的な一部をご紹介いたします。

1群のt検定

1群のt検定

2群のt検定

2群のt検定

1群のt検定

サンプルデータの平均値が、母平均と等しいかを調べてみましょう。ナットの直径は正規分布に近い形で分布していることが過去の記録から分かっています。

サンプル

製造業者が直径21㎜の高品質なナットを製造するものとします。品質保証部門の担当者が、完成品からランダムに100個のナットを拾い出して、diameter.datという測定結果を得ました。この結果から、設定されている母平均21㎜に一致するかをOriginのt検定で検証してみましょう。

下記のリンクからt検定のサンプルデータをダウンロードしてください。ここでは、diameter.datを使用します。

pdf

ZIP(1KB)


操作手順

  1. Originにdiameter.datをインポートします。
    操作:メニュー「データ」>「ファイルのインポート」>「単一ASCIIファイル」
  2. A列を選択して、メニューの「統計」>「仮設検定」>「t検定(1集団)」を選択してダイアログを開きます。
  3. 次のダイアログが開きます。入力タブ内にある、入力データ形式は「素データ」のままにしてください。
    (入力データ形式の選択肢に「要約データ」があります。既に平均値、SD、サンプルサイズが分かっている場合に利用します。)
  4. 「平均のt検定」タブに移動し、「検定する平均」に21を入力すると、帰無仮説は「平均=21」となります。今回のケースでは、対立仮説は「平均<>21」を選択します。有意水準は一般的な0.05のまま進みます。
  5. 「プロット」タブを開き、ヒストグラムとボックスチャートにチェックを入れます。レポート内にグラフを追加します。
  6. 以上の設定が完了したら「OK」をクリックします。

結果

次の結果レポートが得られます。ナットの直径の平均が有意水準0.05で有意に異なることを示しています。

この結果から、製造工程に何らかの問題があり、有意水準5%では目的とする21㎜のボルトが製造できていないことを、検査を行った担当者は製造にフィードバックすることが出来ます。

2群のt検定

次に、2つの母集団の平均値が等しいか否かを仮説検定してみましょう。

サンプル

このサンプルでは、ある医師が2種類の睡眠薬の効果を検証するために、20人の不眠症患者をランダムに選んで調査しました。20人の半分の10人にはA薬を処方し、他の10人はB薬を処方して、処方後の睡眠時間の増加を記録したデータがtime_raw.datです(一般的には処置群と対照群でこの種の検定は行います。つまり、どちらか一方はプラセボとします)。

2つの薬が患者に与える影響を独立したOriginの2集団のt検定で検証します。

下記のリンクからt検定のサンプルデータをダウンロードしてください。ここでは、time_raw.datを使用します。

pdf

ZIP(1KB)


操作手順

  1. Originにtime_raw.datをインポートします。
    操作:メニュー「データ」>「ファイルのインポート」>「単一ASCIIファイル」
    A列とB列にそれぞれ十人分のデータがあります。
  2. A列とB列の両方を選択して、メニューの「統計」>「仮設検定」>「t検定(2集団)」を選択してダイアログを開きます。
  3. 次のダイアログが開きます。今回のケースでは、2つの集団データが2列に存在しているので、「入力」タブの入力データ形式は「素データ」にします。「インデックス」はデータ範囲の1列と、そのグループを分けるグループ範囲の1列が別々にある場合に選択できます。「要約データ」は前出の通り。
  4. 「平均のt検定」タブに移動し、「検定する平均」は0のままにし、帰無仮説を「平均1-平均2=0」にします。今回のケースでは、対立仮説は「平均1-平均2<>0」を選択します。有意水準は一般的な0.05のまま進みます。
  5. 「プロット」タブを開き、ヒストグラムとボックスチャートにチェックを入れます。レポート内にグラフを追加します。
  6. 以上の設定が完了したら「OK」をクリックします。

結果

次の結果レポートが得られます。

2群のt検定を行う場合、事前に「等分散性」を確認するのが一般的です。等分散ならそのままt検定を行い、分散が等しくない場合は「ウェルチのt検定」を行います。Originは2群のt検定を行う際、結果画面に通常のt検定とウェルチのt検定の結果を自動的に出力します。

有意水準0.05のレベルでは、等分散を仮定する場合、等分散を仮定しない場合(ウェルチのt検定)のどちらも、2つのデータの平均値の差(平均1-平均2=0)には有意な差が無いことを示しています。。

この結果から、検証を行った医師は2つのデータの平均値は統計的に異ならない、という見解を得ることが出来ます。単純に平均値だけ比較すると、A列が2.35に対してB列は0.75なので、平均値は全然違うのですが、サンプルサイズが小さく、標準誤差が大きいため、「統計的に」平均値は一緒という判定になります。

統計は難しいけど面白いですね!他にも、Originの仮説検定メニューには、対応がある検定や分散検定などがありますので是非お試しください。

テクニカルサポート

ご不明な点がございましたら、お気軽にお問合せフォームよりテクニカルサポートまでご連絡ください。

その際、必ず「製品名」「バージョン」「シリアル番号」をご連絡ください。

page_top_icon