ベイズ分析

Stataは、マルコフ連鎖モンテカルロ法（MCMC）を利用したベイズ回帰モデルの推定をサポートしています。モデル作成においては予め用意された豊富な分布関数を利用することもできますし、独自の関数を定義して利用することも可能です。

収束計算の診断: MCMCによる推定結果はマルコフチェーンが収束した場合に評価が可能です。Stataには複数のチェーンを同時にグラフで比較検討したり、Gelman-Rubinによる収束診断を実行する機能が用意されています。
信用区間: モデルパラメータやそのパラメータから構築される関数について信用区間や事後分布の平均推定値を求めることが可能です。
仮説検定: 区間およびモデルベースの仮説検定をサポート。推定したモデルの選択には、ベイズ・ファクターが可能です。

Stataではじめるベイズ統計ウェビナーのご案内

ライトストーンでは、どなたでも無料でご視聴いただけるウェビナーを開催中です。
「Stataではじめるベイズ統計ウェビナー」では、実際にStataを一緒に操作しながらその機能をコンパクトに紹介します。
詳しくはStataウェビナーページをご覧ください。

Stataウェビナー

ウェビナーアーカイブ動画

複数チェーンと予測

複数チェーン

マルコフチェーンの計算が収束した場合に限りMCMC(マルコフチェーンモンテカルロ)法によるベイズ推定の結果は適切であると考えることができます。収束状態を判断する方法の一つとしてシミュレーションで複数のチェーンを比較するという方法があります。
Stata 16以降のバージョンではbayes:プリフィックスとbayesmhコマンドのnchains()オプションを使用できます。

具体的な使用例

例えば次のように入力します。
. bayes, nchains(4): regress y x1 x2

このコマンドにより4つのチェーンが作成されます。
この4つのチェーンを組み合わせてより高精度な推定結果を求める事も可能ですが、それらのチェーンを視覚的に比較して収束状況を確認します。
収束の確認にはGelman–Rubinの診断法が利用できます。
複数チェーンのシミュレーションを実行したあとでbayes: regress など、いくつかの推定コマンドを実行すると、この診断結果も報告されます。
収束しない事に関心がある場合はbayesstats grubin コマンドを利用します。
これはモデルに含まれる各パラメータに対して個別にGelman–Rubinの診断を実行します。

ベイズ予測

ベイズ予測とは事後予測分布を利用してシミュレーションを行うものです。この手法はモデルのフィットを吟味し、アウトオブサンプルの予測に適しています。

bayesmhコマンドでモデルをフィットした場合、bayespredict コマンドを利用することでシミュレーションの予測値やその関数を計算し、それらを新たなデータセットとして保存できます。
例えば次のように入力します。

具体的な使用例

例えば次のように入力します。

. bayespredict (ymin:@min({_ysim})) (ymax:@max({_ysim})), saving(yminmax)

このコマンドはシミュレーションした値の最大/最小値を求めます。この他にも予測値の要約統計量を調べる場合にbayesgraphなどの推定後に利用するコマンド群が用意されています。

bayespredictコマンドは数千個のシミュレーション値から新たなデータセットを作成します。
もちろん、全てのシミュレーション値が必ずしも必要とは限りません。
そのようなケースでは事後分布による要約統計量として平均や中央値などをbayespredict, pmean, bayespredict, pmedianといったコマンドで求めることができます。
また、シミュレーション値からのランンダムサンプリングもサポートしています。

モデルの適合度を評価する場合には、事後分布による予測p値(PPP/ベイズ予測p値)を利用します。
PPPは観測値とシミュレーション値の一致度を計測する指標であり、新しいコマンドbayesstats ppvaluesを用いて求めます。

さらに詳しくは無料ウェビナー／分析機能例題集で！

Stataウェビナー

Stataの例題でベイズ分析をもっと知ろう

機能一覧

推定

1,000超のビルトインモデル

一変量／多変量の正規、ロジット、プロビット、順序ロジット、順序プロビット、ポアソンを含む10種の尤度モデル
正規、対数正規、多変量正規、ガンマ、ベータ、Wishartを含む18種の事前分布
連続、二値、順序型、カウントアウトカム
一変量、多変量、同時方程式モデル
線形／非線形モデル
連続一変量／多変量、離散事前分布

bayes:プリフィックス

ベイズ回帰モデルをフィットする58の推定コマンドの前にbayes:を入力
デフォルトの事前分布の変更
シミュレーションまたはサンプリング設定の変更
時系列演算子
コントロールパネルを使用してインターフェイスからモデルの指定と適合

複数チェーン
GUI操作によるモデルへのフィット
コマンド操作によるモデルへのフィット

モデルのクラス

線形回帰
非線形回帰
多変量線形回帰
多変量非線形回帰
一般化線形回帰
正準リンクを伴う一般化非線形回帰
ゼロ拡大モデル
サンプルセレクションモデル
生存モデル
パネルデータモデル
マルチレベルモデル
自己回帰モデル
マルチレベル時系列モデル
同時方程式モデル
Lasso

尤度モデル

正規
スチューデントのt
対数正規
指数
プロビット
ロジット／ロジスティック
二項
順序プロビット
順序ロジスティック
ポアソン
負の二項
生存モデル
パネルデータモデル
マルチレベル

正規
プロビット、ロジット／ロジスティック、補対数対数
順序プロビットとロジット
ポアソンと負の二項
一般化線形モデル
生存

多変量正規（MVN）
マルチレベルVAR
線形と非線形のDSGEモデル
ユーザ定義

事前分布

正規
一般化t
対数正規
一様
ガンマ
逆ガンマ
指数
ラプラス
コーシー
ベータ
カイ二乗
パレート
多変量正規
Dirichlet
Wishart
逆 Wishart
Bernoulli
幾何学
離散
ポアソン
ユーザ定義密度分布
ユーザ定義対数密度分布
特化事前分布

交換可能で独立した特徴の共分散を持つMVN
一様
Jeffreys
多変量Jeffreys
Zellnerのg

ユーザ定義モデルの追加

尤度関数の計算プログラム作成とビルトイン事前分布の選択
事後分布の直接計算プログラム作成
ビルトイン適応的MHサンプリングによる周辺分布のシミュレーション

マルコフ連鎖モンテカルロ（MCMC）法

適応的 Metropolise–Hastings（MH）
ハイブリッドMH（Gibbs更新を伴う適応的MH）
Full Gibbs サンプリング（一部のモデルのみ）

シミュレーション

複数チェーンの生成
3つのMCMC法
burn–in 反復制御
MCMC 反復制御
間引き
シミュレーション前のモデル要約表示
シミュレーション結果の保存・再利用

適応的MHサンプリング

パラメータのブロック化
ブロック内の適応
減衰型の適応
変量効果パラメータ
候補分布のスケールと共分散の制御
適応の制御

適応の長さ
適応反復の最大／最小
採択率
適応率
目標採択率
採択率許容誤差

初期値

自動
一部／全てのパラメータを指定
一部／全てのチェーンを指定

推定後セレクタ

使用可能な推定後機能の一覧
コマンド実行ごとの一覧の自動更新

MCMC収束診断のためのグラフィカルツール

診断プロットの簡易一覧
トレースプロット
自己回帰プロット
ヒストグラム
密度プロット
累積和プロット
二変量散布図
パラメータ、パラメータ関数別に作図
複数プロットの統合と分離
プロットのスライドショー表示
グラフのカスタマイズ
複数チェーン

上記のグラフィカルツールのいずれかを使用
Gelman–Rubin収束診断

MCMC効率性診断のためのツール

実効サンプルサイズ
自己相関時間
効率性
パラメータ、パラメータ関数別に計算

事後分布サマリ

平均値
中央値（メディアン）
標準偏差
モンテカルロ標準誤差（MSCE）
確信（信用）区間（CrIs）

equal-tailed
最高事後密度（HPD）

パラメータ、パラメータ関数別に計算
対数尤度、対数事後分布サマリ
上記の計算を複数チェーンに適用
シミュレートしたアウトカムと関数の要約

MSCE推定法

実効サンプルサイズ使用
バッチ平均使用

仮説検定

区間内値の実現確率算出による検定
線形／非線形
単一／同時
連続パラメータ
離散パラメータ
モデルの事後確率算出による検定
シミュレートしたアウトカムと関数の要約

予測

予測の生成：アウトカムと関数をシミュレート
予測のすべてまたは一部を別のデータセットに保存
予測の事後要約を変数としてデータセットに保存
MCMCレプリケートの一部を変数としてデータセットに保存
グラフィカルな要約と事後要約を取得し、仮説検定を実行
組み込みツールを使用して予測の関数を作成、独自のMata関数やStataプログラムを作成
事後予測チェック用に複製データを生成

モデル比較

デビアンス情報量規準（DIC）
ベイズ因子
モデル事後確率
入れ子型／非入れ子型モデル

専門的な事後評価

VARおよびDSGE後のインパルス応答関数（IRF）

単純なIRF
直交化されたIRF
構造IRF
累積IRF

VAR後の事後評価

IRF
動的乗数
予測誤差分散分解（FEVD）
静的および動的予測
固有値を使用した安定性解析

MCMC結果と推定結果の保存／再利用

因子変数

カテゴリ変数からの指標変数自動生成
離散変数または連続変数間の交互作用作成
多項式項の内包

例題集

下記の機能の操作方法を解説した日本語の例題集をご用意しております。

OLS
事前情報のないベイズ正規線形回帰
事前情報のあるベイズ正規線形回帰
多変量事前情報のベイズ正規線形回帰
収束の確認

推定後要約
ベイズ予測
モデルの比較
仮説検定
シミュレーションデータセットの削除

Stataの例題でベイズ分析をもっと知ろう

日本語資料ダウンロードのお申し込み

詳細資料

詳細は、開発元StataCorp.の機能紹介ページにあるマニュアルをご覧ください。

Bayesian analysisのページへ

The Stata News

The Stata Blog

開発元StataCorp.のトレーニングコース

Introduction to Bayesian Analysis Using Stata training course

お申し込みページへ

操作方法の動画

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

ISO27001(ISMS)認証
情報セキュリティ・マネジメントシステム