ベイズ分析

Stataは、マルコフ連鎖モンテカルロ法(MCMC)を利用したベイズ回帰モデルの推定をサポートしています。モデル作成においては予め用意された豊富な分布関数を利用することもできますし、独自の関数を定義して利用することも可能です。

収束計算の診断
MCMCによる推定結果はマルコフチェーンが収束した場合に評価が可能です。Stataには複数のチェーンを同時にグラフで比較検討したり、Gelman-Rubinによる収束診断を実行する機能が用意されています。
信用区間
モデルパラメータやそのパラメータから構築される関数について信用区間や事後分布の平均推定値を求めることが可能です。
仮説検定
区間およびモデルベースの仮説検定をサポート。推定したモデルの選択には、ベイズ・ファクターが可能です。

Stataではじめるベイズ統計 ウェビナーのご案内

ライトストーンでは、どなたでも無料でご視聴いただけるウェビナーを開催中です。
「Stataではじめるベイズ統計 ウェビナー」では、実際にStataを一緒に操作しながらその機能をコンパクトに紹介します。
詳しくはStataウェビナーページをご覧ください。

Stataウェビナー

ウェビナーアーカイブ動画

複数チェーンと予測

複数チェーン

マルコフチェーンの計算が収束した場合に限りMCMC(マルコフチェーンモンテカルロ)法によるベイズ推定の結果は適切であると考えることができます。収束状態を判断する方法の一つとしてシミュレーションで複数のチェーンを比較するという方法があります。
Stata 16以降のバージョンではbayes:プリフィックスとbayesmhコマンドのnchains()オプションを使用できます。

icon具体的な使用例

例えば次のように入力します。
. bayes, nchains(4): regress y x1 x2

このコマンドにより4つのチェーンが作成されます。
この4つのチェーンを組み合わせてより高精度な推定結果を求める事も可能ですが、それらのチェーンを視覚的に比較して収束状況を確認します。
収束の確認にはGelman–Rubinの診断法が利用できます。
複数チェーンのシミュレーションを実行したあとでbayes: regress など、いくつかの推定コマンドを実行すると、この診断結果も報告されます。
収束しない事に関心がある場合はbayesstats grubin コマンドを利用します。
これはモデルに含まれる各パラメータに対して個別にGelman–Rubinの診断を実行します。

ベイズ予測

ベイズ予測とは事後予測分布を利用してシミュレーションを行うものです。この手法はモデルのフィットを吟味し、アウトオブサンプルの予測に適しています。

bayesmhコマンドでモデルをフィットした場合、bayespredict コマンドを利用することでシミュレーションの予測値やその関数を計算し、それらを新たなデータセットとして保存できます。
例えば次のように入力します。

icon具体的な使用例

例えば次のように入力します。

. bayespredict (ymin:@min({_ysim})) (ymax:@max({_ysim})), saving(yminmax)

このコマンドはシミュレーションした値の最大/最小値を求めます。この他にも予測値の要約統計量を調べる場合にbayesgraphなどの推定後に利用するコマンド群が用意されています。

bayespredictコマンドは数千個のシミュレーション値から新たなデータセットを作成します。
もちろん、全てのシミュレーション値が必ずしも必要とは限りません。
そのようなケースでは事後分布による要約統計量として平均や中央値などをbayespredict, pmean, bayespredict, pmedianといったコマンドで求めることができます。
また、シミュレーション値からのランンダムサンプリングもサポートしています。

モデルの適合度を評価する場合には、事後分布による予測p値(PPP/ベイズ予測p値)を利用します。
PPPは観測値とシミュレーション値の一致度を計測する指標であり、新しいコマンドbayesstats ppvaluesを用いて求めます。

iconさらに詳しくは無料ウェビナー/分析機能例題集で!
 

機能一覧

推定

  • 1,000超のビルトインモデル
    • 一変量/多変量の正規、ロジット、プロビット、順序ロジット、順序プロビット、ポアソンを含む10種の尤度モデル
    • 正規、対数正規、多変量正規、ガンマ、ベータ、Wishartを含む18種の事前分布
    • 連続、二値、順序型、カウントアウトカム
    • 一変量、多変量、同時方程式モデル
    • 線形/非線形モデル
    • 連続一変量/多変量、離散事前分布
  • bayes:プリフィックス
    • ベイズ回帰モデルをフィットする58の推定コマンドの前にbayes:を入力
    • デフォルトの事前分布の変更
    • シミュレーションまたはサンプリング設定の変更
    • 時系列演算子
    • コントロールパネルを使用してインターフェイスからモデルの指定と適合
  • 複数チェーン
  • GUI操作によるモデルへのフィット
  • コマンド操作によるモデルへのフィット

モデルのクラス

  • 線形回帰
  • 非線形回帰
  • 多変量線形回帰
  • 多変量非線形回帰
  • 一般化線形回帰
  • 正準リンクを伴う一般化非線形回帰
  • ゼロ拡大モデル
  • サンプルセレクションモデル
  • 生存モデル
  • パネルデータモデル
  • マルチレベルモデル
  • 自己回帰モデル
  • マルチレベル時系列モデル
  • 同時方程式モデル
  • Lasso

尤度モデル

  • 正規
  • スチューデントのt
  • 対数正規
  • 指数
  • プロビット
  • ロジット/ロジスティック
  • 二項
  • 順序プロビット
  • 順序ロジスティック
  • ポアソン
  • 負の二項
  • 生存モデル
  • パネルデータモデル
  • マルチレベル
    • 正規
    • プロビット、ロジット/ロジスティック、補対数対数
    • 順序プロビットとロジット
    • ポアソンと負の二項
    • 一般化線形モデル
    • 生存
  • 多変量正規(MVN)
  • マルチレベルVAR
  • 線形と非線形のDSGEモデル
  • ユーザ定義

事前分布

  • 正規
  • 一般化t
  • 対数正規
  • 一様
  • ガンマ
  • 逆ガンマ
  • 指数
  • ラプラス
  • コーシー
  • ベータ
  • カイ二乗
  • パレート
  • 多変量正規
  • Dirichlet
  • Wishart
  • 逆 Wishart
  • Bernoulli
  • 幾何学
  • 離散
  • ポアソン
  • ユーザ定義密度分布
  • ユーザ定義対数密度分布
  • 特化事前分布
    • 交換可能で独立した特徴の共分散を持つMVN
    • 一様
    • Jeffreys
    • 多変量Jeffreys
    • Zellnerのg

ユーザ定義モデルの追加

  • 尤度関数の計算プログラム作成とビルトイン事前分布の選択
  • 事後分布の直接計算プログラム作成
  • ビルトイン適応的MHサンプリングによる周辺分布のシミュレーション

マルコフ連鎖モンテカルロ(MCMC)法

  • 適応的 Metropolise–Hastings(MH)
  • ハイブリッドMH(Gibbs更新を伴う適応的MH)
  • Full Gibbs サンプリング(一部のモデルのみ)

シミュレーション

  • 複数チェーンの生成
  • 3つのMCMC法
  • burn–in 反復制御
  • MCMC 反復制御
  • 間引き
  • シミュレーション前のモデル要約表示
  • シミュレーション結果の保存・再利用

適応的MHサンプリング

  • パラメータのブロック化
  • ブロック内の適応
  • 減衰型の適応
  • 変量効果パラメータ
  • 候補分布のスケールと共分散の制御
  • 適応の制御
    • 適応の長さ
    • 適応反復の最大/最小
    • 採択率
    • 適応率
    • 目標採択率
    • 採択率許容誤差

初期値

  • 自動
  • 一部/全てのパラメータを指定
  • 一部/全てのチェーンを指定

推定後セレクタ

  • 使用可能な推定後機能の一覧
  • コマンド実行ごとの一覧の自動更新

MCMC収束診断のためのグラフィカルツール

  • 診断プロットの簡易一覧
  • トレースプロット
  • 自己回帰プロット
  • ヒストグラム
  • 密度プロット
  • 累積和プロット
  • 二変量散布図
  • パラメータ、パラメータ関数別に作図
  • 複数プロットの統合と分離
  • プロットのスライドショー表示
  • グラフのカスタマイズ
  • 複数チェーン
    • 上記のグラフィカルツールのいずれかを使用
    • Gelman–Rubin収束診断

MCMC効率性診断のためのツール

  • 実効サンプルサイズ
  • 自己相関時間
  • 効率性
  • パラメータ、パラメータ関数別に計算

事後分布サマリ

  • 平均値
  • 中央値(メディアン)
  • 標準偏差
  • モンテカルロ標準誤差(MSCE)
  • 確信(信用)区間(CrIs)
    • equal-tailed
    • 最高事後密度(HPD)
  • パラメータ、パラメータ関数別に計算
  • 対数尤度、対数事後分布サマリ
  • 上記の計算を複数チェーンに適用
  • シミュレートしたアウトカムと関数の要約

MSCE推定法

  • 実効サンプルサイズ使用
  • バッチ平均使用

仮説検定

  • 区間内値の実現確率算出による検定
  • 線形/非線形
  • 単一/同時
  • 連続パラメータ
  • 離散パラメータ
  • モデルの事後確率算出による検定
  • シミュレートしたアウトカムと関数の要約

予測

  • 予測の生成:アウトカムと関数をシミュレート
  • 予測のすべてまたは一部を別のデータセットに保存
  • 予測の事後要約を変数としてデータセットに保存
  • MCMCレプリケートの一部を変数としてデータセットに保存
  • グラフィカルな要約と事後要約を取得し、仮説検定を実行
  • 組み込みツールを使用して予測の関数を作成、独自のMata関数やStataプログラムを作成
  • 事後予測チェック用に複製データを生成

モデル比較

  • デビアンス情報量規準(DIC)
  • ベイズ因子
  • モデル事後確率
  • 入れ子型/非入れ子型モデル

専門的な事後評価

  • VARおよびDSGE後のインパルス応答関数(IRF)
    • 単純なIRF
    • 直交化されたIRF
    • 構造IRF
    • 累積IRF
  • VAR後の事後評価
    • IRF
    • 動的乗数
    • 予測誤差分散分解(FEVD)
    • 静的および動的予測
    • 固有値を使用した安定性解析

MCMC結果と推定結果の保存/再利用

因子変数

  • カテゴリ変数からの指標変数自動生成
  • 離散変数または連続変数間の交互作用作成
  • 多項式項の内包

例題集

下記の機能の操作方法を解説した日本語の例題集をご用意しております。

  • OLS
  • 事前情報のないベイズ正規線形回帰
  • 事前情報のあるベイズ正規線形回帰
  • 多変量事前情報のベイズ正規線形回帰
  • 収束の確認
  • 推定後要約
  • ベイズ予測
  • モデルの比較
  • 仮説検定
  • シミュレーションデータセットの削除

詳細資料

詳細は、開発元StataCorp.の機能紹介ページにあるマニュアルをご覧ください。

開発元StataCorp.のトレーニングコース

Introduction to Bayesian Analysis Using Stata training course

操作方法の動画

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

page_top_icon