周辺平均、補正予測、限界効果

Stata 11 では種々のマージンの計算が行えます。周辺平均の推定や補正予測値、予測マージンの計算が行えます。また限界効果も微係数、弾力性の形で算出できます。マージンとは既にフィットされたモデルに基づく予測値の一種ですが、その計算に際しては一部の共変量の値を固定し、他の共変量については平均を取ったり、積分を行ったりという操作が可能です。

よりくだいて言うなら、margins は“これこれのグループやこれこれの人に関し、私のモデルは何と言うだろうか”という問いに答えるものです。ここで“これこれ”とは次のような内容が想定されます。

  • 推定に用いた標本、あるいはそれとは別の標本
  • 共変量の一部の値を固定した標本
  • 処置のそれぞれのレベルで評価された標本
  • 複雑なサーベイ標本によって表される集団
  • 私の標本中の5番目の人に似た特性を持った人
  • 私の標本中における共変量の平均に近い特性を持った人
  • 私の標本中における共変量の中央値に近い特性を持った人
  • 私の標本中における共変量の25%パーセンタイルに近い特性を持った人
  • 私の標本中における共変量のその他の統計量に近い特性を持った人
  • 標準化された集団
  • バランスの取れた実験デザイン
  • 上記の任意の組合せ
  • 上記の任意の比較

margins はこれらの問いに対して条件付きの形で(すなわち共変量の値を固定した状態で)、あるいは標本中の観測値を平均化する形で応答します。任意の標本であって構いません。

margins は推定されたパラメータに基づき計算できる任意の予測値やその他の応答値(線形応答、確率、ハザード、生存時間、オッズ比、リスク差、等)について、これらの問いに答えます。

margins は共変量レベルが与えられたときの応答を計算することもできれば、レベルの変化に対する応答の変化(すなわち限界効果)を計算することもできます。

margins は標準誤差や検定統計量、信頼区間の情報も提供します。その際、共変量の値は与えられたものとして扱うこともできますが(予測マージン)、サンプリングに対して補正を施すこともできます(サーベイ統計量)。

今、アウトカム y の値を性別、喫煙量、年齢とから推定するロジスティックモデルについて考えることにします。交互作用も含め、新たな因子変数表記が用いられている点にご注意ください。

screenshot

sex と smokes 間の交互作用によって解釈が難しくなっていますが、margins はその効果を読み解く上で役に立ちます。

screenshot

ここでは予測マージンが計算されています。喫煙量の分布を同一に保ったまま、誰しもが男性であると仮定した場合には、y がポジティブアウトカムとなる確率は 38% であることが期待されます。すべて女性だとするとその期待値は 54% となります。一方、男女間の分布は観測された状態に保ち、すべてが非喫煙者であると仮定した場合には、y がポジティブアウトカムとなる確率は 41% と期待されます。

ポジティブアウトカムの確率には男女間で有意差があるでしょうか?margins の結果に対して test を実行させることができます。

screenshot

予測マージンの値は男女間で有意に異なることが確認できました。

今度は限界効果について見てみましょう。Stata 11 の因子変数の機能を用いて2乗項を表現してあるので、2乗項の効果も反映した形で限界効果の値を求めることができます。

screenshot

ここでは別のデータセットを使用しています。この例では年齢が1年加わるのに伴い、組合加入の確率は 0.0015 だけ増加することがわかります。デフォルトの場合、margins は限界効果の平均値を出力してきます。すなわち限界効果の値は各観測値に対して算出された上で、それらの平均値が計算されます。

共変量の平均値における限界効果の値は次のようにして求めることができます。

. margins, dydx(age) atmeans

Stata 11 の margins コマンドのオプションを用いると、標準誤差として係数推定値のサンプリング変動のみを反映したものとするか、推定サンプルのサンプリング変動をも加味したものとするかを制御することができます。後者の場合、margins は重み、サンプリングユニット、事前/事後層別化、部分集団等を含む複雑なサーベイサンプリングを考慮した形で計算を行うことができます。

margins は Stata のあらゆる推定コマンド実行後に利用できますが、例外は次の通りです。

  • 正確ロジスティック、正確ポアソン
  • 選択肢固有の条件付きロジスティック、多項プロビット、ランク順プロビット
  • ネスト型ロジット
  • 一般化モーメント法
  • 構造ベクトル自動回帰モデル