条件付き平均処置効果
新しい cate
コマンドを使用すると、因果効果の分析において、全体的な処置効果の推定だけでなく、
個別およびグループ固有の処置効果の推定も可能になります。
さまざまな介入や政策を比較し、処置効果の異質性を探ることができます。
処置効果は、処置が結果に及ぼす因果効果を推定します。効果は異質である場合があります。 例えば、労働経済学者は、職業訓練プログラムが参加者の収入に及ぼす影響を知りたいと考えるかもしれません。 オンラインショッピング会社は、年齢や収入など、異なる人口統計学的特性を持つ顧客に対して、 価格割引が購買行動に及ぼす影響を知りたいと考えるかもしれません。 医療チームは、異なる年齢層の個人における喫煙がストレスレベルに及ぼす影響を測定したいと考えるかもしれません。
変数セットに基づく平均処置効果(CATE)は、異質な処置効果を理解するのに役立ちます。 平均処置効果(ATE)は集団全体の平均ですが、CATEはサブグループの平均です。 したがって、CATEは処置効果の異質性を探ることを可能にし、その構造上、 異なる処置割り当て方針が母集団内の異なるグループにどのように影響するかを評価するのに役立ちます。
CATEは、次のような質問に答えるのに役立ちます。
- 処置効果は異質ですか?
- 処置効果は、いくつかの変数によってどのように変化しますか?
- 処置効果は、事前に指定されたグループ間で異なりますか?
- データ内に、処置効果が異なる未知のグループはありますか?
- 考えられる処置割り当てルールの中で最適なものはどれですか?
操作例
個別平均処置効果
401(k) 受給資格(e401k)が純金融資産(asset)に与える影響を推定し、以下の質問に答えます。
401(k) 受給資格が純資産に与える影響は異質ですか?言い換えれば、処置効果は個人間またはグループ間で異なりますか?
処置効果が異質である場合、所得区分などの事前に指定されたグループ間で処置効果はどのように変化するのでしょうか?
使用するデータは、1990年の所得・プログラム参加調査(SIPP)における世帯サンプルから抽出されたものです。 世帯主に関する情報として、所得区分(incomecat)、年齢(age)、教育年数(educ)、年金受給の有無(pension)、婚姻状況(married)、 IRA加入の有無(ira)、住宅所有の有無(ownhome)、同一世帯に2人の稼ぎ手がいるかどうか(twoearn)が含まれています。
ここでは、個人の所得、年齢、学歴、年金、結婚、IRA加入、持ち家、稼ぎ手の数を考慮して、
401(k)の受給資格が資産(assets)に与える影響を調査することを考えます。
例えば、teffects
を用いると平均効果が得られます。
cate
を用いると、各個人に対する効果、すなわち個別平均処置効果(IATE)が得られます。
まず、assets3データセットを開きます。後から入力する手間を省くため、 条件付けに使用する変数名を格納するグローバルマクロ catecovars を定義します。
. use https://www.stata-press.com/data/r19/assets3
. global catecovars age educ i.(incomecat pens married twoearn ira ownhome)
これで、cate
を使用してモデルを当てはめる準備が整いました。
partialing-out推定値を使用するため、コマンド名の後に po
を指定します。
最初の括弧に結果変数 asset とグローバルマクロ $catecovars を指定し、2番目の括弧に処置割り当て変数e401kを指定します。
再現性を担保するために rseed()
オプションを指定します。
. cate po (assets $catecovars) (e401k), rseed(12345671)


反復ログは、結果モデルを資産に、処置モデルをe401kにフィッティングするクロスフィッティングプロセスを示しています。 デフォルトでは、線形モデルのLassoが結果変数の資産に、ロジットモデルのLassoが処置変数のe401kに使用されます。
クロスフィッティングが完了すると、ランダムフォレストを使用してIATE関数を推定することを示しています。 次に、偏線形モデルによって推定されるAIPWスコアが計算され、ATEはAIPWスコアの平均として推定されます。 表に示されているATEは、母集団の全員が401(k)の受給資格を得た場合、純金融資産は、 誰も401(k)の受給資格を得ていない場合と比較して平均で7,937ドル増加することを示しています。
ATEに加えて、cate
はIATEも推定します。IATEは、各観測値における処置効果を予測するために使用できます。
まず、categraph histogram
を用いて予測されたIATEのヒストグラムを描き、その分布を確認します。
. categraph histogram
グラフは、処置効果は概ね正であるものの、右側の裾が厚いことを示しています。そのため、ATEは一部のグループにおいて、 401(k)の受給資格が資産に与える影響を過小評価している可能性があります。
上記のヒストグラムでは処置効果の分布を視覚的に確認できますが、処置効果の異質性を裏付ける証拠として使用すべきではありません。
処置効果が異質であるかどうかを検定するには、estat heterogeneity
を使用します。
. estat heterogeneity

異質性をさらに詳しく調べることができます。 例えば、関心のある変数の水準間でIATE関数がどのように変化するかを確認したい場合があります。 ただし、他のすべての共変量は平均値などの特定の値に固定します。 例えば、教育水準は変化させ、他の変数は固定することができます。
categraph iateplot
を使用すると、教育水準間でのIATE関数の変化を視覚的に確認できます。
デフォルトでは、年齢などの連続変数は標本平均値に固定され、因子変数は基準水準に固定されます。
. categraph iateplot educ

IATE関数に加えて、categraph iateplot
は予測値の95%信頼区間を点ごとにプロットします。
教育年数が10年未満の場合、効果は一定に見えます。
グラフは、他の変数を固定した場合、教育年数が12~15年の人では処置効果がより大きくなることを示しています。
教育年数が15年を超えると、変動性が大きくなり、信頼区間が広くなるため、
このような高学歴層で効果が変化するかどうかを判断することが困難になります。
事前指定されたグループにおける処置効果の推定
上記で、401(k)受給資格が金融資産に与える影響は異質であることがわかりました。 この異質な効果を特徴付けるために、所得区分などの事前指定されたグループ間で平均的な処置効果が どのように変化するかを知る必要があります。
まず、各所得区分における最低所得、最高所得、および中央値を調べます。
. table incomecat, stat(min income) stat(max income) stat(median income) nototal

レベル0と1は低所得グループ、レベル2と3は中所得グループ、レベル4は高所得グループを指していることがわかります。
IATE関数はすでに推定済みです。今度は、グループ変数の各レベルにおけるIATE関数の要約であるグループ平均処置効果(GATE)を推定します。
したがって、IATE関数を再推定する必要はありません。既存のIATE関数を使用できます。
cate
では、IATE関数を再推定せずに効果を再推定するために reestimate
オプションを指定します。
このオプションにより計算時間が節約されます。
所得カテゴリーのGATEを推定するには、group(incomecat)
オプションを指定します。
. cate, group(incomecat) reestimate

結果にはATEとGATEの両方が表示されます。例えば、高所得層(レベル4)のGATEは20,511ドルです。 最高所得層では、401(k)の受給資格がある場合、受給資格がない場合と比較して、純金融資産が20,511ドル増加すると予想されます。 一方、最低所得層(レベル0)のGATE推定値はわずか4,087ドルです。 つまり、収入が多い人ほど、401(k)プランのある企業で働くことでより多くの利益を得られるということです。 ATE推定値によると、対象集団における処置効果は7,937ドルと予想されます。 したがって、ATEのみを使用しても、異なる所得層における処置効果を完全に特徴付けることはできません。
categraph gateplot
を使用してGATE推定値を視覚化し、傾向の有無を確認できます。
. categraph gateplot
グラフは上昇傾向を示しています。所得層間で処置効果の異質性があるかどうかをさらに検証するために、estat gatetest
を使用します。
. estat gatetest

この検定は、グラフに示された結果を正式に裏付けています。効果が均一ではないことを示唆しています。
参考
さらに詳しい内容につきましては、下記のマニュアルをご覧ください。