Stata 15の新機能

先進の手法を多数実装!

近年の統計学の成果をいち早く取り入れ、Stataは大幅な進化を遂げました。

「空間自己回帰モデル」「線形DSGEモデル」など最新手法が搭載され、内生性を扱う「拡張回帰モデル」や「有限混合モデル」「潜在クラス分析」「ベイズ分析」など既存機能との融合が進んだことで、高度な次元の解析が実現可能になりました。

Stata15で注目の機能のいくつかを以下で紹介します。

注目機能の紹介パンフレット

有限混合モデル

有限混合モデル 新たなプレフィックスコマンドfmm:は17種の推定コマンドと共に用いて有限混合分布モデルを推定できます。連続、二値、順序、カウント、カテゴリカル、さらに生存の各アウトカムに対する回帰モデルの有限混合分布でのフィットを実施できます。

より詳しく

fmm:の典型的な利用例は、一つのモデル内に非観測な部分母集団が複数存在し、パラメータ(係数、ロケーション、分散、尺度等)が部分母集団ごとに異なる値をとることを許可した上でフィットするという推定例です。非観測な部分母集団は、LCAの場合と同様に「クラス」と呼ばれます。一例として、3つのクラスの混在が想定される線形回帰モデルでのパラメータ推定の場合を考えます。クラスメンバーシップ(各観測のクラスへの帰属)に関する情報がなくても、次のコマンドでフィットができます。

. fmm 3: regress y x1 x2

推定結果には各クラスの回帰係数と定数に加え、クラスメンバーシップを予測するモデルが表示されます。

同様に、二値アウトカムに対してはfmm: logit、生存アウトカムに対してはfmm: stregが使用できます。また、fmm:は複数の推定コマンドと共に用いて、クラスごとに従うモデルが異なる場合にも対処できます。fmm: (regress y x1 x2) (poisson y x1 x2 x3)を実行すると、線形回帰モデルに従うクラスが一つ、およびポアソン回帰モデルに従うクラスが一つとしたフィットを行えます。

推定後コマンドでは、1) 各クラスの全体に占める割合の推定、2) クラス内のアウトカム周辺平均の予測、3) クラスメンバーシップ確率と予測アウトカムの確率の予測、を行うことができます。

詳細を非表示に

 

空間自己回帰 (SAR) モデル

空間自己回帰 空間自己回帰 (spatial autoregressive:SAR) モデルを新たにサポートしました。SAR モデルでは被説明変数の空間ラグ、説明変数の空間ラグ、そして、空間自己回帰誤差を利用できます。空間ラグとは一般的に、時系列データで利用するラグの空間版を意味しています。時系列におけるラグが過去のデータを意味するのに対して空間モデルでのラグは隣接する地域のデータを指します。

より詳しく

SARモデルの推定用にspregress, 内生変数に対応したspivregress, そしてパネルデータに対するspxtregressコマンドを新たに用意しました。空間自己回帰モデルでは地域のデータを利用します。データは国、州、地方、郡、市、郵便番号、都市区分などが単位の情報となります。しかし、地理的な情報に限定される訳ではありません。例えば、ソーシャルネットワークのノード単位のものでもかまいません。空間モデルでは隣接する地域からの直接効果だけでなく、それらの地域からの波及効果も推定できます。

新たに空間モデル用のコマンドセットと、新しいマニュアル[SP]を用意しました。データが地理的情報に対応している場合、地図を定義するための標準的な形式のシェイプファイルをウェブサイトからダウンロードできます。単一コマンドの場合、地域からの距離の逆数に比例する波及効果を求めたり、隣接地域からの限定的効果を求めることができます。また、隣接地域の定義を独自に作成することも可能です。

詳細を非表示に

 

線形DSGEモデル

経済学やファイナンスの領域で利用されている時系列モデルである線形DSGEモデルは伝統的な予測モデルに対する、もう一つの大きなモデリング手法です。DSGEモデルはミクロ経済学の理論をそのモデリングにおいて利用します。複数の推定式には現在の変数に影響を与える、将来の期待変数が含まれます。この点がまさにVARモデルや状態空間モデルと異なる点です。さらに、モデルが経済理論に基づいているため、パラメータを経済理論の観点から解釈できます。

より詳しく

伝統的な予測モデルとされるマクロ計量モデルと今回サポートしたDSGEモデルはどちらも、集約したマクロ変数による経済現象をモデル化するものです。しかし、DSGEモデルはミクロ経済学の理論をそのモデリングにおいて利用します。

DSGEモデルはミクロ経済学の理論を利用するということから、複数の推定式を利用することになります。それらの推定には現在の変数に影響を与える、将来の期待変数が含まれます。この点がまさにVARモデルや状態空間モデルと異なる点です。さらに、モデルが経済理論に基づいているため、パラメータを経済理論の観点から解釈できます。

DSGEモデルの推定後、estat policyestat transitionコマンドで政策および遷移行列を推定できます。既存のforecastコマンドとirfコマンドにより予測値の計算と、インパルス応答のグラフを作成できます。

詳細を非表示に

 

拡張回帰モデル

Stataが独自にネーミングするERM(拡張回帰モデル)は、これまで個別でしか扱えなかった次の問題を扱うことができます。

  1. 内生共変量
  2. 非ランダムな処置割り付け
  3. ヘックマン型の内生性サンプルセレクション

より詳しく

上記が個別に存在する状況は既存のheckmanivregressで対応できますが、ERMでは問題が複数存在する状況にも対処できます。またERMは非線形モデルにも対応しています。ERMコマンドとして、次の4つが提供されます。

  • eregress :連続アウトカムに対する線形モデルのフィット
  • eintreg :測定値を階級で表現したアウトカムや打ち切りのあるアウトカムに対する区間回帰モデル(tobitなど)のフィット
  • eprobit :二値アウトカムに対するprobit回帰モデルのフィット
  • eoprobit :順序アウトカムに対するprobit回帰モデルのフィット

上記の新機能のいずれかを利用して、これまでモデルフィットできなかった次のような分析が可能になりました。

  • 内生共変量を伴う区間回帰
  • 内生性のある二値アウトカムを伴うprobit回帰
  • 内生性のある順序アウトカムを伴うprobit回帰
  • 内生性のある処置を伴う順序probit回帰
  • tobit内生サンプルセレクションを伴う線形回帰

詳細を非表示に

 

潜在クラス分析 (LCA)

潜在クラス分析がgsemで行えるようになりました。潜在クラス分析では、潜在的なカテゴリ変数を用いて分析を行います。カテゴリカル変数で指示されるクラスは通常観測されることはありません。潜在クラスによる分類例として次のようなものが考えられます。

  1. マーケティングや経営分野で嗜好に基づいた客層の分類を行う
  2. 医療分野でリスクに基づいた患者のグループ分けを行う
  3. 教育や心理学分野で行動パターンに基づいた生徒の分類を行う

bayesプレフィックス

ベイジアンマルチレベルモデル bayesプレフィックスが45種の既存の推定コマンドでサポートされ、ベイズ回帰をより簡単に行えるようになりました。たとえば線形回帰ならば、既存のbayesmhを用いた手順のほかに、次の簡便なコマンドを用いた方法でフィットが行えます。
. bayes: regress y x1 x2

また、ベイズ分析によるマルチレベルモデルも新たにサポートされ、bayes: mixedによるフィットが行えます。

 

区間打ち切りのある生存時間モデル

イベントの生起が不明な中間期間を打ち切りとして考慮するモデルで生存時間分析を行うことができます。この区間打ち切りモデルは、イベント生起の正確な時刻が分からないときに使用できます。新たなコマンドstintregによりstregと同様の手順で分析が可能です。

混合ロジットモデル:選択肢のモデリング

選択肢をアウトカムとする条件付きロジットや順序プロビットモデルにランダム係数を投入して分析することができます。IIA(independence from irelevant alternatives)の前提が満たされず選択肢間に相関がある場合でも、ランダム係数を用いて選択肢間の相関をモデルに組み込んだ分析ができます。

非線形マルチレベル混合効果モデル

menlをサポートし、非線形混合効果モデルあるいは非線形階層モデルと呼ばれる手法が可能になりました。既存のmixedまたはnlどちらの拡張とも捉えることのできる新たなコマンドmenlは、固定効果やランダム効果を含む非線形な推定式を入力して係数推定を行うことができます。

FREDのインポート

FRED(米連邦準備銀行経済データ)をStataからブラウズしてインポートする機能が追加されました。日本など世界各国の経済データを含む総数48万件以上のFREDは、St. Louis Federal Reserve(セントルイス連邦準備銀行)が登録を条件に自由にダウンロードできる形で提供を行っています。Stata 15ではFREDをキーワードなどで検索し、取得したい時系列データを直接Stataにインポートできます。

Word®文書やPDF文書の作成

Word文書やPDF文書の作成 StataによるWord®文書やPDF文書がExcel®表と同様に簡単に作成できます。doファイルを用いて最新の分析結果、図表を含んだWord文書およびPDF文書を一度に作成することができます。レポートの作成を自動化することもできます。

より詳しく

Stata 14で親しまれたputexcelに、新たにputdocxおよびputpdfが加わりました。新たなコマンドは丁度putexcelと同様に動作します。doファイルを用いて最新の分析結果、図表を含んだWord文書およびPDF文書を一度に作成することができます。レポートの作成を自動化することもできます。

新たなコマンドputdocxは、段落、画像、表の書き込みをWord文書(より正確にはOffice Open XML(.docx)ファイル)に対して行います。putpdfと同様、画像にはStataのグラフを含めることが可能で、オブジェクトのフォーマット変更も行えます。

新たなコマンドputpdfは、段落、画像、表の書き込みをPDF文書に対して行います。画像にはStataのグラフや所属団体のロゴを含めることが可能です。太字、斜体、フォントサイズ、カスタム表など、オブジェクトのフォーマット変更も行えます。

詳細を非表示に

 

透明性のあるグラフ

透明性のあるグラフ

グラフでの色の選択において、透明度(不透明度)が設定できるようになりました。ヒストグラムなどを重ねて描いても背面の分布までしっかりと見えるグラフが作図可能です。

 

 

Stata社(StataCorp LLC)ホームページ Stata15特設ページoutside link icon