Stataのエディション

Stataには、取扱うデータの規模と計算する処理速度の異なる3つのエディションがあります。
機能やサポートされるコマンドの種類に違いはありません。

StataBEロゴStataSEロゴStataMPロゴ
icon

選定のポイント:エディションの選択

    どのStataが良いのかPCの目安は
  • 3つのエディションの最大の違いは変数の上限数(列数)です。Stata/MPで最大120,000個の変数を扱えるのに対し、Stata/SEで32,767個、Stata/BEで2,048個と徐々に小さくなります。
  • 観測データの上限数(行数)については、最小のStata/BEでも20億であるため、この上限が問題となるケースは少ないと考えられます。
  • 独立変数(説明変数)の数が798を超える場合には、Stata/SE以上をご利用ください。Lassoなど機械学習をご予定の場合は、MPがお勧めです。
行数・列数・独立変数の数
icon

選定のポイント:コア数の選択

  • 発揮される性能は、Stata/MPPC においてコア数の少ない方に依存します。
  • Stata/MP の処理能力を最大限発揮するには、お持ちのPCのコア数と同程度のコア数をご選択ください。
対応CPU Intel社製 Xeon, Core, Pentium, Celeronなど
AMD社製 Ryzen, FX, Phenom, Athlonなど
Apple社製 Apple Silicon
対応コア数

2, 4, 6, 8, 12, 16, 24, 32, 64コアまで

StataMPロゴ

Stata/MPはお使いのコンピュータのマルチコアプロセッサ機能を活用することにより、計算を並列に行います。それによりコマンドによっては実行速度がかなり向上します。

コア数 全てのコマンド 推定コマンド ロジスティック回帰
2 1.7倍 1.8倍 2.0倍
4 2.4倍 2.9倍 3.8倍
8 3.1倍 4.1倍 6.9倍
※上記の数字はスピードアップした要素の中央値です。実際にはコマンドによって上記の数字よりも早く、または遅くなります。

マルチコアCPUやマルチプロセッサの機能を使用して並列処理を行うことにより、Stata/BEやStata/SEよりも高速に分析を行うことができます。
処理速度変化はコマンドにより異なりますので、下記のテスト結果をご参照ください。


計算速度がさらに高速化

Stata 17からバックグラウンド処理が更新され、様々な機能が高速化しています

sortおよびcollapseコマンドのアルゴリズムが見直されました。多くのコマンドではデータの並び替え処理(sort)や要約統計量の計算(collapse)が使われているため、最新のStataの多くのコマンドの処理速度の高速化しています。

比較表

機能
Stata / BE
Stata / SE
Stata / MP
(2-core)
Stata / MP
(4-core)
Stata / MP
(6-core以上)
変数の上限数(列数)
2,048
32,767
120,000
120,000
120,000
観測データの上限数(行数)
21.4億*
21.4億*
200億*
200億*
200億*
回帰式における独立変数(説明変数)の上限数
798
10,998
65,532
65,532
65,532
マルチコア対応

ロジスティック回帰分析の演算時間 (観測数:1,000万、共変量の数:20)

1-core
20秒
1-core
20秒
2-core
10秒
4-core
5.2秒
6-core以上
5.2秒未満
全ての統計解析機能の利用
印刷品質のグラフ作成機能
解析の再現性
レポートと表の生成
行列プログラミング言語の使用
PDF形式のマニュアルセットの提供
無償テクニカルサポートの利用
サービスリリースの提供
Windows, macOS, Linux 全サポート

※取扱えるデータ量は実装メモリの容量により制限されます。特にStata/MPについては、現在この観測データ上限数を賄えるメモリを備えたコンピュータがほとんど市販されていないため、取扱えるデータ量はメモリの容量の限界までとなります。

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

page_top_icon