データ管理機能

データのインポート/エクスポート

  • Excelファイル(xlsまたはxlsx形式)
  • CSVおよび区切りデータのインポートとエクスポート
  • 表計算シートからのコピー&ペースト
  • スプレッドシートエディタにデータ入力
  • ODBCを使用したSQLソースからの読み取りおよびSQLソースへの書き込み
  • 辞書を使用して固定形式のデータのインポートとエクスポート
  • あらゆるタイプのテキストデータをインポートおよびエクスポート
  • Unicode(UTF-8)のサポート(拡張ASCIIの変換を含む)
  • EBCDICデータをインポートし、EBCDICをASCIIに変換
  • SASファイルのインポート
  • SPSSファイルのインポート
  • NDA提出のためにFDAが要求する形式でのデータのインポートとエクスポート
  • SAS TransportXPORTファイルのインポートとエクスポート
  • 連邦準備制度の経済データ(FRED)のインポート
  • HaverAnalyticsデータベースからインポート
  • ODBCを介してWhartonResearch Data Services(WRDS)からデータをインポート
  • dBaseファイルのインポートとエクスポート
  • Excelワークシートの高レベルのインポート/エクスポート
  • Excelセルレベルでのデータ入出力(グラフ、数式、日付型、通貨、太字、斜体等の設定を含む)

JDBCサポート

  • Oracle、Microsoft SQL Server、MySQL、Amazon Redshift、Snowflake、およびその他のデータベースからデータをインポート
  • 既存のデータベーステーブルにデータをエクスポート
  • データベースでSQLステートメントを実行
  • 接続設定を保存するためのデータソース名を作成
  • CLOB、BLOB、およびUnicodeのサポート

ODBCサポート

  • Oracle, SQL Server, Access, Excel, MySQL, DB2等の任意のODBCデータソースからのインポート
  • ODBCテーブルへのエクスポート
  • SQLコマンドの個別またはバッチ実行
  • ODBC接続文字列のカスタマイズ
  • ODBCサポート
  • VARCHAR, CLOB, BLOB サポート
  • Unicode(UTF-8)サポート

内蔵表計算シートエディタ

  • クリップボードプレビューツールによる特殊な貼り付けの制御
  • 変数ツールによる変数の管理
  • Windows, Mac, Unix対応

プロパティウィンドウ

  • 変数の管理
  • データセットプロパティの管理
  • Windows, Mac, Unix対応

変数マネージャ

  • 保存形式、変数名、フォーマットの変更
  • 値ラベルの追加と編集
  • 変数への注釈の付加
  • 変数のフィルタリング
  • Windows, Mac, Unix対応

データ管理関数

  • 数学関数
  • 三角関数
  • 文字列関数
  • Unicode関数
  • 正規表現
  • 日時関数
  • 時系列関数
  • 乱数発生関数
    • 18の関数
    • 乱数のストリーム
  • 行列関数
  • プログラミング関数

データ再編成

  • 行-列転置
  • データの並べ替え
  • 変数の組み換え
  • 平均、合計等への縮退

Unicodeサポート

  • UTF-8
  • 拡張ASCIIとUnicode(UTF-8)の間の変換
  • Unicode対応の文字列関数
  • ロケールに応じた文字列の比較/並び替え

ラベル

  • データセットラベル
  • 変数ラベル
  • 値ラベル
  • 複数のデータセット、変数、および値ラベルを切り替える機能
  • 欠損値ラベル
  • Unicodeを含む多言語サポート

注釈

  • データセットへの注釈の付加

データスナップショット

  • データセットに対する変更の多段回復

メモリ上に複数データセットをロード(frame)

  • リンクフレーム
  • フレーム間でのコピー
  • 他のフレームのデータへのアクセス
  • シミュレーション結果をフレームに投稿する
  • フレームを操作
  • Mataからフレームにアクセス

メモリ上に複数データセットをロード(frame)

  • リンクフレーム
  • フレーム間でのコピー
  • 他のフレームのデータへのアクセス
  • シミュレーション結果をフレームに投稿する
  • フレームを操作
  • Mataからフレームにアクセス

メモリ自動管理

  • テラバイト単位のRAMサポート
  • Stata/MPで最大120,000個の変数、Stata/SEで最大32,767個の変数
  • 200億を超える行数(Stata/MP)
  • 最大21億の行数(Stata/SE・Stata/BE)

ソート

  • 高速なソート
  • 昇順/降順ソート
  • 複数キーによるソート
  • 数値/文字列ソート
  • ロケールに応じた文字列の比較/並び替え

データセットのマージ

  • データセットのマージ
    • キー変数によるマージ
    • 観測データによるマージ
  • データセットの結合
  • 外部結合
  • データセットのアペンド
  • 時系列の付加

特殊なデータセット

  • パネルデータ/縦断的データ
  • 生存時間データ
  • 時系列データ
  • サーベイデータ
  • 多重代入
  • 離散選択データ

ユーティリティ

  • 条件を満たす行のカウント
  • ディスクI/O(書式型/無書式型)
  • zipファイルサポート
  • 拡張ASCIIとUnicode(UTF-8)の間の変換
  • テキストファイル操作用のカスタムフィルタ

変数の管理

  • 新変数の生成
  • 既存変数の変更
  • 変数名の変更
  • 文字列変数のエンコード/デコード
  • 変数の並び替え
  • 変数マネージャ

データセットユーティリティ

  • 変数、ラベル、タイプに関する記述
  • データの一覧表示
  • データセットの完全性に対する署名
  • 変数用コードブック
  • 値ラベルのレポート
  • データ重複と欠損値の一覧表
  • データセットの圧縮(データの精度を失わない最小の容量)

変数のタイプ

  • 数値型
    • byte
    • int
    • long
    • float(単精度浮動小数)
    • double(倍精度浮動小数)
  • 文字列(大型文字列、BLOBを含む)
  • 日付と時間
  • ビジネスカレンダ

大型文字列サポート

  • 最大20億文字の文字列
  • 繰り返し文字の圧縮による容量の縮小
  • バイナリ文字列(BLOB)
  • ファイルから大型文字列へのインポート/エクスポート
  • Unicode(UTF-8)文字

結果の保存

  • ディスクへの保存
  • メモリ上の保存(300セットまで)
  • 結果の比較表の作成
  • カスタム表の作成

詳細資料

詳細は、開発元StataCorp.の機能紹介ページにあるマニュアルをご覧ください。

関連書籍

Data Management Using Stata: A Practical Handbook, Second Edition by Michael N. Mitchell

開発元StataCorp.のトレーニングコース

Using Stata Effectively: Data Management, Analysis, and Graphics Fundamentals training course

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

page_top_icon