GAUSS 18 - データ操作

GAUSS 18 データ操作

データの読み込みと変換を簡素化する新しい数式文字列

//1ステップでデータを読み込み、変換、予測
call ols("credit.xlsx", "ln(balance) ~ ln(income) + factor(sex)");

//データを読み込み、文字列型の列 'state'を数値型のカテゴリに再分類する
X = loadd("census.csv", "income + household_size + reclassify(state)");

GAUSS 18は1行でデータの読み込み、変換、分析を行えるように、 以前に統合された数式文字列の構文を拡張しました。

拡張された数式文字列の構文:

  • 必要なコード行を大幅に削減
  • CSVExcelGAUSSデータセット, HDF5STATAとSASのデータセットを使用可能
  • サポートされている自動化された変換:
    • `ln`、` exp`やGAUSSプロシージャのような変換の適用
    • 交互作用項の作成
    • ダミー変数の作成
    • 文字列変数の再分類

STATAとSASのデータセットの読み込み

//Stataのデータセットを読み込み、記述統計を計算
call dstatmt("auto2.dta", "mpg + weight + gear_ratio");

//SASのデータセットを読み込み、交互作用項を作成し、GAUSSの行列 'X'に割り当てる
X = loadd("advertising.7bdat", "sales + radio * billboards + direct_mail");

GAUSSと他のソフトウェアとのデータの共有がより簡単になりました。GAUSS 18ではSTATAとSASのデータセットを読み込みできるだけでなく、STATAとSASのデータセットを、OLS、GLMや一般化モーメント法のような関数のデータソースとして直接扱うことができます。

  • STATAとSASのデータセットの完全な互換性
  • データ行列としてSTATAとSASのデータセットをインポート
  • STATAとSASのデータセットを、OLS、GLM、GMMなどの関数の直接引数として使用

大規模なデータセットの取り扱いが向上

//連続した1 GBのブロックに大きなデータを読み込み
setBlockSize("1G");

//システムメモリの10%を超えない連続したブロックに大きなデータを読み込み
setBlockSize("10%");

GAUSS 18では、データ処理を制御するための新しい簡単なツールを使用して、大規模なデータセットに簡単にアクセスして分析することができます。ユーザーは次の点でデータ処理を制御できるようになりました。

  • 使用可能なメモリーのパーセンテージ
  • シンプルなメモリ仕様
  • 行数
page_top_icon