データサイエンティスト協会は6月15日、構造化データの加工について実践的に学ぶことができる無料の学習環境「データサイエンス100本ノック(構造化データ加工編)」をGitHubに公開したと発表した。

「データサイエンス100本ノック(構造化データ加工編)」は、データサイエンス初学者を対象に、データの加工・集計、統計学や機械学習を駆使したモデリングの前処理などを学べるよう、データと実行環境構築スクリプト、演習問題をワンセットにしたもの。

実行環境のサポート言語はSQL、Python、R。演習問題は各言語について100問用意されている。

演習問題の内容

「データサイエンス100本ノック(構造化データ加工編)」の仕組み