pandas公式サイト

the pandas development teamは現地時間29日、Python用のデータ分析ライブラリ「pandas v1.0」RC版を、リリースしたことを公式サイトで発表した。

見やすいテーブル形式のデータフレームで豊富なデータの集計機能を提供するPython用のライブラリpandasは昨年10月のv0.25以来のアップデートとなる。バージョンポリシーが変わっており、APIの大きな変化があった場合にメジャーリリースを行うSemantic Versioning 2.0.0を採用。前バージョンでの多くの非推奨機能を削除しており、本番環境ではまず前バージョン0.25にあげてから確認することを勧めている。

V1.0ではrolling.applyとexpanding.applyにLLVMコンパイラで高速化を図るNumbaを使用、100万行以上のデータなど大規模なデータ処理に効果的であるとしている(参照:公式サイト内Rolling Applyの例)。

pandas.api.indexers.BaseIndexer()クラスを実装し、ユーザーはRolling関数使用時にサブクラスのget_window_bounds()で要素の拡張などユーザー定義の仕様を加えることが可能になる(参照:公式サイト内Custom window rollingの例)。

また、よく利用されるマークダウン記法への変換機能pandas.DataFrame.to_markdown()も実装。Webでも使われる馴染み深い表記でテーブルを作成できる。ほか、リリースノートはこちら。

マークダウンのテーブル形式でのアウトプット