Megagon Labs

リクルートは17日、同社のAIラボMegagon Labsが日本語自然言語処理ライブラリ「GiNZA」最新バージョン4.0を公開したことを発表した。GitHubではこちらに一式が設置してあるが、Python 3.6以上が必要となる。

コマンドラインからも手軽に素早く日本語解析を行えるインタフェースを持つGiNZA。最新版の4.0では、多言語対応自然言語処理フレームワークspaCy 2.3用に再設計し、文節単位での構造解析機能加えるなど精度や速度の向上を図っている。

文節単位での依存構造(同社資料より)

ほかワークス徳島人工知能研究所が開発するSudachiPyを用いた複合語の区切り機能なども追加している。