AIは膨大な量のデータを学習することによって成り立っています。データの多くはネットで収集されていますが、マイナー言語だと機械的に翻訳された情報が大量に出回っている状態で、言語モデルのトレーニングに懸念があることを研究者が指摘しています。[2401.05749] A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelismhttps://arxiv.org/abs/2401.05749A Shocking Amount of the Web is Ma