NTTが大規模言語モデルに文書を視覚情報から理解する「視覚読解技術」を確立 NTT版LLM 生成AI「tsuzumi」に採用 2024年4月15日 16時50分 写真:ロボスタ NTTは、大規模言語モデル(LLM)によって文書を視覚情報も含めて理解する視覚読解技術を実現した。実験において、文書画像を提示しながら、あらゆる質問への回答を行う人工知能(AI)の実現への可能性を示唆する結果が得られており、デジタルトランスフォーメーション(DX)におけるコア技術として期待されている。なお、本 #IT 経済ニュース #IT総合ニュース