Appleの研究者が、スマートフォンのアプリUIを理解するために設計したマルチモーダル大規模言語モデル(MLLM)の「Ferret-UI」を開発したという論文を、未査読論文リポジトリであるarXivで公開しました。[2404.05719] Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMshttps://arxiv.org/abs/2404.05719Apple teaching an AI system to use apps; maybe for advanced Sirihttps://9to5mac.com/2024/04/09/ferret-ui