AIモデルをローカルで実行できるオープンソースソフトウェア「llama.cpp」が画像の入力に対応しました。画像とテキストを同時に入力して「この画像には何が写っている?」といった質問に回答させられます。server : vision support via libmtmd by ngxson · Pull Request #12898 · ggml-org/llama.cpp · GitHubhttps://github.com/ggml-org/llama.cpp/pull/12898llama.cpp/docs/multimodal.md at master · ggm