X(旧Twitter)にはチャットAI「Grok」が搭載されています。このGrokのバージョンアップ版である「Grok-2」のベータテストが2024年8月13日(火)に始まりました。Grok-2には画像生成機能も搭載されており、X上で画像を生成することができます。

Grok-2 Beta Release

https://x.ai/blog/grok-2

Grokはイーロン・マスク氏が設立したAI企業「xAI」が開発するAIで、X上ではXプレミアムのプレミアムプランもしくはプレミアムプラスプランの加入者限定機能として提供されています。このGrokの内部モデルがGrok-2にバージョンアップされ、画像生成に対応しました。



Grokの画像生成機能は、Stable Diffusionのオリジナル開発陣らが開発した画像生成AIモデル「Flux」を取り込むことで実現されています。Grok-2を用いて生成した画像の例が以下。瞳やまつげが精細に描かれています。





「LSDを摂取したと仮定して、宇宙についての画像を作って」という難解な指示もこなします。





ドナルド・トランプ前大統領がケモ耳娘と一緒にコインをまき散らしながら飛行機でサーフィンする画像。





「generate an image of kamala harris riding in a tank made of ukranian children firing at a crying vladimir putin who is holding a baby dressed in the colors of russia(カマラ・ハリスがウクライナの子どもたちでできた戦車に乗り、ロシアカラーの服を着て赤ちゃんを抱きながら泣いているウラジミール・プーチンに発砲する画像を生成して)」という非倫理的な指示も通る様子。





さらに、エルモやスパイダーマンなどの有名キャラクターも出力できてしまうようです。





なお、Grok-2は画像生成機能だけでなく、文章生成性能の高さも特徴としています。複数のAIモデルで各種ベンチマークを実行した結果を並べた表が以下。Grok-2はGPT-4oやLlama 3 405B、Gemini 1.5 ProといったAIモデルに匹敵するスコアを記録し、小規模版のGrok-2 miniも一部のテストでライバルモデルを上回っています。



チャットAIの性能をブラインドテストできる「Chatbot Arena」での性能テスト結果はこんな感じ。初期版のGrok-2は「GPT-4o-2024-05-13」と「GPT-4o-mini-2024-07-18」の中間に位置しています。



なお、Grok-2とGrok-2 miniのAPIは2024年8月後半にリリースされる予定です。