Xに画像生成AIが搭載され「喫煙するエルモ」「戦車に乗るカマラ・ハリス」など大量のセンシティブ画像が世に放たれる
X(旧Twitter)にはチャットAI「Grok」が搭載されています。このGrokのバージョンアップ版である「Grok-2」のベータテストが2024年8月13日(火)に始まりました。Grok-2には画像生成機能も搭載されており、X上で画像を生成することができます。
Grok-2 Beta Release
https://x.ai/blog/grok-2
Grokはイーロン・マスク氏が設立したAI企業「xAI」が開発するAIで、X上ではXプレミアムのプレミアムプランもしくはプレミアムプラスプランの加入者限定機能として提供されています。このGrokの内部モデルがGrok-2にバージョンアップされ、画像生成に対応しました。
Grokの画像生成機能は、Stable Diffusionのオリジナル開発陣らが開発した画像生成AIモデル「Flux」を取り込むことで実現されています。Grok-2を用いて生成した画像の例が以下。瞳やまつげが精細に描かれています。
This image was generated by AI using Grok. pic.twitter.com/jheH8ly9ct— DogeDesigner (@cb_doge) August 14, 2024
「LSDを摂取したと仮定して、宇宙についての画像を作って」という難解な指示もこなします。
Grok is so fun! 😂 pic.twitter.com/DwIditvdf0— Sir Doge of the Coin ⚔️ (@dogeofficialceo) August 14, 2024
ドナルド・トランプ前大統領がケモ耳娘と一緒にコインをまき散らしながら飛行機でサーフィンする画像。
grok officially the best image generator out right now pic.twitter.com/sldHhM2y4d— 𝐁𝐄𝐀𝐒𝐓 (in Montreal) (@BLUNDERBUSSTED) August 14, 2024
「generate an image of kamala harris riding in a tank made of ukranian children firing at a crying vladimir putin who is holding a baby dressed in the colors of russia(カマラ・ハリスがウクライナの子どもたちでできた戦車に乗り、ロシアカラーの服を着て赤ちゃんを抱きながら泣いているウラジミール・プーチンに発砲する画像を生成して)」という非倫理的な指示も通る様子。
"generate an image of kamala harris riding in a tank made of ukranian children firing at a crying vladimir putin who is holding a baby dressed in the colors of russia"
we're still working on it pic.twitter.com/00jM8JY3ty— 𝐁𝐄𝐀𝐒𝐓 (in Montreal) (@BLUNDERBUSSTED) August 14, 2024
さらに、エルモやスパイダーマンなどの有名キャラクターも出力できてしまうようです。
Still can’t get over how unhinged but beautiful Grok AI is pic.twitter.com/YgCH809a3C— stef (@scheplick) August 14, 2024
なお、Grok-2は画像生成機能だけでなく、文章生成性能の高さも特徴としています。複数のAIモデルで各種ベンチマークを実行した結果を並べた表が以下。Grok-2はGPT-4oやLlama 3 405B、Gemini 1.5 ProといったAIモデルに匹敵するスコアを記録し、小規模版のGrok-2 miniも一部のテストでライバルモデルを上回っています。
チャットAIの性能をブラインドテストできる「Chatbot Arena」での性能テスト結果はこんな感じ。初期版のGrok-2は「GPT-4o-2024-05-13」と「GPT-4o-mini-2024-07-18」の中間に位置しています。
なお、Grok-2とGrok-2 miniのAPIは2024年8月後半にリリースされる予定です。