ChatGPTなどのチャットAIでも利用されている大規模言語モデル(LLM)を60種類以上集め、それぞれの創造性を試すような20種類の質問を行い、反応を比較するというベンチマークテストをAIツールの分析・テストサービスを提供するLLMonitorが実施しています。LLM Benchmarkshttps://benchmarks.llmonitor.com/LLMonitorがテストを実施したLLMは、記事作成時点では69種類。ベンチマークテストを受けたLLMのリストは以下の通り。・Airobor