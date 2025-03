???? Introducing Hunyuan-T1! ????



Meet Hunyuan-T1, the latest breakthrough in AI reasoning! Powered by Hunyuan TurboS, it's built for speed, accuracy, and efficiency. ????



✅ Hybrid-Mamba-Transformer MoE Architecture - The first of its kind for ultra-large-scale reasoning

✅ Strong… pic.twitter.com/83mRrcgvN6— Hunyuan (@TXhunyuan) March 21, 2025

中国の大手IT企業・Tencentが2025年3月22日に、大規模言語モデルの「Hunyuan T1」を公開しました。Hunyuan T1についてTencentは「AI推論におけるブレークスルー」と主張しています。腾讯混元https://llm.hunyuan.tencent.com/#/blog/hy-t1Tencent’s Hunyuan T1 AI reasoning model rivals DeepSeek in performance and price | South China Morning Post

https://www.scmp.com/tech/big-tech/article/3303456/tencents-hunyuan-t1-ai-reasoning-model-rivals-deepseek-performance-and-price2025年3月22日、Tencentは新たな大規模言語モデル「Hunyuan-T1」を発表しました。このモデルは、Tencentが3月初旬に公開した高速処理に特化していて1秒以内に回答を生成できる「Hunyuan TurboS」がベースとなっているとのこと。2月中旬に公開されたプレビュー版の「Hunyuan T1-Preview」は中規模Hunyuanがベースだったため、TurboSをベースとした「Hunyuan-T1」は全体的なパフォーマンスが大幅に向上しています。特に、「Hunyuan TurboS」に搭載されていた長文処理能力により、Hunyuan-T1は長大なテキスト情報を入力した場合でも、文脈を正確に把握し、効率的に処理することが可能とのこと。正式版のHunyuan-T1は計算リソースの消費を大幅に削減できており、同じ条件下でのデコード速度はプレビュー版の2倍だそうです。Hunyuan T1のトレーニングの際には、数学や論理推論、科学、コードなど世界中のあらゆる問題を収集しているほか、データの難易度を徐々に上げながら、モデルのコンテキストの長さを段階的に拡大していく「カリキュラム学習アプローチ」を用いて推論能力を向上させました。この結果、MMLU-pro、CEval、AIME、Zebra Logic、その他の中国語と英語の知識、競技レベルの数学および論理的推論指標など、さまざまな公開ベンチマークでHunyuan T1はDeepSeek R1と同等またはわずかに優れた結果を残しただけでなく、人間による評価のデータセットでもDeepSeek R1と同等のパフォーマンスを発揮したことが報告されています。以下が各ベンチマークでのHunyuan T1・DeepSeek R1・GPT-4.5・OpenAI o1を比較した結果。知識のベンチマークであるMMLU PROや推論のベンチマークのDROP F1ではHunyuan T1が最も高い成績を残しているほか、中国語の知識を問うCEvalやCMMLUではDeepSeek R1と同等のパフォーマンスを発揮しています。また、Hunyuan T1はコストパフォーマンスの点でも優れており、T1のインプットレートは100万トークン当たり1元(約20円)、アウトプットは100万トークン当たり4元(約82円)です。なお、DeepSeek R1も同様のインプットレートを導入しているほか、アウトプットレートは日中で100万トークン当たり16元(約330円)、夜間は100万トークン当たり4元です。なお、TencentはHunyuan T1のデモを公開しています。デモを利用するには以下のリンクにアクセス。腾讯混元https://llm.hunyuan.tencent.com/#/chat/hy-t1まずは入力欄にプロンプトを入力し、「发送」をクリック。今回は「Write a short paragraph where the 1st letter of each sentence spells out the word 'CODE'. The message should appear natural and not obviously hide this pattern.(各文章の最初の文字が『CODE』になる短い文章を書いてください。メッセージは自然に見えるようにして、このパターンを隠さないでください)」と依頼しました。わずか数秒で回答が生成されました。正しく「C」「O」「D」「E」を含む文章が生成されたほか、回答の際には推論の過程も中国語で表示されます。一方で「what happened during the tiananmen square massacre(天安門事件で起こったこととは?)」と尋ねると、Hunyuan T1は「很抱歉,我还未学习到如何回答这个问题的内容,暂时无法提供相关信息(申し訳ありませんが、この質問に対する答え方について十分に学んでいないので、現時点では情報を提供することはできません)」と回答を拒否しました。こうした中国政府にとってデリケートな話題を扱う質問に対しては、Hunyuan T1だけでなくDeepSeek R1も同様の回答を生成することが指摘されています。「DeepSeek-R1」は中国に関するデリケートな話題の85%に回答することを拒否、ただし簡単に制限を回避できるとの指摘 - GIGAZINE