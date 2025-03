中国のAI企業・ DeepSeek が、OpenAIのGPT-4oに匹敵するモデルとして2024年12月にリリースした「DeepSeek-V3」のアップデート版「DeepSeek-V3-0324」を公開しました。deepseek-ai/DeepSeek-V3-0324https://simonwillison.net/2025/Mar/24/deepseek/DeepSeek’s New 641GB AI Model Lands Quietly - and Runs Surprisingly Fast on a Mac - WinBuzzer

The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6— Awni Hannun (@awnihannun) March 24, 2025

Tested the new DeepSeek V3 on my internal bench and it has a huge jump in all metrics on all tests.

It is now the best non-reasoning model, dethroning Sonnet 3.5.



Congrats @deepseek_ai! pic.twitter.com/efEu2FQSBe— Xeophon (@TheXeophon) March 24, 2025

https://winbuzzer.com/2025/03/24/deepseeks-new-641gb-ai-model-lands-quietly-and-runs-surprisingly-fast-on-a-mac-xcxwbn/DeepSeek-V3は2024年12月、6710億個という過去最大のパラメーターを持つ大規模言語モデルとして発表されました。中国のAI企業・DeepSeekがGPT-4oに匹敵するAIモデル「DeepSeek-V3」をリリース、パラメーター数は脅威の6710億個 - GIGAZINEDeepSeek-V3はカスタムライセンスでしたが、新しくリリースされたDeepSeek-V3-0324はオープンソースソフトウェア向けライセンスであるMITライセンスでの公開で、ファイルサイズは合計641GBです。新規モデルではないものの、FP8量子化サポートが組み込まれています。また、パラメーター数は6850億個ですが、推論中にアクティブになるのはそのうちおよそ370億個だけで、ハードウェア要件が緩和されているとのこと。mlx-community/DeepSeek-V3-0324-4bit · Hugging Facehttps://huggingface.co/mlx-community/DeepSeek-V3-0324-4bit機械学習研究者のアウニ・ハヌン氏は、Apple M3 Ultraチップと512GBのユニファイドメモリを搭載したMac Studioで量子化バージョンを実行し、推論速度が秒間20トークンを超えたことを確認しています。また、AI研究を行っているXeophon氏はベンチマークを行い、すべてのテストでDeepSeek-V3よりもスコアが跳ね上がったと報告。AnthropicのClaude 3.5 Sonnetを超えて「最高の非推論モデルになりました」とコメントしました。ニュースサイトのWinBuzzerは、中国はアメリカからのチップ輸入が制限されているので、DeepSeekのように軽量で効率的なアーキテクチャは貴重な存在だと述べています。