TechWebによると、中国の旧正月後、AI分野ではDeepSeekの次世代フラッグシップモデルであるV4への期待が世界的に高まり続けている。報道によると、DeepSeekはV4の発売前にNvidiaやAMDといった米国のチップメーカーに早期テストへのアクセスを許可せず、代わりにHuaweiなどの国内チップ企業に数週間の「優先最適化期間」を与えたことで業界の常識を破り、業界チェーンに波紋を広げている。

従来、AI開発者は、効率的なソフトウェアとハードウェアの互換性を確保するため、メジャーモデルアップデートの前に、主要なチップメーカーとプレリリース版を共有してきた。DeepSeekもこれまでこのモデルに従い、NVIDIAの技術チームと緊密に連携してきた。しかし、V4モデルの配布戦略は大きく変化した。情報筋によると、DeepSeekはNVIDIAとAMDにテストを公開せず、代わりにHuaweiなどの中国のチップメーカーが、命令セット、演算子ライブラリ、推論フレームワークの共同適応など、プロセッサの基盤となる最適化を事前に実行できるようにしたという。NVIDIAとAMDはコメントを控えた一方、DeepSeekとHuaweiはまだ回答していない。
アナリストらは、この戦略はDeepSeekのエコシステム戦略の転換点であり、国内のコンピューティングプラットフォームとの互換性を優先することで、国内のチップ企業が技術を改良し、ソフトウェアとハードウェアの緊密な連携を促進するための時間を稼ごうとしていると考えている。リリース日が近づくにつれ、V4の技術的な詳細が徐々に明らかになってきている。テクノロジーブロガーのLegitによると、DeepSeekは「sealion-lite」というコードネームのV4プレビュー版のクローズドベータテストを開始し、参加者全員が厳格な機密保持契約に署名したという。
技術的には、V4は世代交代と言えるでしょう。マルチモーダル処理のネイティブサポート、100万トークンに拡張されたコンテキストウィンドウ、極めて長いテキストやコードベースを一度に分析する機能、そして高度な論理推論機能などを備えています。初期のテストでは、複雑なSVGベクターグラフィックスの生成などのタスクで非常に優れたパフォーマンスを発揮し、既存のオンラインモデルを大幅に上回っています。業界関係者の間では、V4は1兆パラメータ規模の巨大モデルになる可能性があり、トレーニング規模の指数関数的な増加によりリリースが遅れているとの見方もあります。