DeepSeek-R 1は推論能力でLlama 4を凌駕しており、トレーニングコストはMetaの役員1人の年収に相当します。
DeepSeekは燃えている。
2025年1月、中国のスタートアップDeepSeekはDeepSeek-V 3とDeepSeek-R 1の2つの大型モデルを連続でリリースし、業界に大きな波を巻き起こした。
2023年に設立された同社のビッグモデル製品は、Open AIに近い性能指標で業界の認識をリフレッシュしただけでなく、550万KJという超低トレーニングコストでシリコンバレーのAI研究開発投資の本質的なロジックを覆しました。AIデータサービスのリーディングカンパニーであるScale AIのテストレポートによると、DeepSeek-V 3はいくつかのコア指標で米国のトップモデルと一致しています。
1月24日、アレクサンダー·ワン氏はインタビューで、中国企業のブレークスルーは“シリコンバレーが資本主義に夢中になっている間、東洋のエンジニアはより洗練されたシステム最適化能力でゲームのルールを書き換えている”ことを明らかにしたと率直に語った。この見解は匿名の職場プラットフォームTeamblindで確認されている。あるメタエンジニアの投稿によると、同社のトップはDeepSeekの技術パスに関する緊急研究を開始し、そのオープンソースモデルDeepSeek-R 1は推論能力でLlama 4(Metaが開発した生成AIモデル)を上回っており、トレーニングコストはMetaの個々の役員の給与に相当し、毎年数十億ドルの研究開発予算を投資しているシリコンバレーの巨人を戦略的不安に陥れている。
技術的な詳細によると、DeepSeek-V 3は2023年12月27日にオープンソース化され、LMSys Chatbot Arenaランキングでオープンソースモデルの1位を獲得し、その総合性能はLlama 2-70BやFalcon-180 Bなどの国際的に有名なモデルを上回っています。さらに驚くべきことに、このモデルは同等のものよりもトークンあたりのコストを80%削減し、2024年1月20日にリリースされるDeepSeek-R 1でコスト効率がさらに強化されています。
スタンフォード大学AIラボの独立したレビューによると、R 1モデルはコード生成や数学的推論などの難易度の高いタスクでGPT-4 Turboを上回り、そのスタイル制御能力はAnthropicのトップクローズドソースモデルo1と並んでおり、API呼び出しコストは後者のわずか3%である。この“性能の飛躍とコスト圧縮の同時実現”という技術的特徴は、業界が信じている“計算能力の規模決定論”を直接揺るがします。
資本市場では産業の影響が急速に現れた。
1月24日、Nvidiaの株価は1日で3.12%下落し、中国のAI企業の計算能力が最先端チップへの依存を弱めるという懸念から、3 ヶ月間で最大の下落となった。この感情は、Open AIの最大の機関投資家であるマイクロソフトの最近の声明と共鳴しています。マイクロソフトの最高技術責任者であるケビン·スコット氏は、ダボス会議で、現在のAI競争は単なるパラメータの追求から“アルゴリズム革新とエンジニアリング効率の複合競争”に移行していることを認めました。
ノーベル賞受賞者で“ディープラーニングの父”と呼ばれるジェフリー·ヒントン氏は、最近のインタビューで、中国の膨大なSTEM人材プール(米国の80万人をはるかに上回る年間約500万人の卒業生)がエンジニアリング実践の優位性に変換されており、この体系的な能力は技術封鎖戦略を逆効果にする可能性があると指摘している。
このショックに対するシリコンバレーのベンチャーキャピタルコミュニティの反応は分かれています。350億ドル以上の運用資産を持つシリコンバレーのトップVCであるA 16 zの創設者であるマーク·アンドリーセン氏は、DeepSeek-R 1を“オープンソースコミュニティのマイルストーン”と歓迎し、Sequoia Capitalのアナリストは、業界のリーダーが現在の資本消費率(米国のAI企業のハードウェア支出は2028年までに5,000億ドルに達すると予想される)を維持すると、投資収益サイクルは厳しい試練に直面すると警告しています。
産業界では、この衝撃波はAI開発パラダイムに対する根本的な疑問を引き起こしています。スタンフォード大学とEpoch AI(AI技術予測に焦点を当てた研究機関)の共同研究では、トップモデルのトレーニングコストは2027年までに10億ドルの閾値を超えると予測されています。
しかし、Deep Searchの実践は、MoEアーキテクチャの改善、データクリーニングプロセスの最適化、革新的な分散トレーニング戦略により、限られた予算内でパフォーマンスのブレークスルーを達成することが可能であることを示しています。このような“アクチュアリー·イノベーション”は、メタやグーグルのような膨大なリソースに依存するテクノロジー大手にとって、技術ルートにおける後発開発者の急襲に対処するだけでなく、投資家に1000億ドルの投資の必要性を証明するという二重の課題をもたらします。ウォールストリートのアナリストThe Short BearがXプラットフォームで警告したように、“5,500万ドルでトップモデルを構築できるとき、AI業界全体の評価システムを再構築する必要があります。"