https://news.cnyes.com/news/id/5952677
April 28, 2025 10:52 PM (GMT+8)

重點摘要:
-
DeepSeek R2 技術突破
- 採用升級版 Hybrid MoE(專家混合)架構,結合先進門控機制與 Dense 層設計,參數量達 1.2 兆(R1 的兩倍)。
- 硬體依賴 華為 Ascend 910B 晶片群,利用率達 82%,算力接近輝達 A100 的 91%。
-
成本優勢
- 單位成本較 GPT-4 降低 97.4%,輸入/輸出每百萬字元僅需 0.07/0.27 美元,可能顛覆企業級 AI 市場。
-
性能表現
- 中文語言測試(C-Eval2.0):準確率 89.7%。
- 電腦視覺(COCO 數據集):準確率 92.4%,跨領域能力強。
- 支援 8bit 量化壓縮,模型體積縮小 83%,精度損失低於 2%,利於終端部署。
-
市場衝擊
- 可能重演 R1 發布時的效應(輝達市值曾蒸發 6,000 億美元),對 OpenAI、輝達等美企構成競爭壓力,影響美股科技股表現。
關鍵字:
DeepSeek R2、華為 Ascend 910B、1.2 兆參數、成本降 97%、中美 AI 競爭