DeepSeek R2震撼來襲：低成本高效能AI模型或再度引發...

April 28, 2025 10:52 PM (GMT+8)

DeepSeek R2 技術突破
- 採用升級版 Hybrid MoE（專家混合）架構，結合先進門控機制與 Dense 層設計，參數量達 1.2 兆（R1 的兩倍）。
- 硬體依賴 華為 Ascend 910B 晶片群，利用率達 82%，算力接近輝達 A100 的 91%。
成本優勢
- 單位成本較 GPT-4 降低 97.4%，輸入/輸出每百萬字元僅需 0.07/0.27 美元，可能顛覆企業級 AI 市場。
性能表現
- 中文語言測試（C-Eval2.0）：準確率 89.7%。
- 電腦視覺（COCO 數據集）：準確率 92.4%，跨領域能力強。
- 支援 8bit 量化壓縮，模型體積縮小 83%，精度損失低於 2%，利於終端部署。
市場衝擊
- 可能重演 R1 發布時的效應（輝達市值曾蒸發 6,000 億美元），對 OpenAI、輝達等美企構成競爭壓力，影響美股科技股表現。

DeepSeek R2、華為 Ascend 910B、1.2 兆參數、成本降 97%、中美 AI 競爭