DeepSeek再爆猛料!推理系統成本利潤率驚人,影響多大?

【環球網財經綜合報道】在衆人以爲DeepSeek的開源周內容已經發布完畢之際,3月1日,DeepSeek突然宣佈了“One More Thing”,揭祕了其V3/R1推理系統,並首次公開了大規模部署的成本和收益數據,這一舉動在行業內引起了巨大震動。

據DeepSeek官方發佈的《DeepSeek-V3/R1推理系統概覽》文章顯示,假定GPU租賃成本爲2美元/小時,DeepSeek V3/R1推理系統的日均成本爲87072美元。然而,若按照DeepSeek R1的定價計算,其單日理論收入竟高達562027美元,成本利潤率因此達到了驚人的545%。

DeepSeek-V3/R1推理系統的優化目標在於實現更大的吞吐和更低的延遲。爲實現這一目標,DeepSeek採用了大規模跨節點專家並行(Expert Parallelism / EP)策略。EP策略不僅使得batch size大幅增加,提高了GPU矩陣乘法的效率,從而提升了吞吐;同時,EP還使得專家分散在不同的GPU上,降低了每個GPU的訪存需求,進而減少了延遲。

然而,EP策略也增加了系統的複雜性。爲了優化吞吐,DeepSeek需要設計合適的計算流程,使得傳輸和計算可以同步進行。此外,由於EP涉及多個節點,因此天然需要數據並行(Data Parallelism / DP),而不同DP之間則需要進行負載均衡。

針對這些挑戰,DeepSeek介紹瞭如何使用EP增大batch size、如何隱藏傳輸耗時、以及如何進行負載均衡等關鍵技術。其中,DeepSeek通過雙batch重疊來掩蓋通信開銷,提高整體吞吐;同時,針對不同並行模式設計了動態負載均衡器,確保各GPU的計算量、通信量及KVCache佔用均衡,避免了資源浪費。

值得注意的是,DeepSeek在實際部署中還實現了一套晝夜資源調配機制。在白天服務負荷高時,使用所有節點部署推理服務;而在晚上服務負荷低時,則減少推理節點,轉而用於研究和訓練。這一機制進一步提高了硬件利用率,降低了成本。

中信證券認爲,Deepseek在模型訓練成本降低方面的最佳實踐,料將刺激科技巨頭採用更爲經濟的方式加速前沿模型的探索和研究,同時將使得大量AI應用得以解鎖和落地。算法訓練帶來的規模報酬遞增效應以及單位算力成本降低對應的傑文斯悖論等,均意味着中短期維度科技巨頭繼續在AI算力領域進行持續、規模投入仍將是高確定性事件。

DeepSeek此次披露的數據不僅驗證了其技術路線的商業可行性,更爲行業樹立了高效盈利的標杆。有分析指出,DeepSeek的開源策略與成本控制能力正在打破AI領域的資源壟斷。其模型訓練成本僅爲同類產品的1%-5%,而推理定價則具有明顯優勢。這一低成本策略加速了市場滲透,使得更多企業能夠負擔得起AI大模型的應用。

然而,就在DeepSeek披露大規模部署成本和收益之後,潞晨科技突然宣佈將在一週後停止提供DeepSeek API服務。潞晨科技CEO尤洋此前曾指出,儘管DeepSeek-R1的定價看似低廉,但實際上接入方企業可能面臨鉅額虧損。這一消息無疑給DeepSeek的未來增添了一絲不確定性。

儘管如此,DeepSeek此次“透明化”披露仍然向行業傳遞了明確信號:AI大模型的盈利閉環已從理想照進現實。這一標誌着AI技術從實驗室邁向產業化的關鍵轉折,預計將刺激更多科技巨頭採用更爲經濟的方式加速前沿模型的探索和研究。同時,隨着AI應用的不斷解鎖和落地,AI算力領域的持續、規模投入也將成爲高確定性事件。

未來,DeepSeek能否繼續保持其在AI大模型領域的領先地位?其開源策略和低成本模式能否持續引領行業發展?這些問題仍有待時間給出答案。但無論如何,DeepSeek此次的揭祕無疑爲AI行業帶來了新的思考和啓示。(陳十一)



Scroll to Top