中國2家AI公司連發新模型趕超OpenAI o1 海外開發者：速度難以置信-科技-極速新聞-每日看看

中國2家AI公司連發新模型趕超OpenAI o1 海外開發者：速度難以置信

2025-01-22 17:15 由環球網發佈於科技 425

【環球網科技綜合報道】“3 個領先模型中有 2個來自中國實驗室?中國追趕的速度真是令人難以置信。”在美國知名技術社區Hacker News，一位開發者如此感嘆。“中國初創公司已展現出趕超美國人工智能模型的跡象，而且他們追趕的速度比許多業內人士預期的要快。”美國《華爾街日報》的12月24日的一篇報道中，也通過對比中美兩國AI企業推理模型的表現以和研發速度，得出上述結論。

據瞭解，1月20日，國內兩家備受關注的人工智能大模型創業公司月之暗面（Kimi）和深度求索（DeepSeek）幾乎在同一時間發佈了最新模型，都在性能測試中超過OpenAI的o1正式版模型。

在月之暗面發佈的k1.5多模態思考模型中，多模態思考模型實現了SOTA級別多模態推理和通用推理能力。（注：SOTA通常指某個領域中最先進的技術或方法）short-CoT模式下，Kimi k1.5的數學、代碼、視覺多模態和通用能力，大幅超越了全球範圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平，領先達到550%；而在long-CoT模式下，Kimi k1.5的數學、代碼、多模態推理能力，也達到長思考SOTA模型OpenAI o1正式版的水平。

而深度求索發佈的DeepSeek-R1在後訓練階段大規模使用強化學習技術，在僅有極少標註數據的情況下，極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上，性能比肩OpenAI o1正式版。

不到兩個月，兩家中國企業推出的推理模型都實現了對OpenAI o1正式版的對標甚至超越，而與OpenAI不同，兩家中國公司都公開了他們的原理及技術報告：Kimi k1.5發佈原創技術long2short，高效思維鏈+原生多模，DeepSeek R1則繼續主打高性價比。報告一出，引來大量海外從業者的解讀和關注。

英偉達高級科學家範麟熙(Jim Fan)在社交媒體發文表示，“兩篇論文披露了大量技術細節，並驚人得出相似結論，假期讀到令人鼓舞。”

Answera公司創始人保羅·庫弗特（Paul Couvert）也感嘆，“兩款中國o1同日發佈，中國AI追趕速度越來越快。”

對此，中央民族大學教授郭全中表示："中國AI公司之前基本都在摸着Open AI的石頭過河，但從K1.5等國產大模型開始，以硅谷爲中心的格局已悄然發生變動。國產大模型的突破不僅在於技術指標的提升，也展示了中國AI技術正在走向自主創新的新階段。期待看到更多中國企業在全球AI舞臺上展現實力，推動人工智能技術向着更高水平邁進。” （勃潺）