【環球網科技綜合報道】“3 個領先模型中有 2個來自中國實驗室?中國追趕的速度真是令人難以置信。”在美國知名技術社區Hacker News,一位開發者如此感嘆。“中國初創公司已展現出趕超美國人工智能模型的跡象,而且他們追趕的速度比許多業內人士預期的要快。”美國《華爾街日報》的12月24日的一篇報道中,也通過對比中美兩國AI企業推理模型的表現以和研發速度,得出上述結論。
據瞭解,1月20日,國內兩家備受關注的人工智能大模型創業公司月之暗面(Kimi)和深度求索(DeepSeek)幾乎在同一時間發佈了最新模型,都在性能測試中超過OpenAI的o1正式版模型。
在月之暗面發佈的k1.5多模態思考模型中,多模態思考模型實現了SOTA級別多模態推理和通用推理能力。(注:SOTA通常指某個領域中最先進的技術或方法)short-CoT模式下,Kimi k1.5的數學、代碼、視覺多模態和通用能力,大幅超越了全球範圍內短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領先達到550%;而在long-CoT模式下,Kimi k1.5的數學、代碼、多模態推理能力,也達到長思考SOTA模型OpenAI o1正式版的水平。
而深度求索發佈的DeepSeek-R1在後訓練階段大規模使用強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
不到兩個月,兩家中國企業推出的推理模型都實現了對OpenAI o1正式版的對標甚至超越,而與OpenAI不同,兩家中國公司都公開了他們的原理及技術報告:Kimi k1.5發佈原創技術long2short,高效思維鏈+原生多模,DeepSeek R1則繼續主打高性價比。報告一出,引來大量海外從業者的解讀和關注。
英偉達高級科學家範麟熙(Jim Fan)在社交媒體發文表示,“兩篇論文披露了大量技術細節,並驚人得出相似結論,假期讀到令人鼓舞。”
Answera公司創始人保羅·庫弗特(Paul Couvert)也感嘆,“兩款中國o1同日發佈,中國AI追趕速度越來越快。”
對此,中央民族大學教授郭全中表示:"中國AI公司之前基本都在摸着Open AI的石頭過河,但從K1.5等國產大模型開始,以硅谷爲中心的格局已悄然發生變動。國產大模型的突破不僅在於技術指標的提升,也展示了中國AI技術正在走向自主創新的新階段。期待看到更多中國企業在全球AI舞臺上展現實力,推動人工智能技術向着更高水平邁進。” (勃潺)