王堅:Sora意義非凡,只談對短視頻行業的影響是羞辱它

·當前國產大模型和GPT-4及其下一代技術的差距仍然很大,建議通過開源方式,依靠技術社區的力量找到發展路徑,由市場來檢驗其水平。

·Sora問世的意義極大,遠不止會對短視頻、影視等行業帶來衝擊,它解決了非常複雜的一件事——視覺問題,王堅直言“如果能創造視頻,它也就能創造世界”。

近日,Sora模型、大模型商業化等問題備受關注,中國工程院院士、雲計算技術專家、阿里雲創始人王堅在接受採訪時表示,當前國產大模型和GPT-4及其下一代技術的差距仍然很大,其市場價值大於商業價值,建議通過開源方式,依靠技術社區的力量找到發展路徑,由市場來檢驗其水平。

在大模型商業化方面,王堅表示,大模型的市場價值大於商業價值。他認爲,市場化是商業化的基礎,商業化是市場價值的重要體現。

“當今全球範圍內,大模型商業化還在探索過程中。但事實已經證明,它有用戶基礎,也就是可以‘市場化’的,那就有可能產生商業價值——這一點其實很重要,一個產品如果沒有用戶基礎,就算實現了商業化,也是小本生意。對於一場技術革命來說,它不可能以小本生意爲目標,肯定能產生更廣泛的影響。”王堅認爲當前的大模型還處於市場價值大於商業價值的階段。

王堅認爲,短期來看,大模型的整個發展過程和市場沒有直接的關係,因爲這個領域的天花板還遠遠沒有碰到。大家現在已經在講萬億參數的模型了,行業都覺得很興奮,你可以想想一個模型的參數從數十億到萬億的差別。因此,這個賽道在國內外都還遠沒有到需要收斂的程度,OpenAI那麼出名,但仍然會有挑戰者出現,大家仍然在做不同的有創造性的探索。

對於國產大模型對標ChatGPT,王堅表示,不能簡單地說對標ChatGPT。ChatGPT、GPT-4二者,要把它們區分開——前者其實是在後者基礎上延伸出來的一個應用,因此真正衡量基礎模型的能力應該去對標GPT-4。值得注意的是,GPT-4和GPT-3有一個非常大的不同,GPT-3是全開放的,大家都知道它是怎麼做的,以及能做到什麼程度,但到了GPT-4就不開放了,所以當前不太好談對標的問題。就像高考一樣,高考成績好不見得這個人就好,但成績不好又讀不了大學。所以在短時期內衡量誰好誰壞是不公平的,要從長遠角度由市場來給出答案。有觀點認爲,國產大模型的水平已經接近GPT-4,但其實差距還很大。更好的辦法是由市場來證明大模型的能力,比如把模型開源出去,放到國際上去,讓市場去檢驗產品。

從圖文大模型到視頻合成模型Sora,人工智能的發展速度不斷給人們製造驚喜。談到Sora,王堅表示,只說Sora可能會影響短視頻等行業,那是對它極大的羞辱,它的意義遠超這種事情。“就像原子彈剛剛爆炸時一樣,沒有人能想到原子彈後來可以作爲核電站來發電,還可以實現小型化,還有很多別的用處。如果只是把原子能技術當作原子彈用,那就是大大低估了這個技術的重要性。”王堅說。

值得關注的是,Sora事實上在解決世界上最複雜的一件事——真實世界的視覺問題,視頻是它的表現手段。它真正的意義在於靠技術已經能夠生成像這個自然界一樣複雜、有細節的視頻或者圖像。“如果能創造視頻,它也就能創造世界。”王堅說。

對於雲計算在大模型時代的作用,王堅表示,GPU的大規模使用,讓雲計算提供的算力會有百萬倍的增長。“我們在AI時代常說使用幾萬張顯卡訓練一個大模型,當有這麼大規模的時候,其實就是雲計算,只不過是看這個雲計算是想做成一個有體系的、可以真正提供大規模服務的,還是其他。”王堅說。

雲計算是否有望解決當前的算力問題?王堅表示,這其實是個很複雜的事情。GPT-3時期OpenAI公佈說,大概用了1萬塊英偉達A100(一種AI芯片)進行訓練。但像亞馬遜這樣的雲服務運營商,除了A100還用了H800的卡,總共大概有3000E(1E約等於1000PFlops-day)的算力。在過去的3個月裏,按照官方的預測,每個季度會增加1000E的算力。到了GPT-4,就已經不公開其所需的算力了。不過,行業裏大家都會有一個共識,就是隻要做到這個規模就能猜出個大概。比如通義千問開源的是720億參數的模型,那大家就都能猜到這背後有多少算力在支撐。(楊博雯 樊文揚 劉嫚)



Scroll to Top