王堅：Sora意義非凡，只談對短視頻行業的影響是羞辱它-5G-極速新聞-每日看看

王堅：Sora意義非凡，只談對短視頻行業的影響是羞辱它

2024-03-21 10:07 由人民郵電報發佈於 5G 230

·當前國產大模型和GPT-4及其下一代技術的差距仍然很大，建議通過開源方式，依靠技術社區的力量找到發展路徑，由市場來檢驗其水平。

·Sora問世的意義極大，遠不止會對短視頻、影視等行業帶來衝擊，它解決了非常複雜的一件事——視覺問題，王堅直言“如果能創造視頻，它也就能創造世界”。

近日，Sora模型、大模型商業化等問題備受關注，中國工程院院士、雲計算技術專家、阿里雲創始人王堅在接受採訪時表示，當前國產大模型和GPT-4及其下一代技術的差距仍然很大，其市場價值大於商業價值，建議通過開源方式，依靠技術社區的力量找到發展路徑，由市場來檢驗其水平。

在大模型商業化方面，王堅表示，大模型的市場價值大於商業價值。他認爲，市場化是商業化的基礎，商業化是市場價值的重要體現。

“當今全球範圍內，大模型商業化還在探索過程中。但事實已經證明，它有用戶基礎，也就是可以‘市場化’的，那就有可能產生商業價值——這一點其實很重要，一個產品如果沒有用戶基礎，就算實現了商業化，也是小本生意。對於一場技術革命來說，它不可能以小本生意爲目標，肯定能產生更廣泛的影響。”王堅認爲當前的大模型還處於市場價值大於商業價值的階段。

王堅認爲，短期來看，大模型的整個發展過程和市場沒有直接的關係，因爲這個領域的天花板還遠遠沒有碰到。大家現在已經在講萬億參數的模型了，行業都覺得很興奮，你可以想想一個模型的參數從數十億到萬億的差別。因此，這個賽道在國內外都還遠沒有到需要收斂的程度，OpenAI那麼出名，但仍然會有挑戰者出現，大家仍然在做不同的有創造性的探索。

對於國產大模型對標ChatGPT，王堅表示，不能簡單地說對標ChatGPT。ChatGPT、GPT-4二者，要把它們區分開——前者其實是在後者基礎上延伸出來的一個應用，因此真正衡量基礎模型的能力應該去對標GPT-4。值得注意的是，GPT-4和GPT-3有一個非常大的不同，GPT-3是全開放的，大家都知道它是怎麼做的，以及能做到什麼程度，但到了GPT-4就不開放了，所以當前不太好談對標的問題。就像高考一樣，高考成績好不見得這個人就好，但成績不好又讀不了大學。所以在短時期內衡量誰好誰壞是不公平的，要從長遠角度由市場來給出答案。有觀點認爲，國產大模型的水平已經接近GPT-4，但其實差距還很大。更好的辦法是由市場來證明大模型的能力，比如把模型開源出去，放到國際上去，讓市場去檢驗產品。

從圖文大模型到視頻合成模型Sora，人工智能的發展速度不斷給人們製造驚喜。談到Sora，王堅表示，只說Sora可能會影響短視頻等行業，那是對它極大的羞辱，它的意義遠超這種事情。“就像原子彈剛剛爆炸時一樣，沒有人能想到原子彈後來可以作爲核電站來發電，還可以實現小型化，還有很多別的用處。如果只是把原子能技術當作原子彈用，那就是大大低估了這個技術的重要性。”王堅說。

值得關注的是，Sora事實上在解決世界上最複雜的一件事——真實世界的視覺問題，視頻是它的表現手段。它真正的意義在於靠技術已經能夠生成像這個自然界一樣複雜、有細節的視頻或者圖像。“如果能創造視頻，它也就能創造世界。”王堅說。

對於雲計算在大模型時代的作用，王堅表示，GPU的大規模使用，讓雲計算提供的算力會有百萬倍的增長。“我們在AI時代常說使用幾萬張顯卡訓練一個大模型，當有這麼大規模的時候，其實就是雲計算，只不過是看這個雲計算是想做成一個有體系的、可以真正提供大規模服務的，還是其他。”王堅說。

雲計算是否有望解決當前的算力問題？王堅表示，這其實是個很複雜的事情。GPT-3時期OpenAI公佈說，大概用了1萬塊英偉達A100（一種AI芯片）進行訓練。但像亞馬遜這樣的雲服務運營商，除了A100還用了H800的卡，總共大概有3000E（1E約等於1000PFlops-day）的算力。在過去的3個月裏，按照官方的預測，每個季度會增加1000E的算力。到了GPT-4，就已經不公開其所需的算力了。不過，行業裏大家都會有一個共識，就是隻要做到這個規模就能猜出個大概。比如通義千問開源的是720億參數的模型，那大家就都能猜到這背後有多少算力在支撐。（楊博雯樊文揚劉嫚）