Sora問世,虛實世界大門打開

2月16日,Open AI發佈文生視頻模型Sora,同時展示了48個視頻案例,一開年便甩出繼ChatGPT之後的又一張“王炸牌”。

雨夜中行走的女人、熱鬧街道上的舞龍隊伍、活潑可愛的萌寵、神祕莫測的海底世界……在Runway、Pika等文生視頻工具都還在突破秒間連貫性的時候,Sora已經可以直接生成長達60s的一鏡到底視頻,其中既能實現多角度鏡頭的自然切換,又包含複雜的場景和生動的角色表情,而且還有着流暢的故事邏輯性和連貫性,給所有人帶來了“以前不相信是真的,現在不相信是假的”的震撼衝擊。正如Open AI對Sora的理解——世界模擬器。

Sora的問世立刻引發了“百家爭鳴”,有人欣喜不已,有人抱以擔憂;有人更關注其不足之處,也有人面向“如何迎頭趕上”的問題進行了深入思考……無論如何,Sora爲虛擬和現實世界建立起的鏈接,已經讓“未來世界到底是怎樣”的問題充滿了更大的可能性。

百家爭鳴:衝擊與機會並存

“未來人工智能發展速度會越來越快。”華東政法大學人工智能與大數據指數研究院院長高奇琦認爲,通用人工智能大突破的時代可能會大大提前,這是無可阻擋的大趨勢。“技術本身是與社會緊密聯繫在一起的。以Chat-GPT、Sora等爲代表的通用大模型技術,背後潛藏着的失業、失序和失控效應,可能會對人類社會產生很大沖擊。”

中國傳媒大學新聞學院教授、媒體融合與傳播國家重點實驗室大數據中心首席科學家沈浩談到Sora對視頻行業的影響,表達更多的是驚豔:“Gemini1.5Pro、Runway等產品是基於大模型的迭代形成的,無論是在算力還是多模態上,對視頻的理解都不像Sora那樣具有經驗性的顛覆。”

安徽大學新聞與傳播學院院長姜紅也表示:“Sora文生視頻以如此之快的速度到來,而且質量如此之高,的確令人震撼。和大模型生成語言相比,生成視頻,說明技術在這個賽道上已經越來越加速對這個世界的‘仿真’了。它的出現,更加讓短視頻成爲今天的通用語言。”姜紅認爲Sora對影像內容生產和廣告行業的影響會比對新聞生產的影響更大,但是目前,還不至於完全取代人類的影像生產。

中央民族大學新聞與傳播學院教授、互聯網平臺企業發展與治理研究中心主任郭全中認爲,應採取“協同共生式”治理思路跟蹤、研判Sora類產品可能帶來的風險,及時採取相應的措施進行治理;要採取“先發展,共生治理”的方式,處理好“發展與安全之間的平衡”;鼓勵Sora類技術的發展和應用,處理好價值觀對齊難題以解決價值觀引導和倫理等問題。同時,要立足發展,對Sora等新技術應用對版權帶來的影響進行理論上的研究,構建起有效的治理規則,並提供可借鑑的實操案例。

面對變革:競技比拼爭當“卷王”

據Open AI介紹,Sora使用的是Transformer架構。西南證券認爲,Transformer架構擴展特性與優勢凸顯。Sora模型具備強大的理解能力,不僅可以理解Prompt的內容,還能理解事物在物理世界中的存在方式,突出的語言理解能力是其能夠準確生成視頻的前提;具備優秀的生成能力,可生成60s視頻,生成同一角色的多個鏡頭,並保持在角度移動和切換的情況下,人物和場景元素在三維空間中的位置關係依然保持一致的運動。甚至在某一Prompt基礎上只改動一個關鍵詞,也仍能生成優質的視頻,具備較好的可控性。

360集團董事長周鴻禕表示,Sora給了中國互聯網和人工智能行業一個提醒——承認差距並不丟人,知道差距在哪兒,我們迎頭趕上。“中美在AI上的差距主要在於‘確定技術方向’上,一旦方向確定,中國的優勢是學習能力很快,中美在AI上的差距應該能在一兩年內追上。”周鴻禕表示,2024年或將成爲中國在AI領域的“應用之年”,相信今年大模型將在許多企業的垂直領域大有可爲。中國現在要做出一個超過GPT4的通用大模型可能比較難,但在一些垂直領域超過GPT4,是完全有可能的。

中國信息界發展研究院院長尚進認爲,從產業和就業方面來看,以Sora爲代表的視頻生成模型的發展,肯定會對我國影視製作、廣告傳媒等行業帶來一定衝擊,但也不必過於緊張,因爲挑戰和機遇向來都是並存的,產業的變革一直都在發生,要以積極的心態來面對變革。

商業價值:待進一步驗證

Sora的橫空出世掀起一波熱潮,在資本市場也激起層層浪花。Sora概念股連續多日漲停。數據顯示,同花順iFinD的Sora概念自2月19日以來連續收漲,至2月27日漲幅已超過34%。算力基礎設施、算力連接、算力供給、算力雲、算力可視化及運維、算力液冷、算力服務、衛星互聯網等領域的投資標的受到市場廣泛關注。

華泰證券在一份研報中提到,Sora對傳媒應用影響有三,即放大影視IP價值,降低廣告成本,生成遊戲場景。具體表現有三點:一是Sora+影視,預計能明顯降低製作門檻及成本,且可以極大程度豐富影視作品的創造性及風格。擁有核心導演或創意人才以及IP資源的公司或將更受益。二是Sora+營銷,Sora或將提升廣告相關視頻的創造效率,能爲其提供靈感、增強廣告吸引力,有望部分替代低創造性、可複製的視頻內容,同時也能以較低成本完成定製化需求,大批量快速生成定製化的視頻內容,提升客戶轉化及留存率。三是Sora+遊戲,Sora對於物理世界的理解和模擬能力與遊戲場景開發高度適配,可以幫助降低開發成本。

有外媒認爲,Sora的確令人印象深刻,但它尚未準備好迎接未來的黃金時段。Sora模型目前也有不足之處,難以準確模擬複雜場景的物理原理,並且可能無法理解因果關係,還可能混淆提示詞的空間細節。Open AI自己也在技術報告中承認,Sora對身體部位的雜散問題和對物理學的混合理解仍有很大的進步空間。

短期來看,視頻生成模型或將更多地作爲創作工具對相關行業進行賦能。周鴻禕也表示,Sora可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆,“未來AGI比的就是算力和對世界的理解。AI不會淘汰任何行業和任何人,但它能激發更多人的創作力。你只會被那些真正懂AI的人淘汰掉”。

面對新浪潮,我國如何佈局?

面對Sora激起的文生視頻新浪潮,以及對現代社會生活可能產生的顛覆性影響,我國有哪些佈局以應對挑戰?

從政策端看,我國政府始終對前沿AI技術保持高度重視,並給予大力支持。中央經濟工作會議提出,要大力推進新型工業化,發展數字經濟,加快推動人工智能發展。人工智能是引領這一輪科技革命和產業變革的戰略性技術,具有很強的溢出帶動性。《新一代人工智能發展規劃》《關於加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》等文件相繼出臺,爲我國人工智能產業發展提供了政策支持。工信部表示,人工智能已在研發設計、生產製造等領域嶄露頭角,成爲新型工業化的重要推動力,大模型技術的一個側重點是在生產領域的應用,要以人工智能和製造業深度融合爲主線、智能製造爲主攻方向、場景應用爲牽引,統籌佈局通用大模型和垂直領域專用模型,從供需兩端發力,營造創新生態,高水平賦能新型工業化。此番表態傳遞出我國高度重視人工智能發展應用的強烈信號。

作爲國民經濟的骨幹和中堅力量,中央企業積極響應國家戰略,發力佈局AI賦能。近日,國務院國資委召開了“AI賦能 產業煥新”中央企業人工智能專題推進會,強調中央企業要把發展人工智能放在全局工作中統籌謀劃,深入推進產業煥新,加快佈局和發展人工智能產業。開展AI+專項行動,強化需求牽引,加快重點行業賦能,構建一批產業多模態優質數據集,打造從基礎設施、算法工具、智能平臺到解決方案的大模型賦能產業生態。會上,10家中央企業簽訂倡議書,表示將主動向社會開放人工智能應用場景。會議釋放出中央企業正將人工智能作爲重要的戰略發展方向的重磅信號。通過擁抱人工智能這一技術革命,中央企業正在打造智能經濟新引擎,推動經濟高質量發展。

在人工智能領域實現更大突破,爲傳統產業的轉型升級提供有力支撐,還需要人工智能頭部企業、高校和研究機構等開展深入合作,共同推動人工智能技術的研發和應用。一系列事實證明,AIGC在底層原理方面已逐漸具有確定性,更重要的是如何用好我國在應用場景豐富性和複雜度上的優勢。

Sora發佈後不久,全國政協委員、360集團創始人周鴻禕表示:“這都是大模型的功勞,Open AI訓練這個模型應該會閱讀大量視頻,一幅圖勝過千言萬語,而視頻傳遞的信息量又遠遠超過一幅圖,這就離AGI(通用人工智能)不遠了,可能一兩年就可以實現。”他表示,Sora實現了對現實世界的理解和對世界的模擬兩層能力,這樣產生的視頻纔是真實的,才能跳出2D的範圍模擬真實的物理世界。這也預示了未來的科技方向:以強勁的大模型做底子,在對人類語言、對人類知識和世界模型瞭解的基礎上,疊加很多其他的技術,就可以創造各個領域的超級工具。他預測,Sora至少將對機器人具身智能和自動駕駛帶來巨大影響。

相較於在典型數據集上的刷榜成績,Sora用直觀可見的視頻效果向世界指出了AIGC可以加速落地的方向之一。“中美在AI上的差距主要在於‘確定技術方向’上,中國現在要做出一個超過GPT4的通用大模型可能比較難,但在一些垂直領域超過GPT4,是完全有可能的。”周鴻禕表示,“如果方向確定,2024年或將成爲中國在AI領域的‘應用之年’,大模型將在許多企業的垂直領域大有作爲。”

從模擬物體運動軌跡到刻畫細微的皮膚瑕疵、手部動作,Sora的表現令人驚歎,同時生成視頻的分辨率、時長已足以滿足短視頻行業的需求。文生圖、文生視頻等方向也是百度、字節跳動等國內AI頭部企業保持追蹤的。在這場全球技術競賽中,中國將迎頭趕上並努力超越。



Scroll to Top