【環球網科技報道 記者 鄭湘琪】7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)開幕。在大會科學前沿主論壇上,上海人工智能實驗室主任、首席科學家,清華大學惠妍講席教授,銜遠科技創始人周伯文揭示了通用人工智能(AGI)的未來圖景,還剖析了通往AGI的戰略路徑——通專融合。
周伯文對AGI的深入思考始於2015、2016年,他創造性地提出了ANI(狹義人工智能)和ABI(廣義人工智能)兩個概念,並明確提出,通向AGI的必經之路是ABI,即自監督、端對端、從判別式走向生成式的廣義人工智能。
回顧歷史,人工智能技術在專業能力上迅猛發展。從“深藍”到“AlphaGo”,人工智能一次又一次地擊敗了人類領域的頂尖高手,成爲新聞關注的焦點。然而,這些模型雖然強大,卻缺乏泛化能力,只能在特定的任務上表現出色。直到2017年Transformer模型的提出,大模型在泛化能力上實現了質的飛躍,但隨之而來的挑戰是,這些模型在專業能力的提升上卻顯得步履維艱。能源消耗、數據需求、資源消耗的急劇增加,也讓人們開始質疑這條路徑是否真的能夠引領我們走向AGI。
面對這些挑戰,周伯文提出了一個新穎的觀點:實現AGI的路徑應該是二維的,而非一維的。他認爲,AGI的落地將存在一個高價值區域,這個區域要求模型同時具備強大的泛化能力和足夠的專業性。他將這個區域形象地稱爲通專融合的“價值引爆點”。通過對歷史生產力提升的分析,周伯文認爲,處在這個點的大模型,在專業能力上應能超越90%的專業人類,並具備ABI的強泛化能力。這樣的模型將擁有更強的能力、更多的場景優勢,以及更早的自我進化迭代能力。
爲了實現通專融合,周伯文和他的團隊構建了一個完整的技術體系,該體系包含三層重點工作:基礎模型層、融合協同層、自主進化與交互層。在基礎模型層,他們專注於更高效地構建通用泛化能力,特別是數理、因果推理等高階能力。通過高質量數據的清洗和合成,研發高性能訓練框架和高效的模型架構,他們已經取得了一系列原創性成果,如書生·浦語大語言模型和書生·萬象多模態模型。
融合協同層則負責將泛化性和專業性有效結合。他們採用多路線協同的算法和技術,構建了比肩人類優秀水平的專業能力。通過高密度監督信號的生成、複雜任務規劃以及新的系統架構,如模擬人腦的系統1與系統2架構,他們實現了通用模型與專業模型的相互學習,從而在複雜環境中做出更加高效、專業的決策。
在自主進化與交互層,他們強調AI的自主探索和反饋閉環的重要性。AI系統需要在真實或仿真世界中自主地收集數據、學習並適應環境。通過與環境的交互,AI能夠獲得反饋,這些反饋對於其自我進化至關重要。他們構建的“浦源·桃源”機器人訓練場,就是這一理念的具體實踐。這個集場景數據、工具鏈、具身模型評測爲一體的開源具身智能研究平臺,有望解決領域內數據匱乏、評測困難的問題,推動具身智能的快速發展。
此外,周伯文還探討了通專融合在科學發現領域的巨大潛力。他談到,大模型內部壓縮着世界知識,並具備不確定性生成的特性,這有助於打破學科壁壘,提出新的科學假設。通過人機協同,AI不僅可以提出假設,還能掌握科學知識、分析實驗結果、預測科學現象。他們已經在生物醫學等領域取得了初步成果,如通過大模型提出新的生物醫學知識假設,並在最新的文獻中得到了驗證。
“我們必須達成,我們終將抵達。”展望未來,周伯文和他的團隊將繼續致力於通專融合的研究,探索通用人工智能的未來。他們堅信,通過不懈的努力和創新,終將實現通用人工智能的理想。