WAIC 2024：大模型進入場景應用深水區未來發展仍需聚焦“人”-科技-極速新聞-每日看看

WAIC 2024：大模型進入場景應用深水區未來發展仍需聚焦“人”

2024-07-08 11:23 由環球網發佈於科技 465

【環球網科技報道記者李文瑤】7月6日，2024世界人工智能大會在上海落下帷幕，今年大會共有來自50多個國家地區的1300位全球領軍人物、展商、團組共襄盛會，包括9位圖靈獎、菲爾茲獎、諾貝爾獎得主，88位國內外頂級院士。大會展覽面積超5.2萬平方米，500餘家知名企業超1500項展品參展，50餘款新品首發首秀，均達歷史最高。

與去年的“百模大戰”不同，經過一年的時間，今年展會上更多的是大模型在具體場景的應用。

從科技前沿探索，到賦能產業發展，AI正在以前所未有的速度向各行各業滲透，深度融入生產經營的全流程，降低生產成本，提高生產效率，提升核心競爭力，催生新的商業模式，重塑傳統產業。

專家們表示，在智能化時代，人工智能廣泛賦能人類、工具、資源、技術等生產力要素，大模型在泛化能力上的“狂飆”，知識的發現得以加速，人類的能力邊界得以拓展，產業數字化和智能化持續升級，助推生產範式變革。

金融、教育、醫療成爲重點應用落地方向

大模型落地應用進入快速發展階段，而金融、教育、醫療等行業因數據的規模性和需求的獨特性，正成爲大模型落地的關鍵領域。

螞蟻集團董事長兼CEO井賢棟在大會上表示，在移動互聯網時代，二維碼讓移動支付成爲每個人的生活日常，“掃一掃”讓小商家用最低的成本享受支付的便利。“在人工智能時代，我們也在探索，讓AI像掃碼支付一樣便利每個人的生活，讓AI技術發展的紅利惠及更多人。”

螞蟻集團今年對外展示了“三大AI管家”：支付寶智能助理、AI金融助理和AI就醫助理。“大模型進入應用時代，如何用最先進的技術做最普惠的服務，是螞蟻AI一直在攻關的方向”，螞蟻集團大模型應用負責人顧進傑對記者說道。

尤其在金融和醫療領域，螞蟻集團希望能給用戶帶來低門檻的專業服務。現場工作人員介紹，支付寶AI金融助理的目標是讓每一位投資者都擁有一位“私人理財專家”，只需一部手機，用戶就能獲得高質量的行情分析、持倉診斷、資產配置和投教陪伴等個性化的服務。目前，AI金融助理目前已經服務了4300萬用戶。

百川智能則帶來了全新的AI醫療應用——AI健康顧問。據瞭解，AI健康顧問依託百川智能的通用醫療增強大模型打造，不僅擁有豐富的醫藥學知識，並且還具備醫生思維。它能夠像從業多年的全科醫生一樣，在用戶提出問詢之後，根據用戶的問題持續提問，從更多維度更深入地瞭解症狀，收集到足夠多病症信息後再進行綜合判斷，給出診斷結果和用藥建議。

百川智能工作人員對記者表示，百川智能在成立之初就將健康作爲公司的願景之一，AI醫療一直是百川智能的重要發展方向。百川智能創始人、CEO王小川早在 2021 年就曾表示，“往後二十年，若能爲生命科學和醫學的發展盡一份力，爲大衆健康做一點貢獻，生命就更有意義了。”

在教育方面，學而思攜九章大模型、學而思學習機兩大主打產品亮相本屆人工智能大會，展現了人工智能在智能學習硬件、產品應用層面的最新應用成果和未來前景。據瞭解，九章大模型近期新上線了數學搜索答疑工具“九章隨時問”，以生成式人工智能技術爲基礎，通過啓發引導的方式幫助學生解決數學難題，旨在培養學生的解題思維，提升數學學習能力。目前“九章隨時問”小程序可以從微信輕鬆進入使用，APP端也已陸續開放下載。

學而思CTO田密對記者表示，隨着大模型應用的大爆發，這些技術優勢意味着教育技術可以採用大模型進行全面升級。學而思正在利用大模型重構教育科技，具體應用在解題、對話、批改、講題和推薦五個場景，其中解題、對話和批改功能已經上線，AI講題能力則通過“九章隨時問”小程序和APP提供，用戶可以體驗到個性化、互動性強的AI教學輔助。

因爲大模型具備處理大量數據和執行復雜任務的能力，而將其專精於特定行業或領域，則能顯著提升其解決問題的效率和準確性。在垂直領域，大模型可以自動化處理常規任務，釋放人力資源，提供定製化的解決方案，滿足特定場景下的需求，如個性化醫療治療計劃、精細化生產調度等。

星環科技創始人、CEO孫元浩則對記者表示，人工智能將繼續向着更加智能化、通用化、自主化的方向發展，逐步解決可信性低、泛化性差、可解釋性弱等諸多問題，從而實現更加廣泛的應用場景和更加智能的服務。

星環科技提出“從Data Infra到AI Infra”的發展目標，就是要更有效地統一管理算力、語料、應用，更準確、快捷地處理、存儲、檢索海量多模數據和知識，爲千行百業提供多樣、專業的原生人工智能應用，爲用戶提供端到端的人工智能語料、模型和應用的開發和應用解決方案。

智能體帶來人機交互新模式

基於人形機器人的具身智能是當前學術界和產業界學科交叉的前沿熱點之一，是通向通用人工智能的重要發展方向。

在今年大會上，人形機器人“天團”的亮相展示了最新的機器人技術和具身智能的發展水平。其中，部分機器人搭載了先進的AI大模型，提高了機器人的智能水平和交互能力，特別是在教育、工業、製造業領域的應用引起廣泛關注。

可以看到，基於人工智能的大模型智能體，能夠模仿人類的智能行爲，展現出一定程度的自主性、適應性和學習能力。

例如，智能體能夠理解複雜的自然語言指令和對話，這使得人機交互變得更加自然流暢，用戶無需學習特定的命令語法，可以直接用日常語言與智能體溝通。

高級的智能體甚至可以理解情緒和上下文，提供更加人性化和有同理心的響應，這在客戶服務、心理輔導等領域尤爲重要。而具備物理形態的智能體，如機器人，能夠直接與物理世界互動，執行任務，如搬運物品、導航等，這擴展了人機交互的範圍。

今年，在工信部和上海市經信委的共同指導下，全國首個國家地方共建人形機器人創新中心（以下簡稱國創中心）落戶浦東，並在大會上發佈了國內首款全尺寸人形機器人開源公版機“青龍”，降低人形機器人落地製造業的門檻。“青龍”身高185cm、體重82kg，擁有高度仿生的軀幹構型和擬人化的運動控制，支持多模態機動、多模態感知、多模態交互和多模態操控，全身多達43個主動自由度，最大關節峯值扭矩400N.m，算力支持400TOPs。

網易伏羲在大會上發佈首個機器人品牌“靈動”，打造了挖掘機器人和裝載機器人兩款核心產品，已參與10多個省份的50個重點建設項目，覆蓋礦山、港口、攪拌站、學校等多種應用場景。目前網易靈動挖掘機器人具備自動裝車、一鍵刷坡、一鍵平地、自動甩方、循跡導航等自動化功能。同時，挖掘機器人已實現極端環境下的正常作業，單次連續自動化作業可超10小時，單機綜合效率達到真人80%以上。而網易靈動裝載機器人在混凝土攪拌站施工作業中，實現了全天候無人裝載作業，可足量保障攪拌站每天近1000方的實際生產需求。

社交平臺Soul就在展會上展示了在遊戲互動場景“狼人魅影”中引入的AI 智能體，則集中展現了大模型的多模態互動能力。在該場景中，用戶可以選擇任意的AI+真人遊戲組合模式開啓互動，與具備自主推理、發言、“僞裝”的AI一起進行真實遊戲對決。而“AI遊戲陪玩師”也能幫助玩家快速適應門檻相對較高、玩法複雜的狼人遊戲，輕鬆開啓交流互動，在更沉浸、即時的交互中獲得趣味體驗。

對於智能體的發展，螞蟻集團董事長兼CEO井賢棟表示，專業智能體能夠破解通用大模型在嚴謹產業應用的關鍵難題。他認爲，未來智能化的用戶體驗，一定不是隻靠一個大模型，而是需要全行業深度協作，需要很多的專業智能體共同參與、各司其職。

上海人工智能實驗室主任、首席科學家周伯文直言，具身智能絕不僅僅是大模型加機器人的應用，而是大模型接收物理世界的反饋從而進化，“光靠看書或看視頻，永遠學不會游泳，你得親身扎到水裏才能學會。大模型得通過機器人，扎進現實世界，才能真正理解物理世界。”王興興也直言，不僅僅是單純讓機器人幫忙幹活，它們能理解人類的情緒也非常重要。

多模態發展成趨勢

今年大會上，多模態預訓練模型也成爲了值得關注的趨勢。這些模型正在加速通用人工智能（AGI）的進程，通過綜合處理文本、語音、視覺等多種模態信息，展現出強大的泛化能力和創新應用。

例如，在本次論壇上，騰訊知識引擎發佈了全新的多模態檢索能力，支持圖文互搜、以圖搜圖，能夠結合知識庫中檢索返回的圖文片段，給出圖文並茂的答案。同時，知識引擎進一步擴展了企業知識類型的覆蓋面，升級了泛BI對話式數據問答體驗，支持超大表格、多表場景的多步驟推理、多條件篩選、求和計算，並擴展支持對接客戶主流數據庫。

騰訊雲副總裁、騰訊雲智能負責人、騰訊優圖實驗室負責人吳運聲表示，今天的大模型技術正在往多模態、零樣本學習、3D和視頻生成等方向快速演進，通過增強技術融合、簡化模型訓練流程、提供更加沉浸式體驗等方式，加速AI技術的普惠。

網易展示了基於“易生諸相”大模型，多模態智能體助手“丹青約”全面升級，用戶只需描述指令，例如“幫我戴上墨鏡”、“背景換成海邊”、“從白天變成晚上”等，AI 即可理解意圖並直接生成結果，無需學習工具和繁瑣調參，極大降低使用門檻。

螞蟻帶來了百靈大模型的最新研發成果，多模態能力全面提升。這項能力讓大模型能“看”會“聽”，能“說”會“畫”，可支持音、視、圖、文等多模態理解與生成，可以讓大模型更像人一樣感知和互動，支撐智能體體驗升級，未來將應用在支付寶智能助理等多個AI智能體。

螞蟻集團認爲，大模型從智能湧現到應用湧現實現人人可得，需要佈局關鍵技術，用以解決大模型的可信、經濟、易用三大難題。

金山辦公帶來了WPS AI升級後爲個人用戶新增的4個AI辦公助手，分別是AI寫作助手、AI閱讀助手、AI數據助手、AI設計助手。

閱文集團副總裁黃琰則對記者介紹，去年7月，閱文集團發佈了國內網絡文學行業首個大模型“閱文妙筆”。經過近一年的探索實踐，妙筆大模型在輔助網文多模態創作、支持用戶與角色對話、網文AI多語種翻譯等方面均有實踐和落地。

隨着AI模型變得越來越複雜，並開始處理文本、音頻、圖像和視頻等各種類型數據，對快速數據處理的需求變得更加迫切。爲此，星環科技提供了企業級多模態知識存儲與服務，包括大數據與雲平臺、星環分佈式交易型數據庫Transwarp KunDB、分佈式分析型數據庫Transwarp ArgoDB等，助力企業打造新一代一站式多模型數字底座。

可以看到，多模態技術能夠使AI系統更加接近人類的感知和認知方式，從而在諸如內容創造、客戶服務、醫療診斷、自動駕駛等多個領域產生深遠影響。專家們普遍認爲，隨着技術的成熟和應用場景的擴展，多模態應用將帶來更高效、更自然、更人性化的交互體驗，並且有望推動新一輪的AI技術創新和商業應用爆發。

此外，多模態大模型的開發和部署也被視爲促進AI市場發展的重要因素，它不僅能夠提高現有服務的質量，還能催生出新的商業模式和產品形態。因此，多模態應用的前景被廣泛看好，被視爲AI未來發展的重要方向之一。

網易伏羲平臺技術負責人趙增認爲人工智能正從專用轉向通用，未來將向羣體智能方向發展，多模態學習是其中的關鍵技術。

未來：關注AI倫理治理技術發展仍需聚焦“人”

今年大會首次更名爲“世界人工智能大會暨人工智能全球治理高級別會議”。大會期間，與全球治理相關的論壇有10個，來自聯合國、美國、法國等世界各地的大咖聚集在一起，討論AI的倫理和安全，試圖通過技術手段讓AI向善。

當下，AI治理正在成爲一個熱門話題。在今年的展會上，許多企業也帶來了相關的產品。

“多模態AI鑑真”是模擬螞蟻大模型安全檢測平臺“蟻天鑑2.0”的AIGC檢測和證照深度合成檢測兩大能力推出的互動產品。觀衆可選擇證照、音頻、視頻等多樣化素材，該互動會先對這些素材做一番僞造模擬生成。之後，該產品能對上述僞造的素材快速進行精準鑑別，並形成檢測報告。在真實的生產場景，蟻天鑑AI鑑真解決方案，支持多模態內容真實性和深度僞造檢測，防範深度合成技術濫用風險，圖像識別準確率99.9%，達到信通院測評行業最高優秀級別，已經具備了引領性的AI安全對抗能力。

在“諜影重重”互動裝置前，觀衆還可用一場情景劇的方式打開深度僞造（Deepfake ）的攻防“魔盒”。這一套裝置背後，是螞蟻數科安全科技品牌 ZOLOZ 搭建的端雲一體的技術體系。“Deepfake攻和防是一個相對且不斷精進的過程，你在進步，Deepfake也在進步，我們要做的就是跑在它的前面”，螞蟻工作人員對記者說。

針對本屆大會人工智能的全球治理和倫理這一話題，星環科技創始人、CEO孫元浩介紹說，爲了解決AI發展中的大模型中文語料治理等數據問題，大模型的安全可控的問題，以及垂類全流程安全可控問題等，星環科技加大工具平臺研發，如在Sophon智能分析工具中推出大模型運營平臺（Sophon LLMOps），提供了一站式的大模型基礎平臺。

中國科學院自動化研究所研究員，聯合國人工高層顧問機構專家曾毅在大會上介紹，2020年起，聯合國教科文組織了召集了一批來自各國的人工智能倫理方面的專家組，撰寫了全球人工智能倫理的建議書，體現了各國對人工智能倫理的共識。“但僅形成倫理共識是不夠的，重要的如何落地纔是關鍵。”

中國工程院院士高文表示，人工智能的安全風險可以從模型、算法硬件、自主意識不可控三個方面考慮。開展國際合作研究和人才培養是提高AI安全水平的關鍵。

值得關注的是，在今年展會上，AI技術也正在聚焦爲“人”服務這一主旨，展現了科技向善的技術應用。

例如，記者在大會現場看到，阿里巴巴攜手上海美術電影製片廠、中國青少年發展基金會“閱讀中國”基金，孤獨症兒童干預機構恆星樂樂、海豚樂樂，聯合發佈公益產品“追星星的AI”。這是國內首個關照孤獨症兒童的AI繪本工具。

該AI工具由近20位志願者在線協作、共同開發完成。他們基於阿里自研ModelScope-Agent框架，調用基於通義大模型的多項服務，如利用角色扮演能力打造故事繪本專家角色；利用文生圖、語音合成等AI多模態能力，實現從一句話故事梗概到完整有聲繪本的生成。

通義實驗室產品負責人金璐瑤表示：“AI繪本不僅是一個創意工具，更是一個情感交流的平臺，它能夠幫助孩子們更好地表達自我，同時也能增進家長、老師和社會對他們的理解和接納。希望通過通義的AI服務，讓更多的家庭交流無障礙，更加通情達義。”

對於AI技術可能帶來的挑戰，中國工程院院士、之江實驗室主任、阿里雲創始人王堅表示自己是一個技術樂觀主義者，“我相信人類在技術發展過程當中，任何人類自身產生出來的問題，人類一定會去解決的。”