【環球網科技報道 記者 李文瑤】在7月28日舉行的世界人工智能大會論壇上,螞蟻數科正式發佈金融推理大模型Agentar-Fin-R1,旨在爲金融領域人工智能應用構建“可靠、可控、可優化”的智能核心引擎。
該模型基於國產基礎大模型Qwen3研發,在FinEval1.0、FinanceIQ等權威金融評測基準上的表現,已超越包括DeepSeek-R1在內的同規模開源通用模型及其他金融專業模型,展現了其在金融專業性、複雜推理能力及安全合規性上的顯著優勢。
當前,金融行業數智化轉型持續加速,大模型應用日益深化。然而,高度專業的金融知識、複雜的業務邏輯推理要求以及嚴苛的金融級安全合規標準,對現有通用大模型在實際業務場景中的應用構成了嚴峻挑戰。
“通用大模型與產業實際應用需求間存在明顯的‘知識鴻溝’。構建專業化的金融大模型,是推動金融與人工智能深度融合的必由之路。未來,金融大模型的應用深度將成爲衡量金融機構核心競爭力的關鍵指標。”螞蟻數科首席執行官趙聞飆在論壇主旨演講中強調。
據悉,螞蟻數科通過構建覆蓋金融全場景的專業任務數據體系與創新模型訓練算法,顯著提升了Agentar-Fin-R1的金融推理能力與可信度。權威評測顯示:該模型在FinEval1.0和FinanceIQ兩大主流金融基準測試中均拔得頭籌。尤爲難得的是,其金融能力實現躍升的同時,通用能力亦保持在較高水準。
目前,螞蟻數科建立了全面、專業的金融任務分類體系,涵蓋銀行、證券、保險、基金、信託等全場景,細分爲6大類、66小類。基於千億級金融專業語料,結合可信數據合成技術及融合專家知識的金融長思維鏈(CoT)標註機制,大幅提升模型處理複雜金融任務的能力,力求實現“天生懂金融,出廠即專家”。採用獨創的加權訓練算法,動態優化模型學習過程,顯著提升其對複雜金融任務的學習效率與性能表現。該技術可有效減少後續業務微調所需的數據量和算力消耗,顯著降低大模型在企業端部署的成本與門檻。
值得關注的是,Agentar-Fin-R1具備持續迭代能力,能夠吸收最新金融政策、市場動態等關鍵信息,並通過配套工具進行鍼對性優化,確保模型能力在真實業務場景中持續進化。
Agentar-Fin-R1提供32B和8B兩種參數版本。此外,螞蟻數科還推出了基於百靈大模型的MOE架構模型以獲得更優推理速度,以及非推理版本的14B和72B參數大模型,全面滿足金融機構多樣化部署需求。
作爲螞蟻集團旗下獨立科技子公司,螞蟻數科致力於以AI及Web3技術驅動產業數智化升級。今年以來,該公司加速佈局企業級大模型服務,聚焦金融與新能源兩大核心場景。在金融領域,其推出的金融智能體平臺Agentar已成爲首批通過中國信通院評測並獲最高5級評級的平臺產品,並聯合合作夥伴推出超百個智能體解決方案,加速大模型在金融業的規模化落地。
以上海某銀行爲例,在螞蟻數科技術支持下打造的AI手機銀行,創新“對話即服務”模式,用戶通過自然對話即可便捷獲取金融服務,顯著提升了老年客戶滿意度,帶動月活躍用戶同比增長達25%。目前,螞蟻數科已服務國內全部國有大型銀行和股份制銀行、超過60%的地方性商業銀行以及數百家各類金融機構,爲金融業智能化轉型提供堅實科技支撐。