【環球網科技綜合報道】2月12消息,上海人工智能實驗室 OpenDataLab 團隊、 DeepLink 團隊及國產芯片廠家攜手,於日前先後完成了昇騰、平頭哥、沐曦、海光、燧原、摩爾線程、天數智芯、寒武紀、崑崙芯、太初元碁、壁仞等 10 餘家主流國產算力的適配。此舉旨在通過軟硬件協同的全棧優化策略,深度適配各類算力,全面提升 MinerU 項目的生態兼容性與適應力,賦能更多開發者與企業高效構建大模型語料基石。
依託自研的VLM模型,MinerU 對 PDF 及複雜網頁的元素捕捉準確率可達 99%。無論是精密複雜的數學公式,還是嵌套繁瑣的結構化表格MinerU 均能實現精準還原與結構化提取。
據瞭解,MinerU 的核心價值在於其跨行業的普適性與極高的解析精度。對於大模型研發而言,它是高效的語料生產引擎,能夠支撐千萬級規模文檔向 AI-Ready 數據的快速轉化;對於政企辦公及科研領域,它則是精準的文檔解析工具,極大提升了數字化辦公的高質量發展。
近期,國內不少主流AI大模型相繼推出更新版本,國產AI芯片企業也緊隨其後適配新版本大模型。
對此,太初元碁相關負責人表示,截至目前其已完成包括DeepSeek、千問、智譜、MinerU、文心一言等在內的30多個AI大模型的國產算力適配工作,涵蓋了Qwen3 Dense/MoE 系列模型、BAAI Embedding / Reranker系列模型、Qwen-VL、LLaVA等多模態理解系列模型;Stable-Diffusion、FLUX、Wan系列等多模態生成類模型;GLM、Seed-OSS、文心一言等大語言模型;以及MinerU、DeepSeek-OCR 2、Paddle-OCR等主流OCR模型,並將持續更新,加速推動智算與產業融合。(青雲)