【環球網科技報道 記者 李文瑤】生成式AI是否能爲雲計算帶來新的發展機遇?作爲全球頭部企業,亞馬遜雲科技也在思考這一問題。
在今年年底的亞馬遜雲科技年度大會re:Invent 2024上,這家公司發佈了一整套面向AI時代的新產品,包括自研大模型Amazon Nova系列、新一代AI訓練芯片Trainium 3、新一代Amazon SageMaker(數據分析和AI的一站式平臺)、AI助手Amazon Q新功能等。
過去一年,亞馬遜雲科技通過自研、投資、生態打造等多種方式夯實AI護城河,重塑IaaS(基礎設施)、PaaS(平臺軟件)、SaaS(應用軟件)、MaaS(模型服務)層的產品,以期在全球AI技術競爭中搶得先發優勢。到年底,亞馬遜雲科技對外展示了其AI加持的計算、存儲、數據庫等基礎雲產品。
“就生成式AI整個行業而言,目前的突破點在於如何快速從技術原型走向生產。”在接受記者採訪時,亞馬遜雲科技大中華區產品部總經理陳曉建認爲,在生成式AI的發展上,企業正在從思考階段轉向實踐階段,進行大量場景試驗,預計2025年將有更多的客戶從原型驗證階段轉化爲生產階段。
而云計算不僅是提供產品和技術,更重要的是幫助企業取得業務上的成功。
加碼生成式AI 新品密集發佈
2023年,亞馬遜雲科技推出了嵌入式模型Amazon Titan,而今年則進一步豐富了產品組合,發佈了Amazon Nova系列——一套包含六個針對不同應用場景優化的模型。此外,亞馬遜還計劃在未來推出speech to speech和any to any等新型模型。
陳曉建介紹,這些新模型的開發遵循了“逆向工作法”的原則,即首先深入瞭解客戶的實際需求,然後根據這些需求定製相應的解決方案。例如,針對用戶在Micro、Lite、Pro以及即將推出的Premier等不同級別上的具體要求,亞馬遜設計了各有側重的模型,以確保它們能夠無縫集成到客戶現有的產品和服務中,並提供最佳性能。
通過這種方式,亞馬遜不僅爲客戶提供了一個廣泛的選擇範圍,而且保證了每個模型都能精確地滿足特定業務場景的需求。
而在芯片方面,亞馬遜雲科技的自研芯片策略不僅強調技術先進性和性能優化,同時也關注能效和環境影響,旨在爲客戶提供高效且可持續的解決方案。
目前,Amazon Trainium(訓練芯片)專注於提供極致的計算性能,支持大規模分佈式計算任務,適用於複雜的模型訓練。
Amazon Inferentia(推理芯片)主要針對推理任務,相比訓練芯片,多機協同的需求較低,在設計過程中充分考慮了能效和碳排放等因素,確保高性能的同時也注重環保。
陳曉建透露,亞馬遜雲科技與Anthropic合作,正在構建名爲Project Rainier的EC2 UltraCluster。該集羣包含數十萬顆Trainium2芯片,能夠提供比當前一代領先AI模型訓練所需算力高出5倍以上的超級算力。
此外,亞馬遜雲科技大中華區數據分析與生成式AI產品總監崔瑋強調,公司的整體策略是以客戶需求爲導向,利用Amazon Bedrock平臺部署第一方(內部開發)和第三方(外部合作)的模型,從而爲客戶提供更加多樣化的選擇和支持。
事實上,在此次新推出的模型中,爲了實現低延時和低成本的目標,亞馬遜雲科技在其逆向工作過程中不僅專注於模型本身的優化,還在多個技術層級進行了創新。例如,正式推出的Trainium2自研芯片是關鍵組件之一,旨在提高性能同時降低成本;基於Trainium2芯片構建的這兩款實例和服務器提供了強大的計算能力,特別適用於訓練大型語言模型等任務;Amazon Bedrock層包含了“優化的低延遲推理選項”等功能,專門設計用來加速生成式AI應用的部署,並確保高效的運行效率。
據崔瑋透露,通過上述各層級的技術創新,亞馬遜雲科技能夠顯著降低客戶在部署生成式AI應用或Nova系列模型時的成本,與同等級別的其他模型相比,成本可降低約70%。
從嘗試到生產 技術落地深入應用場景
隨着生成式AI的發展,越來越多的客戶正將其業務從嘗試階段推進到生產階段。這一轉變帶來了多種任務需求,包括開發、訓練和推理等不同類型的作業。面對這些多樣化的需求,如何選擇合適的集羣和資源管理方式以實現最高效的資源利用成爲了關鍵問題,尤其是在GPU成本高昂的情況下。
“當進入到生產階段時,就不可避免地要考慮如何將數據和AI一體化管理。”崔瑋說道,這也是亞馬遜雲科技在新產品應用升級方面考慮的主要問題。
據崔瑋介紹,SageMaker 致力於幫助客戶充分利用已經預訂的雲資源,確保每個GPU和其他計算資源都能得到最大程度的應用。這是通過優化資源配置和調度來達成的,從而直接助力客戶的生產過程,減少浪費並降低成本。
在前期探索階段,客戶往往專注於評估模型和技術是否適合其業務需求。然而,當進入生產階段時,就需要考慮更復雜的問題,如如何將數據管理和AI開發整合起來,確保數據流、數據治理及安全性等方面的一體化管理。
爲此,亞馬遜雲科技推出了Amazon SageMaker Unified Studio(統一工作室)和Amazon SageMaker Lakehouse(數據湖倉)。這兩個工具旨在爲客戶提供一個統一的工作環境,使他們能夠在同一平臺上完成從數據準備到模型部署的所有步驟,簡化工作流程,提高效率,並確保數據的安全性和合規性。
“新一代Amazon SageMaker提供數據和AI的統一,去應對訓練、推理、MLOps等場景。同時,Amazon SageMaker AI也有很多新的功能來加強用戶的體驗。”崔瑋說道。
出海仍是重要場景需求
實際上,從生成式AI的應用場景選擇來看,不同行業的客戶需求和痛點各異,難以找到一個統一的應用起點。在陳曉建看來,“作爲中國區的生成式AI團隊,首要任務是與客戶合作,識別最適合的應用場景。”
而代表性的應用場景,包括,利用知識庫、代碼生成工具等提高員工工作效率;通過集成知識庫和其他AI能力,顯著改善客服響應速度和服務質量;幫助中國企業出海時解決多語言翻譯難題,特別是小語種的支持問題,而這在過去是一個非常大的挑戰。
目前,出海是中國市場的重要需求之一。據陳曉建觀察,生成式AI興起後,出現了生成式AI原生創新企業,它們藉助生成式AI開展之前無法從事的業務,發展速度迅猛,且很多在出海時選擇亞馬遜雲科技作爲承載雲平臺。“我們預測,隨着生成式AI能力逐步完善,這類生成式AI原生企業創造的應用會越來越多。從海外榜單來看,在教育、陪伴等諸多領域,很多頭部企業都是中國企業,這是一個我們看到的趨勢。”
而從2024年來看,許多企業從思考階段進入實踐階段,進行了大量場景試驗。陳曉建預測,2025年肯定會發生變化,很多客戶有望從原型驗證階段轉化爲生產階段,“這是必經之路。”在這一過程中,企業的需求將更加複雜,不僅是選擇模型,還需要各種技術支持。這也是亞馬遜雲科技在開發Amazon Bedrock等產品時,不僅提供模型市場,更重要的是提供能讓模型推理運行時所需的各種生產力工具和生產環境工具。
“中國有很多優秀的初創企業已經成功應用生成式AI,這在不同的行業清晰可見。相對而言,傳統企業進展較慢,但也在朝着應用生成式AI於生產的方向穩步邁進,我們期待明年能看到更多傳統企業在這方面取得進展。”陳曉建說道。(古雨)