簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

文章來源: 騰訊科技 於 2025-12-02 19:15:21 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數
亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

當地時間12月2日,亞馬遜雲計算部門AWS的年度技術盛會re:Invent 2025在美國拉斯維加斯正式開幕。

大會首日,AWS一口氣發布了Trainium 3自研AI芯片、Trainium 4路線圖、AI工廠(AI Factory)主權雲服務、Nova 2係列四大基礎模型、Nova Forge開放式模型定製平台以及Bedrock AgentCore智能體工程化平台等一係列產品,係統構建起“芯片—模型—智能體—混合雲”的全棧AI生態。

這場全球最具影響力的雲與AI盛會恰逢人工智能產業從技術爆發期邁向規模化應用期的關鍵節點。頭部企業持續加碼算力,傳統行業對AI的需求已從“嚐鮮式”試點轉向“剛需式”深度應用,數據主權、算力成本、生態兼容性等現實難題日益凸顯。AWS此次沒有進行零散的產品迭代,而是推出深度融合的全棧AI基礎設施與服務體係,以成本優化、生態開放、合規適配三大核心優勢,效仿穀歌直擊行業痛點,強勢搶占全球AI算力、模型與雲服務市場的戰略製高點。

AWS首席執行官馬特·加爾曼(Matt Garman)在開幕主題演講中做出重磅判斷:“智能體AI(Agentic AI)將成為企業真正釋放AI價值的關鍵,未來貢獻占比將達80%至90%。”他指出,當前企業AI應用普遍麵臨碎片化困境:算力成本高企、模型難以深度適配業務、智能體部署缺乏標準化工具,導致技術與商業價值之間存在巨大鴻溝。

此次全線新品正是圍繞“智能體優先”這一核心願景打造的全鏈路戰略部署,標誌著AWS正式完成從傳統雲服務提供商向智能體AI生態構建者的轉型,致力於用全棧能力徹底打通AI落地的“最後一公裏”。

01.硬件突破:Trainium 3性能提升4.4倍,未來將兼容英偉達NVLink Fusion技術



Trainium 3芯片

作為AI生態最底層的基石,AWS在定製芯片領域的深耕已持續多年。目前其定製芯片業務規模已達數十億美元,Trainium係列芯片全球部署總量突破100萬張,成為支撐超大規模AI計算的核心支柱,在全球雲廠商自研芯片中僅次於穀歌TPU。

此次發布的Trainium 3芯片采用台積電3納米製程工藝,專為“推理主導”的時代量身打造。隨著大模型訓練逐步向少數頭部玩家集中,廣大中小企業的核心需求轉向低成本、高效率的推理部署,能耗與成本成為最大瓶頸,Trainium 3精準切中這一市場痛點,實現性能與成本的雙重顛覆。

相較上一代,Trainium 3原始性能提升4.4倍,性能功耗比提升4倍,整體能源效率提升40%,直接破解了大規模數據中心在能耗與成本上的難題。實測數據顯示,部署主流開源模型(如 GPT-OSS)時,單芯片吞吐量提升3倍,響應延遲縮短4倍。

AWS表示,Trainium 3有望將AI模型全生命周期(訓練+推理)成本整體降低50%,在當前算力市場極具競爭力。在英偉達GPU長期占據絕對主導、價格居高不下的背景下,Trainium 3為企業提供了真正可落地的性價比替代方案。

架構層麵,Trainium 3單芯片提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多種精度格式。為解決大語言模型最突出的內存瓶頸,該芯片將HBM3e內存容量提升至144GB、帶寬提升至4.9TB/s,同時強化結構化稀疏性和微縮放硬件支持,進一步優化大語言模型訓練與推理效率。

得益於全新一代Neuron Fabric互聯技術,單台Trn3 UltraServer可集成144張芯片,總算力達362 FP8 PFLOPs;通過EC2 UltraClusters 3.0架構,可擴展至最高100萬張芯片的超級集群,規模較上一代提升10倍,已為Anthropic的“Project Rainier”項目提供核心算力支撐(目前已部署50萬張Trainium 2,計劃年底前擴容至100萬張)。Karakuri、Metagenomi、NetoAI等客戶反饋,使用 Trainium 3後訓練與推理成本最高降低 50%,充分驗證了其在真實生產環境中的成本優勢。



AWS提前披露Trainium 4關鍵特性

更具深遠影響的是,AWS提前披露了Trainium 4的關鍵特性:將原生支持英偉達NVLink Fusion高速互聯技術,徹底打破雲廠商自研芯片長期以來的“封閉生態”慣例,展現出“共存並競爭”的務實策略。目前全球約80%的AI應用基於英偉達CUDA生態開發,遷移成本極高。兼容NVLink Fusion後,企業可在同一集群內靈活混搭Trainium與英偉達GPU,按需分配任務(如訓練用GPU、推理用Trainium),大幅降低遷移門檻。

Trainium 4預計FP8算力提升3倍、FP4算力提升6倍,內存帶寬與容量分別提升4倍和2倍,並將與Graviton CPU、EFA網絡及英偉達MGX機架深度融合。這一“以開放換市場”的舉措,被業界視為 Trainium係列真正實現規模化普及的轉折點。

02.基礎設施延伸:AI工廠落地主權雲,混合部署一舉破解全球合規難題



隨著AI深入政府、金融、醫療等高敏感行業,數據主權與合規性已成為全球性瓶頸。歐盟GDPR、美國國防與醫療安全審查等政策使得純公有雲難以滿足要求。AWS此次推出AI工廠服務,將全棧AI能力從公有雲完整延伸至客戶本地或指定區域,快速構建功能等同於私有AWS區域的專屬環境。

通過AI工廠,客戶可實現數據本地化處理與存儲,100%滿足數據主權與行業合規要求,AWS負責基礎設施全生命周期的部署、運維與升級,徹底解決傳統私有雲“部署難、維護貴”的問題。結合Trainium芯片、英偉達加速卡、高性能網絡以及Bedrock、SageMaker等全套服務,AI工廠將私有雲部署周期從數年縮短至數月。AWS同時宣布未來幾年投資500億美元建設美國政府專用高性能計算與AI數據中心,投入規模遠超同行。

全球落地方麵,AWS已同沙特Humain公司合作建設部署15萬張AI芯片的“AI Zone”,基於GB300 GPU實現多吉瓦級擴展,服務智慧城市、醫療健康等領域;AWS歐洲主權雲將正式上線,數據中心位於歐盟境內,由歐盟本地團隊獨立運營。客戶可按需選擇Trainium或英偉達最新Grace Blackwell、Vera Rubin平台,實現敏感任務本地化、非敏感任務公有雲彈性擴展的最優平衡。

03.模型革新:Nova 2家族全麵對標行業頂尖,Nova Forge開創“開放式深度定製”新範式

在模型層,AWS此前的表現相對低調,市場份額多被OpenAI、Anthropic等專業模型廠商占據。此次升級的Nova 2模型家族顯然是AWS發力模型市場的關鍵舉措,推出Lite、Pro、Sonic、Omni四款細分產品,全麵覆蓋推理、多模態、對話AI與代碼生成等核心場景,直接對標行業頭部模型。



Nova 2 Lite的基準測試數據

其中,Nova 2 Lite作為高性價比推理模型,支持文本、圖像、視頻等多格式輸入,上下文窗口達100萬token,性能對標Anthropic Claude 4.5 Haiku、OpenAI GPT-5 Mini等主流高效模型,主要麵向中小企業的輕量化推理需求。



Nova 2 Pro的基準測試數據

Nova 2 Pro則瞄準複雜任務處理,推理能力媲美甚至超越OpenAI GPT-5、Google Gemini 3.0 Pro 等旗艦模型,特別適用於智能體相關任務。其強大的邏輯推理與工具調用能力,正是智能體完成複雜業務流程的核心,該模型目前已向Nova Forge早期客戶開放預覽。​

Nova 2 Sonic專注於實時多語言對話場景,100萬token的上下文窗口可容納7.5萬行代碼或1500頁文本,支持20餘種語言的實時轉譯與對話,瞄準客服、跨境溝通等場景。

Nova 2 Omni作為全模態模型,能夠同時處理圖像、音頻、視頻和文本輸入,並通過模擬推理生成多樣化輸出。例如,該模型可直接分析一段工業生產視頻,識別設備故障並生成維修方案,為長文檔、視頻等複雜媒體處理提供一體化解決方案,填補了AWS在全模態領域的短板。​



Nova Forge服務

AWS此次發布的Nova Forge服務顛覆了傳統模型定製模式。傳統模型定製多采用“微調”方式,在預訓練完成的模型基礎上,用企業數據進行二次訓練。這種方式難以讓企業專有知識深度融入模型底層,定製效果有限,且成本高昂。動輒數百萬美元的定製費用讓中小企業望而卻步。

Nova Forge允許企業支付10萬美元年費,不含工程師協助費用,在模型預訓練、中期訓練和後訓練三個關鍵階段接入Nova模型的檢查點,將自有數據深度嵌入訓練過程,打造具備專業領域知識的“定製模型”。這種模式大幅降低了深度定製的門檻,同時讓模型更貼合企業業務邏輯。​

實際應用中,Reddit利用該服務打造的“Reddit專家模型”,在平台敏感內容審核方麵表現遠超通用大語言模型。該模型能夠精準識別Reddit社區特有的slang用語、梗文化相關的違規內容,誤判率降低30%。生物技術公司Nimbus Therapeutics將藥物研發數據嵌入Nova模型,構建的定製模型在分子結構預測、臨床試驗數據分析等任務中,效率較通用模型提升40%。Booking.com則通過定製模型優化酒店推薦算法,用戶轉化率提升15%。

相較於投入數億美元從零構建模型,Nova Forge為企業提供了更經濟高效的專業化路徑,目前已支持Nova 2 Lite,並計劃擴展至Pro和Omni模型。

04.應用落地:Bedrock AgentCore破解工程化難題,智能體加速企業部署



智能體AI雖被寄予厚望,但企業部署過程中麵臨的工程化難題不容忽視。安全合規風險、可靠性難以評估、長期記憶能力不足等問題,導致多數智能體仍停留在概念驗證階段,難以規模化落地。

AWS重點升級了 Amazon Bedrock AgentCore平台,針對企業部署中的核心需求提供一站式解決方案。該平台目前已全麵通用可用,兼容CrewAI、LangGraph等開源框架及各類基礎模型。這種開放性避免了企業被單一生態綁定,降低了開發成本。​

在安全治理方麵,AgentCore Policy功能允許開發者通過自然語言定義智能體的操作邊界。例如“禁止訪問財務部門數據庫”“自動退款額度不得超過1000美元” 等,通過AgentCore Gateway實時攔截違規 API調用,實現獨立於智能體代碼的確定性控製。這一功能解決了智能體“越權操作”的風險,尤其適用於金融、醫療等監管嚴格的行業。該功能目前已進入預覽階段,AWS表示將後續支持更細粒度的權限管控,例如基於角色的訪問控製(RBAC)與數據脫敏處理。​

針對智能體可靠性難題,平台內置13種預置評估係統,覆蓋準確性、安全性、工具選擇邏輯、響應質量等關鍵維度,可對智能體進行持續監控。與傳統人工評估不同,該係統通過大語言模型輔助生成評估報告,並解釋失敗原因。

例如,智能體未完成預訂任務時,係統會自動分析是工具調用錯誤、參數設置不當還是上下文理解偏差,幫助開發者快速定位問題。這一能力大幅降低了企業自建評估體係的工程成本,據AWS客戶反饋,采用AgentCore評估工具後,智能體從概念驗證到生產部署的周期平均縮短60%。​

記憶功能的升級讓智能體具備了長期服務能力。AgentCore Memory可記錄用戶交互曆史與偏好,支持多輪會話和跨任務場景的上下文連貫性。例如,用戶此前告知智能體 “偏好無煙酒店”,後續預訂時無需重複說明。新增的情景學習(Episodic Learning)功能,能讓智能體從過往經驗中持續優化決策質量。例如,在多次處理客戶投訴後,智能體可自動總結最優解決方案。這些能力已在實際應用中展現價值。

PGA TOUR通過該平台構建的內容生成智能體,實現賽事新聞、球員數據報告的自動化生成,速度提升1000%,成本降低95%。Heroku基於平台構建的應用開發智能體,可協助開發者完成代碼調試、部署流程自動化,開發效率提升30%。包括納斯達克、百時美施貴寶等企業都已在借助該平台推動交易風控、藥物研發等業務流程的自主化轉型。​

從底層Trainium芯片的算力突破,到AI工廠的混合雲部署延伸,再到Nova係列模型的定製化能力,最終通過Bedrock AgentCore實現智能體工程化落地,AWS在re:Invent 2025上完整呈現了“芯片-模型-智能體-混合雲” 的全棧戰略布局。

這一架構並非孤立模塊的簡單疊加,而是通過各層級的深度協同形成合力。Trainium芯片為模型訓練與智能體運行提供低成本算力支撐,AI工廠解決合規部署難題,Nova Forge讓模型適配業務場景,Bedrock AgentCore降低智能體開發門檻。這種協同效應構建了強大的競爭壁壘,使其區別於僅專注於單一環節的廠商。​

05.全棧協同構建競爭壁壘,AWS欲定義智能體AI的未來

在全球AI競爭進入深水區的當下,AWS的戰略轉型意義深遠。硬件層通過能效革命與生態開放,在英偉達主導的市場中開辟出差異化路徑。基礎設施層以主權雲解決方案,切入政府與受監管行業這一高價值市場;模型層用深度定製服務,滿足企業“專業化”而非“通用化”的核心需求;應用層靠工程化工具,打通AI從技術到價值的轉化通道。

這種全棧協同的競爭模式,不僅將重塑AI基礎設施的市場格局,還將推動企業智能化從單點應用走向全域自主化運營。未來,企業無需再整合多個廠商的產品,即可通過AWS生態快速構建貼合自身需求的智能體解決方案,這將大幅降低AI應用門檻,加速產業智能化進程。​

當然,AWS的布局也麵臨挑戰。

Trainium芯片的生態兼容性仍需時間驗證,Nova模型的市場認可度需與OpenAI、Anthropic等廠商競爭,AI工廠的本地化部署能力還需應對不同地區的監管差異。

但不可否認的是,AWS此次發布的全棧戰略,為行業提供了一種AI落地的全新範式。隨著這一係列創新成果的落地,智能體AI有望真正突破技術瓶頸,成為驅動企業增長的核心引擎,開啟人工智能商業化的全新階段。

  • 海外省錢快報,掌櫃推薦,實現買買買自由!
查看評論(3)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

汶川地震被救女孩,12年後與施救軍人結婚了
手都伸到老百姓床上了,還覺得沒問題嗎?
報告“末次月經”!已經變形到讓人“不適”了
合肥“奇跡”,又打臉了唱衰者
白銀漲瘋了,市場在釋放什麽信號?




24小時討論排行

引用中日聯合聲明,高市早苗涉台最新表態“軟化”
美熟練技工短缺破百萬 福特CEO:落後大陸難維持
特朗普簽署台灣保證實施法案,中國批:粗暴幹涉內政
美俄會談結束: 沒有就俄占領土達成任何妥協
曾嘲笑拜登是"瞌睡喬",特朗普二度被拍到開會時打盹
川普正式宣布:拜登"自動簽名機"代簽文件全部作廢
全球首次!中國醫生成功治療狼瘡,登頂《柳葉刀》
全球年收700億!詐騙成東南亞GDP引擎,規模恐超越毒品
普京:如果歐洲想開戰,我們現在就準備好了!
美擴大AI供應鏈同盟,特朗普稱"中國追不上美國"
中國人帶娃偷渡美國“避難” 結果父親被抓孩子“失蹤”
中國科學家研究新進展 終結愛因斯坦與玻爾世紀之辯
特朗普:任何向美國走私非法毒品的國家都可能受美方攻擊
戴爾創辦人捐62.5億元!助2500兒童獲"川普帳戶"基金
多名留美學生海外租房遇“定金連環”騙局 交錢後被拉黑
特朗普的政治麻煩:一個"不留活口"的國防部長
文學城新聞
切換到網頁版

亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

騰訊科技 2025-12-02 19:15:21
亞馬遜技術大會強勢來襲:自研芯片性能暴增4.4倍

當地時間12月2日,亞馬遜雲計算部門AWS的年度技術盛會re:Invent 2025在美國拉斯維加斯正式開幕。

大會首日,AWS一口氣發布了Trainium 3自研AI芯片、Trainium 4路線圖、AI工廠(AI Factory)主權雲服務、Nova 2係列四大基礎模型、Nova Forge開放式模型定製平台以及Bedrock AgentCore智能體工程化平台等一係列產品,係統構建起“芯片—模型—智能體—混合雲”的全棧AI生態。

這場全球最具影響力的雲與AI盛會恰逢人工智能產業從技術爆發期邁向規模化應用期的關鍵節點。頭部企業持續加碼算力,傳統行業對AI的需求已從“嚐鮮式”試點轉向“剛需式”深度應用,數據主權、算力成本、生態兼容性等現實難題日益凸顯。AWS此次沒有進行零散的產品迭代,而是推出深度融合的全棧AI基礎設施與服務體係,以成本優化、生態開放、合規適配三大核心優勢,效仿穀歌直擊行業痛點,強勢搶占全球AI算力、模型與雲服務市場的戰略製高點。

AWS首席執行官馬特·加爾曼(Matt Garman)在開幕主題演講中做出重磅判斷:“智能體AI(Agentic AI)將成為企業真正釋放AI價值的關鍵,未來貢獻占比將達80%至90%。”他指出,當前企業AI應用普遍麵臨碎片化困境:算力成本高企、模型難以深度適配業務、智能體部署缺乏標準化工具,導致技術與商業價值之間存在巨大鴻溝。

此次全線新品正是圍繞“智能體優先”這一核心願景打造的全鏈路戰略部署,標誌著AWS正式完成從傳統雲服務提供商向智能體AI生態構建者的轉型,致力於用全棧能力徹底打通AI落地的“最後一公裏”。

01.硬件突破:Trainium 3性能提升4.4倍,未來將兼容英偉達NVLink Fusion技術



Trainium 3芯片

作為AI生態最底層的基石,AWS在定製芯片領域的深耕已持續多年。目前其定製芯片業務規模已達數十億美元,Trainium係列芯片全球部署總量突破100萬張,成為支撐超大規模AI計算的核心支柱,在全球雲廠商自研芯片中僅次於穀歌TPU。

此次發布的Trainium 3芯片采用台積電3納米製程工藝,專為“推理主導”的時代量身打造。隨著大模型訓練逐步向少數頭部玩家集中,廣大中小企業的核心需求轉向低成本、高效率的推理部署,能耗與成本成為最大瓶頸,Trainium 3精準切中這一市場痛點,實現性能與成本的雙重顛覆。

相較上一代,Trainium 3原始性能提升4.4倍,性能功耗比提升4倍,整體能源效率提升40%,直接破解了大規模數據中心在能耗與成本上的難題。實測數據顯示,部署主流開源模型(如 GPT-OSS)時,單芯片吞吐量提升3倍,響應延遲縮短4倍。

AWS表示,Trainium 3有望將AI模型全生命周期(訓練+推理)成本整體降低50%,在當前算力市場極具競爭力。在英偉達GPU長期占據絕對主導、價格居高不下的背景下,Trainium 3為企業提供了真正可落地的性價比替代方案。

架構層麵,Trainium 3單芯片提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多種精度格式。為解決大語言模型最突出的內存瓶頸,該芯片將HBM3e內存容量提升至144GB、帶寬提升至4.9TB/s,同時強化結構化稀疏性和微縮放硬件支持,進一步優化大語言模型訓練與推理效率。

得益於全新一代Neuron Fabric互聯技術,單台Trn3 UltraServer可集成144張芯片,總算力達362 FP8 PFLOPs;通過EC2 UltraClusters 3.0架構,可擴展至最高100萬張芯片的超級集群,規模較上一代提升10倍,已為Anthropic的“Project Rainier”項目提供核心算力支撐(目前已部署50萬張Trainium 2,計劃年底前擴容至100萬張)。Karakuri、Metagenomi、NetoAI等客戶反饋,使用 Trainium 3後訓練與推理成本最高降低 50%,充分驗證了其在真實生產環境中的成本優勢。



AWS提前披露Trainium 4關鍵特性

更具深遠影響的是,AWS提前披露了Trainium 4的關鍵特性:將原生支持英偉達NVLink Fusion高速互聯技術,徹底打破雲廠商自研芯片長期以來的“封閉生態”慣例,展現出“共存並競爭”的務實策略。目前全球約80%的AI應用基於英偉達CUDA生態開發,遷移成本極高。兼容NVLink Fusion後,企業可在同一集群內靈活混搭Trainium與英偉達GPU,按需分配任務(如訓練用GPU、推理用Trainium),大幅降低遷移門檻。

Trainium 4預計FP8算力提升3倍、FP4算力提升6倍,內存帶寬與容量分別提升4倍和2倍,並將與Graviton CPU、EFA網絡及英偉達MGX機架深度融合。這一“以開放換市場”的舉措,被業界視為 Trainium係列真正實現規模化普及的轉折點。

02.基礎設施延伸:AI工廠落地主權雲,混合部署一舉破解全球合規難題



隨著AI深入政府、金融、醫療等高敏感行業,數據主權與合規性已成為全球性瓶頸。歐盟GDPR、美國國防與醫療安全審查等政策使得純公有雲難以滿足要求。AWS此次推出AI工廠服務,將全棧AI能力從公有雲完整延伸至客戶本地或指定區域,快速構建功能等同於私有AWS區域的專屬環境。

通過AI工廠,客戶可實現數據本地化處理與存儲,100%滿足數據主權與行業合規要求,AWS負責基礎設施全生命周期的部署、運維與升級,徹底解決傳統私有雲“部署難、維護貴”的問題。結合Trainium芯片、英偉達加速卡、高性能網絡以及Bedrock、SageMaker等全套服務,AI工廠將私有雲部署周期從數年縮短至數月。AWS同時宣布未來幾年投資500億美元建設美國政府專用高性能計算與AI數據中心,投入規模遠超同行。

全球落地方麵,AWS已同沙特Humain公司合作建設部署15萬張AI芯片的“AI Zone”,基於GB300 GPU實現多吉瓦級擴展,服務智慧城市、醫療健康等領域;AWS歐洲主權雲將正式上線,數據中心位於歐盟境內,由歐盟本地團隊獨立運營。客戶可按需選擇Trainium或英偉達最新Grace Blackwell、Vera Rubin平台,實現敏感任務本地化、非敏感任務公有雲彈性擴展的最優平衡。

03.模型革新:Nova 2家族全麵對標行業頂尖,Nova Forge開創“開放式深度定製”新範式

在模型層,AWS此前的表現相對低調,市場份額多被OpenAI、Anthropic等專業模型廠商占據。此次升級的Nova 2模型家族顯然是AWS發力模型市場的關鍵舉措,推出Lite、Pro、Sonic、Omni四款細分產品,全麵覆蓋推理、多模態、對話AI與代碼生成等核心場景,直接對標行業頭部模型。



Nova 2 Lite的基準測試數據

其中,Nova 2 Lite作為高性價比推理模型,支持文本、圖像、視頻等多格式輸入,上下文窗口達100萬token,性能對標Anthropic Claude 4.5 Haiku、OpenAI GPT-5 Mini等主流高效模型,主要麵向中小企業的輕量化推理需求。



Nova 2 Pro的基準測試數據

Nova 2 Pro則瞄準複雜任務處理,推理能力媲美甚至超越OpenAI GPT-5、Google Gemini 3.0 Pro 等旗艦模型,特別適用於智能體相關任務。其強大的邏輯推理與工具調用能力,正是智能體完成複雜業務流程的核心,該模型目前已向Nova Forge早期客戶開放預覽。​

Nova 2 Sonic專注於實時多語言對話場景,100萬token的上下文窗口可容納7.5萬行代碼或1500頁文本,支持20餘種語言的實時轉譯與對話,瞄準客服、跨境溝通等場景。

Nova 2 Omni作為全模態模型,能夠同時處理圖像、音頻、視頻和文本輸入,並通過模擬推理生成多樣化輸出。例如,該模型可直接分析一段工業生產視頻,識別設備故障並生成維修方案,為長文檔、視頻等複雜媒體處理提供一體化解決方案,填補了AWS在全模態領域的短板。​



Nova Forge服務

AWS此次發布的Nova Forge服務顛覆了傳統模型定製模式。傳統模型定製多采用“微調”方式,在預訓練完成的模型基礎上,用企業數據進行二次訓練。這種方式難以讓企業專有知識深度融入模型底層,定製效果有限,且成本高昂。動輒數百萬美元的定製費用讓中小企業望而卻步。

Nova Forge允許企業支付10萬美元年費,不含工程師協助費用,在模型預訓練、中期訓練和後訓練三個關鍵階段接入Nova模型的檢查點,將自有數據深度嵌入訓練過程,打造具備專業領域知識的“定製模型”。這種模式大幅降低了深度定製的門檻,同時讓模型更貼合企業業務邏輯。​

實際應用中,Reddit利用該服務打造的“Reddit專家模型”,在平台敏感內容審核方麵表現遠超通用大語言模型。該模型能夠精準識別Reddit社區特有的slang用語、梗文化相關的違規內容,誤判率降低30%。生物技術公司Nimbus Therapeutics將藥物研發數據嵌入Nova模型,構建的定製模型在分子結構預測、臨床試驗數據分析等任務中,效率較通用模型提升40%。Booking.com則通過定製模型優化酒店推薦算法,用戶轉化率提升15%。

相較於投入數億美元從零構建模型,Nova Forge為企業提供了更經濟高效的專業化路徑,目前已支持Nova 2 Lite,並計劃擴展至Pro和Omni模型。

04.應用落地:Bedrock AgentCore破解工程化難題,智能體加速企業部署



智能體AI雖被寄予厚望,但企業部署過程中麵臨的工程化難題不容忽視。安全合規風險、可靠性難以評估、長期記憶能力不足等問題,導致多數智能體仍停留在概念驗證階段,難以規模化落地。

AWS重點升級了 Amazon Bedrock AgentCore平台,針對企業部署中的核心需求提供一站式解決方案。該平台目前已全麵通用可用,兼容CrewAI、LangGraph等開源框架及各類基礎模型。這種開放性避免了企業被單一生態綁定,降低了開發成本。​

在安全治理方麵,AgentCore Policy功能允許開發者通過自然語言定義智能體的操作邊界。例如“禁止訪問財務部門數據庫”“自動退款額度不得超過1000美元” 等,通過AgentCore Gateway實時攔截違規 API調用,實現獨立於智能體代碼的確定性控製。這一功能解決了智能體“越權操作”的風險,尤其適用於金融、醫療等監管嚴格的行業。該功能目前已進入預覽階段,AWS表示將後續支持更細粒度的權限管控,例如基於角色的訪問控製(RBAC)與數據脫敏處理。​

針對智能體可靠性難題,平台內置13種預置評估係統,覆蓋準確性、安全性、工具選擇邏輯、響應質量等關鍵維度,可對智能體進行持續監控。與傳統人工評估不同,該係統通過大語言模型輔助生成評估報告,並解釋失敗原因。

例如,智能體未完成預訂任務時,係統會自動分析是工具調用錯誤、參數設置不當還是上下文理解偏差,幫助開發者快速定位問題。這一能力大幅降低了企業自建評估體係的工程成本,據AWS客戶反饋,采用AgentCore評估工具後,智能體從概念驗證到生產部署的周期平均縮短60%。​

記憶功能的升級讓智能體具備了長期服務能力。AgentCore Memory可記錄用戶交互曆史與偏好,支持多輪會話和跨任務場景的上下文連貫性。例如,用戶此前告知智能體 “偏好無煙酒店”,後續預訂時無需重複說明。新增的情景學習(Episodic Learning)功能,能讓智能體從過往經驗中持續優化決策質量。例如,在多次處理客戶投訴後,智能體可自動總結最優解決方案。這些能力已在實際應用中展現價值。

PGA TOUR通過該平台構建的內容生成智能體,實現賽事新聞、球員數據報告的自動化生成,速度提升1000%,成本降低95%。Heroku基於平台構建的應用開發智能體,可協助開發者完成代碼調試、部署流程自動化,開發效率提升30%。包括納斯達克、百時美施貴寶等企業都已在借助該平台推動交易風控、藥物研發等業務流程的自主化轉型。​

從底層Trainium芯片的算力突破,到AI工廠的混合雲部署延伸,再到Nova係列模型的定製化能力,最終通過Bedrock AgentCore實現智能體工程化落地,AWS在re:Invent 2025上完整呈現了“芯片-模型-智能體-混合雲” 的全棧戰略布局。

這一架構並非孤立模塊的簡單疊加,而是通過各層級的深度協同形成合力。Trainium芯片為模型訓練與智能體運行提供低成本算力支撐,AI工廠解決合規部署難題,Nova Forge讓模型適配業務場景,Bedrock AgentCore降低智能體開發門檻。這種協同效應構建了強大的競爭壁壘,使其區別於僅專注於單一環節的廠商。​

05.全棧協同構建競爭壁壘,AWS欲定義智能體AI的未來

在全球AI競爭進入深水區的當下,AWS的戰略轉型意義深遠。硬件層通過能效革命與生態開放,在英偉達主導的市場中開辟出差異化路徑。基礎設施層以主權雲解決方案,切入政府與受監管行業這一高價值市場;模型層用深度定製服務,滿足企業“專業化”而非“通用化”的核心需求;應用層靠工程化工具,打通AI從技術到價值的轉化通道。

這種全棧協同的競爭模式,不僅將重塑AI基礎設施的市場格局,還將推動企業智能化從單點應用走向全域自主化運營。未來,企業無需再整合多個廠商的產品,即可通過AWS生態快速構建貼合自身需求的智能體解決方案,這將大幅降低AI應用門檻,加速產業智能化進程。​

當然,AWS的布局也麵臨挑戰。

Trainium芯片的生態兼容性仍需時間驗證,Nova模型的市場認可度需與OpenAI、Anthropic等廠商競爭,AI工廠的本地化部署能力還需應對不同地區的監管差異。

但不可否認的是,AWS此次發布的全棧戰略,為行業提供了一種AI落地的全新範式。隨著這一係列創新成果的落地,智能體AI有望真正突破技術瓶頸,成為驅動企業增長的核心引擎,開啟人工智能商業化的全新階段。