✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
一直在關注NVIDIA在企業AI領域的最新動向,值得留意。他們剛剛推出了Nemotron 3 Super——一款擁有1200億參數、專為代理式AI工作流程設計的模型,時機也透露出資金真正流向的方向。
讓我特別注意的是:他們解決的核心問題其實相當具體,與多代理系統在實際應用中的運作方式密切相關。當你運行多個需要協調的AI代理時,很快就會遇到瓶頸。每次代理交互都會重新生成完整的對話歷史、工具輸出、推理鏈——這使得令牌用量比基本聊天機器人多出15倍。在企業規模運行時,這成本就變得非常高。Nemotron 3 Super通過一個1百萬令牌的上下文窗口來解決這個問題,讓代理能夠持有整個工作流程狀態,而不需要不斷重新處理。
這裡的架構選擇比標題的規格更為重要。他們採用混合專家(Mixture-of-Experts)設計,只有12億參數在推理時保持激活,儘管總參數達到1200億。效率提升的效果相當顯著——結合多令牌預測,他們聲稱推理速度提升3倍。在Blackwell硬體上,較上一代速度提升4倍,且不影響準確率。
真正能說明問題的是採用清單。Perplexity立即整合了這款模型。CodeRabbit、Factory和Greptile也將其融入他們的AI編碼代理中。但更重磅的工業應用則更具趣味——西門子(Siemens)、Dassault Systèmes和Cadence用於製造和設計自動化。Palantir和Amdocs則用於網絡安全和電信。這不是炒作的採用,而是真正的企業在部署代理系統來支持實際工作流程。
雲端部署已在Google Cloud、Oracle推出,AWS和Azure也即將推出。推理服務商如Fireworks AI和DeepInfra已經在提供服務。這個分佈很重要,因為它傳遞出對持續需求的信心。
有一點特別引人注意:NVIDIA開源了這個模型,並提供權重和超過10兆令牌的訓練數據。這是一個策略性布局——你不僅是在銷售模型,更是在打造一個生態系統,使Blackwell成為運行企業級代理式AI的預設硬體。該模型在Artificial Analysis效率排行榜上名列前茅,驗證了其工程實力。
對於追蹤這一動向的投資者來說,Nemotron 3 Super更像是一個信號,表明NVIDIA正指向企業AI的未來——朝著需要大量計算資源的專用代理系統邁進。真正的問題在於,這些部署是否能在2026年剩餘時間內持續推動Blackwell的需求。早期跡象顯示,應該會的。