2025年英偉達開發(fā)者大會如期召開,。
相比2024年公司股價氣勢如虹,、市值突破3萬億美元,,今年英偉達需要面臨更多算力需求質(zhì)疑,股價走低,。在美國時間3月18日主題演講中,,英偉達CEO黃仁勛強調(diào)AI推理時代算力需求更加旺盛,并推出新一代AI芯片以及配套系統(tǒng),、硅光網(wǎng)絡交換機等新品,,亮相首款推理模型、首款人形機器人模型,、首個推理軟件等,,全面?zhèn)鋺?zhàn)人工智能推理時代。
不過,,會后英偉達股價下跌3.4%,,報收115.43美元/股;3月19日開盤,,A股光通信,、算力板塊走弱。
算力規(guī)模增長將超百倍
自從DeepSeek證明采用極低的算力成本可以進行模型開發(fā)后,,就引發(fā)了市場對算力需求是否持續(xù)的質(zhì)疑,,全球算力總龍頭英偉達股價從1月下旬大跌。英偉達官方及黃仁勛就曾在多個場合表示,,DeepSeek主要在模型推理上運用了創(chuàng)新技術(shù),,而AI推理依然需要大量英偉達GPU和高性能網(wǎng)絡。
本次開發(fā)者大會上,,黃仁勛大方承認,,人工智能行業(yè)在模型訓練上的整體需求放緩,不過,,他強調(diào)DeepSeek在模型推理上的創(chuàng)新,,AI推理時代即將到來,Scaling Law法則對規(guī)模的要求不僅不會變小,反而會進一步擴大,。
Scaling Law(擴展定律)是人工智能領域的核心理論,,指模型性能與參數(shù)規(guī)模、數(shù)據(jù)量,、計算資源之間的正相關關系,。這項定律長期以來也被黃仁勛奉為圭臬,以打造AI算力帝國,。
黃仁勛表示,,當前從生成式AI發(fā)展到Agentic AI(智能體),最終到物理AI(Physical AI)是行業(yè)新的發(fā)展方向,。在生成式AI階段,,“Scaling Law”法則集中體現(xiàn)在模型訓練的預訓練環(huán)節(jié);而在Agentic AI階段,,由于其強調(diào)自主性與復雜問題解決能力,,每一步邏輯思考過程都需要“模型推理”,推理將成為核心動力,。
他預測,,推理所需算力需求規(guī)模增長能“輕松超過去年估計的100倍”,未來行業(yè)需要更多,、性能更強的AI芯片,,數(shù)據(jù)中心建設的投入到2028年將達到1萬億美元。
本次演講中,,黃仁勛重點展示了英偉達“護城河”CUDA-X庫生態(tài)系統(tǒng)最新概況,,涵蓋了從物理學、生物學,,到量子計算等各個科學領域,,以及海量軟件庫,構(gòu)建起AI軟件基礎設施,,通過“軟硬一體”的戰(zhàn)略,,降低AI開發(fā)門檻,加速AI應用的落地,。
下半年推出下一代架構(gòu)
相比以往,,本次發(fā)布會上,英偉達錨定AI推理需求,,推出專為AI推理打造的NVIDIA Blackwell Ultra GPU,。相比上一代B200 GPU,它性能提升50%,,基于低精度的四位浮點數(shù)格式FP4標準算力約為15P FLOPS,,內(nèi)存從192GB提升到288GB,,搭載業(yè)內(nèi)最先進的HBM3e。在此基礎上,,HGX B300 NV16運用NVLink高速互聯(lián)網(wǎng)絡連接8個Blackwell Ultra GPU,,在大模型推理速度上相較于上一代Hopper架構(gòu)提升了11倍。
黃仁勛表示,,Blackwell已經(jīng)在全力生產(chǎn)中,客戶需求量非常龐大,。Blackwell的核心目標是構(gòu)建“AI工廠”,,如同工業(yè)革命時期的工廠一樣,AI工廠將大規(guī)模生產(chǎn)Token(詞元,,人工智能的基本構(gòu)成單元),,驅(qū)動各種智能應用。
面向企業(yè)部署AI的產(chǎn)品線方面,,英偉達推出了采用Blackwell Ultra芯片的工作站DGX station以及DGX Spark,。據(jù)介紹,今年下半年,,預計思科,、戴爾、惠普,、聯(lián)想和超微將率先推出基于Blackwell Ultra的服務器,;浪潮旗下Aivres、華擎機架,、華碩,、富士康、技嘉,、英業(yè)達,、和碩、廣達,、緯創(chuàng)和緯穎等硬件制造商也將提供Blackwell Ultra服務器解決方案,。
從去年開始,英偉達芯片架構(gòu)更新周期從兩年加速到一年,。最新芯片路線圖顯示,,英偉達將在2026年下半年推出基于下一代Rubin架構(gòu)的Rubin GPU,算力性能約是Blackwell Ultra GPU的3.3倍,;2027年下半年推出Rubin Ultra GPU,,在相同標準下算力為100P。兩款產(chǎn)品將采用HBM4,、HBM4e先進AI內(nèi)存,。到2028年,英偉達還將推出新一代Feynman架構(gòu)產(chǎn)品。
另外,,英偉達推出首款開源模型推理軟件Dynamo,,大幅提高開源模型的推理效率。據(jù)介紹,,在GB200 NVL72機架組成的大型集群上運行DeepSeek-R1模型時,,Dynamo能將每個GPU生成的Token數(shù)量提高30倍以上,處理同樣推理任務速度快30倍,。
打造物理AI引擎
隨著AI數(shù)據(jù)工廠規(guī)模的擴張,,網(wǎng)絡基礎設施也需要同步徹底革新。
本次發(fā)布會上,,英偉達還發(fā)布兩款硅光網(wǎng)絡交換機,,分別是適用于企業(yè)網(wǎng)絡的NVIDIA Spectrum-X和適用于專用計算集群的NVIDIA Quantum-X。這兩款產(chǎn)品首次利用“光電共封裝技術(shù)”(CPO)將光通信直接集成到交換機上,,是英偉達商用化硅光交換機產(chǎn)品,。英偉達希望通過將硅光子技術(shù)直接集成到交換機中,突破超大規(guī)模和企業(yè)網(wǎng)絡的傳統(tǒng)限制,,為目前萬張,、十萬張GPU的數(shù)據(jù)中心向百萬張GPU的AI工廠過渡奠定基礎。
黃仁勛表示,,圍繞云,、企業(yè)以及機器人,英偉達分別打造了“AI基礎設施”,。機器人作為具身智能載體,,英偉達推出了生成機器人訓練數(shù)據(jù)的物理世界模型Cosmos、人形機器人基礎模型GROOT N1以及3D實時仿真平臺Omniverse,;
其中,,本次新推出的GROOT N1是通用機器人基礎模型,也是全球首款開源的人形機器人功能模型,。該模型采用雙系統(tǒng)架構(gòu),,建立在合成數(shù)據(jù)生成和模擬學習的基礎上,能模仿人類認知,,具備“快思考”和“慢思考”能力,,可讓機器人實現(xiàn)抓取、操作和使用工具等動作,,開發(fā)者還能用自己的數(shù)據(jù)對其進行微調(diào),。另外,英偉達利用Omniverse平臺來調(diào)節(jié)Cosmos生成模型,,通過集成物理引擎和GPU加速技術(shù),,實現(xiàn)虛擬環(huán)境的無限擴展和精確控制,,利用合成數(shù)據(jù)解決機器人訓練的數(shù)據(jù)問題。
面向機器人仿真,,英偉達聯(lián)合谷歌DeepMind和迪士尼研究院共同開發(fā)打開源物理引擎Newton,,用于模擬人工智能、機器人和機器學習,。在演講現(xiàn)場,,名叫Blue的機器人上臺露面,與黃仁勛互動,,該機器人配有英偉達最新的GR00T N1機器人通用基礎模型,。
本次開發(fā)者大會上,英偉達對量子計算的態(tài)度發(fā)生轉(zhuǎn)變,,宣布將在波士頓建設NVIDIA加速量子研究中心(NVAQC)。據(jù)介紹,,NVAQC將使用最先進的英偉達GB200 NVL72機架級系統(tǒng)以及CUDA-Q量子開發(fā)平臺,,幫助實現(xiàn)量子系統(tǒng)的復雜模擬,開發(fā)新的混合量子算法和應用程序,。
去年谷歌發(fā)布的Willow芯片攻克困擾量子計算研究30年的“量子糾錯”難題,,市場升溫帶動量子計算概念股股價上漲;今年2月,,微軟宣布推出全球首款拓撲量子計算芯片Majorana1,,驗證了拓撲量子比特的可行性,也被視作為未來規(guī)?;瘧玫於嘶A,。而黃仁勛曾在今年1月表示要造出“非常有用的量子計算機”,可能需要20年,。該評論導致量子計算相關股票應聲下跌,。
對于市場擔憂量子計算顛覆性影響,黃仁勛表示,,量子計算不會單獨取代現(xiàn)有的計算技術(shù),,而是作為AI計算能力的補充。未來的量子計算將成為AI超級計算機的“增強工具”,,在藥物開發(fā),、新材料制造等特定高復雜性領域發(fā)揮作用。