阿里云,,重大消息傳來(lái)。
2月25日晚間,,阿里云旗下視覺(jué)生成基座模型萬(wàn)相2.1(Wan)正式開(kāi)源,,此次開(kāi)源采用最寬松的Apache2.0協(xié)議,,14B和1.3B兩個(gè)參數(shù)規(guī)格的全部推理代碼和權(quán)重全部開(kāi)源,,同時(shí)支持文生視頻和圖生視頻任務(wù),,全球開(kāi)發(fā)者可在Github、HuggingFace和魔搭社區(qū)下載體驗(yàn),。
阿里云實(shí)現(xiàn)全模態(tài),、全尺寸大模型開(kāi)源
據(jù)介紹,14B萬(wàn)相模型在指令遵循,、復(fù)雜運(yùn)動(dòng)生成,、物理建模、文字視頻生成等方面表現(xiàn)突出,,在權(quán)威評(píng)測(cè)集VBench中,,萬(wàn)相2.1以總分86.22%的成績(jī)大幅超越Sora、Luma,、Pika等國(guó)內(nèi)外模型,,穩(wěn)居榜首位置。1.3B版本測(cè)試結(jié)果不僅超過(guò)了更大尺寸的開(kāi)源模型,,甚至還接近部分閉源模型,,同時(shí)能在消費(fèi)級(jí)顯卡運(yùn)行,僅需8.2GB顯存就可以生成高質(zhì)量視頻,,適用于二次模型開(kāi)發(fā)和學(xué)術(shù)研究,。
在算法設(shè)計(jì)上,萬(wàn)相基于主流DiT架構(gòu)和線性噪聲軌跡Flow Matching范式,,研發(fā)了高效的因果3D VAE,、可擴(kuò)展的預(yù)訓(xùn)練策略等。以3D VAE為例,,為了高效支持任意長(zhǎng)度視頻的編碼和解碼,,萬(wàn)相在3D VAE的因果卷積模塊中實(shí)現(xiàn)了特征緩存機(jī)制,從而代替直接對(duì)長(zhǎng)視頻端到端的編解碼過(guò)程,,實(shí)現(xiàn)了無(wú)限長(zhǎng)1080P視頻的高效編解碼,。此外,通過(guò)將空間降采樣壓縮提前,,在不損失性能的情況下進(jìn)一步減少了29%的推理時(shí)內(nèi)存占用。
萬(wàn)相團(tuán)隊(duì)的實(shí)驗(yàn)結(jié)果顯示,,在運(yùn)動(dòng)質(zhì)量,、視覺(jué)質(zhì)量、風(fēng)格和多目標(biāo)等14個(gè)主要維度和26個(gè)子維度測(cè)試中,,萬(wàn)相均達(dá)到了業(yè)界領(lǐng)先表現(xiàn),,并且斬獲5項(xiàng)第一,。尤其在復(fù)雜運(yùn)動(dòng)和物理規(guī)律遵循上的表現(xiàn)上大幅提升,萬(wàn)相能夠穩(wěn)定展現(xiàn)各種復(fù)雜的人物肢體運(yùn)動(dòng),,如旋轉(zhuǎn),、跳躍、轉(zhuǎn)身,、翻滾等,;能夠精準(zhǔn)還原碰撞、反彈,、切割等復(fù)雜真實(shí)物理場(chǎng)景,。
從2023年開(kāi)始,阿里云就堅(jiān)定大模型開(kāi)源路線,。
自2023年8月起,,阿里云相繼開(kāi)源Qwen、Qwen1.5,、Qwen2,、Qwen2.5等4代模型,囊括了0.5B,、1.5B,、3B、7B,、14B,、32B、72B,、110B等全尺寸,,大語(yǔ)言、多模態(tài),、數(shù)學(xué)和代碼等全模態(tài),,多次登上國(guó)內(nèi)外權(quán)威榜單,已成為全球開(kāi)源社區(qū)最重要的模型系列,。阿里云千問(wèn)(Qwen)衍生模型數(shù)量已超過(guò)10萬(wàn)個(gè),,是全球最大的AI模型家族。
隨著萬(wàn)相的開(kāi)源,,阿里云實(shí)現(xiàn)了全模態(tài),、全尺寸大模型的開(kāi)源。
值得一提的是,,自2025年1月DeepSeek火爆出圈至今,,開(kāi)源正在成為國(guó)內(nèi)外眾多大模型的“必選項(xiàng)”。今年2月,,字節(jié)豆包,、昆侖萬(wàn)維,、百度文心、阿里通義千問(wèn)等均推出開(kāi)源模型,。
投入3800億元建設(shè)云和AI硬件基礎(chǔ)設(shè)施
阿里巴巴集團(tuán)CEO吳泳銘在2月24日宣布,,未來(lái)三年,阿里將投入超過(guò)3800億元,,用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,,總額超過(guò)去十年總和。這也創(chuàng)下中國(guó)民營(yíng)企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域有史以來(lái)最大規(guī)模投資紀(jì)錄,。
阿里這筆投入發(fā)生在兩個(gè)重要時(shí)點(diǎn)之后,。一是國(guó)內(nèi)AI產(chǎn)業(yè)爆發(fā);二是民營(yíng)企業(yè)座談會(huì)召開(kāi),。吳泳銘表示:“AI爆發(fā)遠(yuǎn)超預(yù)期,,國(guó)內(nèi)科技產(chǎn)業(yè)方興未艾,潛力巨大,。阿里巴巴將不遺余力加速云和AI硬件基礎(chǔ)設(shè)施建設(shè),,助推全行業(yè)生態(tài)發(fā)展?!?/p>
此前在2月20日,,吳泳銘在財(cái)報(bào)會(huì)上表示,阿里將于近期發(fā)布基于千問(wèn)Qwen2.5-MAX的深度推理模型,。1月底,,阿里發(fā)布了AI基礎(chǔ)大模型千問(wèn)旗艦版Qwen2.5-Max,在多項(xiàng)權(quán)威基準(zhǔn)評(píng)測(cè)中,,處于業(yè)界領(lǐng)先水平,。目前,Qwen的全球衍生模型已突破9萬(wàn)個(gè),,全球排名第一,。
2月25日,通義千問(wèn)官方賬號(hào)Qwen在海外社交平臺(tái)發(fā)布了QwQ-Max-Preview(推理模型預(yù)覽版),,即將發(fā)布QwQ-Max正式版本,、可部署在本地的較小版本以及官方App QwQ-Max。
Qwen同時(shí)宣布,,即將發(fā)布QwQ-Max的正式版本,,將在Apache 2.0許可下開(kāi)源QwQ-Max和 Qwen2.5-Max。此外,,還將提供規(guī)模較小的版本,,例如 QwQ-32B,可部署在本地設(shè)備上,。另外,,將在發(fā)布官方QwQ-Max的同時(shí)發(fā)布安卓和iOS App。
目前,,阿里云是亞洲第一的云計(jì)算公司,,阿里巴巴通義千問(wèn)大模型已成為全球頂尖的開(kāi)源模型。3800億元巨額資金繼續(xù)投入,,能極大提振相關(guān)產(chǎn)業(yè)信心,,同時(shí)也表明阿里一如既往相信未來(lái)、投資未來(lái),。