在3D生成大模型賽道,,騰訊跑在了大廠(chǎng)的最前面,。
1月22日,,騰訊上線(xiàn)了首個(gè)一站式3D內(nèi)容AI創(chuàng)作平臺(tái)——混元3D AI創(chuàng)作引擎2.0,并正式宣布開(kāi)源,。新版本包含基礎(chǔ)模型生成,、3D功能矩陣、3D編輯,、3D生成工作流,、創(chuàng)作素材庫(kù)等功能,目前已面向用戶(hù)和開(kāi)發(fā)者開(kāi)放,。
該引擎支持文生及圖生3D,。用戶(hù)輸入中/英文提示詞,描述主體內(nèi)容,、特征,、風(fēng)格等,即可快速生成生成4個(gè)3D模型,,同時(shí),,也支持上傳單圖生成3D模型。效果上,,可以選擇不同紋理風(fēng)格進(jìn)行生成,。對(duì)比去年11月發(fā)布的1.0版本,2.0版本在生成效果上有明顯提升,。
AI正在3D模型生成中扮演日漸重要的角色,。游戲制作、社交,、電商廣告,、工業(yè)制造、具身智能,、自動(dòng)駕駛,、AR/VR、三維打印等多個(gè)領(lǐng)域都已開(kāi)始應(yīng)用AI能力輔助3D內(nèi)容生產(chǎn),。以游戲制作為例,,3D管線(xiàn)(即將 3D 場(chǎng)景數(shù)據(jù)轉(zhuǎn)化為最終呈現(xiàn)在屏幕上的 2D 圖像)是最為核心的環(huán)節(jié)之一,但同時(shí)也最考驗(yàn)時(shí)間和資金成本,。
美術(shù)成本往往占一款游戲開(kāi)發(fā)總成本的50%,,而3D模型成本占美術(shù)總成本的30%~40%。錦秋基金報(bào)告中也提及,,一個(gè)十萬(wàn)面以上的3D高模資源,,廠(chǎng)商如果委托外包團(tuán)隊(duì)生產(chǎn),價(jià)格至少需要3萬(wàn)元,,時(shí)間需要30-45天,。如果在3D資產(chǎn)庫(kù)購(gòu)買(mǎi),,除了存在可選資產(chǎn)有限的問(wèn)題,通常也需要5-10人/天進(jìn)行清洗才可以使用,。
而3D生成大模型能夠在很大程度上改變這種現(xiàn)狀,。騰訊游戲在研項(xiàng)目研發(fā)制作人王智剛提到,混元3D AI創(chuàng)作引擎已經(jīng)開(kāi)始支持騰訊游戲,、地圖,、元寶等業(yè)務(wù)的部分需求。以游戲?yàn)槔?,在混元的支持下,,騰訊游戲業(yè)務(wù)3D資產(chǎn)制作時(shí)間成本可從5-10天級(jí)別下降到分鐘級(jí)。對(duì)于微信小游戲這類(lèi)輕度游戲的3D生成需求,,也基本可以實(shí)現(xiàn)覆蓋,。
對(duì)3D模型生成有高頻需求的不止是游戲行業(yè)。當(dāng)AI走向更高階的水平,,它將不僅限于對(duì)文本,、圖像、視頻等1D或者2D內(nèi)容的理解,,而是不斷發(fā)展成理解真實(shí)物理世界的三維空間,,這也是具身智能、自動(dòng)駕駛等廠(chǎng)商的剛需,。它們很難在現(xiàn)實(shí)中采集到全面,、多樣的訓(xùn)練數(shù)據(jù),而AI生成的3D模型則能夠補(bǔ)充這種能力,。
騰訊混元3D負(fù)責(zé)人郭春超透露,,目前已經(jīng)有一批具身智能、自動(dòng)駕駛廠(chǎng)商來(lái)尋求合作,。
不過(guò),,相比起文生圖等較為成熟的生成式AI應(yīng)用,3D模型的技術(shù)成熟度還遠(yuǎn)遠(yuǎn)不夠,。郭春超認(rèn)為,,3D模型面臨的主要挑戰(zhàn)之一是數(shù)據(jù)量不足。相較于文本和2D圖像數(shù)據(jù),,可供訓(xùn)練的3D數(shù)據(jù)并不多,,且經(jīng)過(guò)標(biāo)注和語(yǔ)義匹配的3D數(shù)據(jù)則更為稀缺。對(duì)于3D數(shù)據(jù)的積累,,也將是未來(lái)3D模型生成企業(yè)的一項(xiàng)核心競(jìng)爭(zhēng)力。
“3D模型生產(chǎn)的視覺(jué)合格率僅用一年時(shí)間就從20%提升到60%的水平,,發(fā)展非???。但是相比于生文達(dá)到95%,生圖達(dá)到90%以上,,它的成熟度,、可用性仍然處在前半賽場(chǎng)?!惫撼f(shuō),。
在此前大廠(chǎng)紛紛重注的文生圖、文生視頻等領(lǐng)域,,騰訊的動(dòng)作在國(guó)內(nèi)互聯(lián)網(wǎng)大廠(chǎng)中相對(duì)較慢,,但卻是最早下場(chǎng)做3D生成大模型的互聯(lián)網(wǎng)大廠(chǎng)。原因或許在于,,騰訊自身的業(yè)務(wù)具有大量相關(guān)需求,,這同時(shí)也讓騰訊對(duì)其中的商業(yè)價(jià)值更為敏銳。郭春超認(rèn)為,,3D生成大模型面向游戲行業(yè)的商業(yè)價(jià)值確定性非常高,,國(guó)內(nèi)有百萬(wàn)級(jí)游戲從業(yè)者,背后是百億乃至千億級(jí)的市場(chǎng),。
其他大廠(chǎng)也開(kāi)始在3D領(lǐng)域排兵布陣,。今年年初,美團(tuán)旗下龍珠資本與字節(jié)跳動(dòng)聯(lián)手領(lǐng)投了一家名為影眸科技的3D生成大模型公司,,后者目前已經(jīng)獲得數(shù)百萬(wàn)元企業(yè)端商業(yè)化訂單,。除了影眸之外,國(guó)內(nèi)另一家備受資本追捧的國(guó)內(nèi)廠(chǎng)商是VAST,,創(chuàng)始人宋亞宸曾在商湯科技及MiniMax任職,,目前公司超過(guò)400家。
郭春超認(rèn)為,,騰訊與上述廠(chǎng)商的區(qū)別在于,,它不僅僅定位于專(zhuān)業(yè)的3D工具,更想成為一款低門(mén)檻,、覆蓋面廣的一站式創(chuàng)作引擎,,用戶(hù)可以在上面自由創(chuàng)作、生成,、編輯,,相當(dāng)于3D版的“秒剪”。在他看來(lái),,目前的2.0版本還遠(yuǎn)未達(dá)到上限,。春節(jié)過(guò)后,它還將開(kāi)放類(lèi)似三維場(chǎng)景漫游等更大的場(chǎng)景生成,,可應(yīng)用于A(yíng)R,、VR,、線(xiàn)上展館等領(lǐng)域。
相較于初創(chuàng)公司,,騰訊的優(yōu)勢(shì)在于能夠以更低的成本從自身業(yè)務(wù)中積累數(shù)據(jù),,也能從中找到大量應(yīng)用場(chǎng)景。但不同行業(yè)對(duì)3D生成效果的要求也大不相同,,騰訊需要拿出更多資源來(lái)應(yīng)對(duì)初創(chuàng)公司對(duì)細(xì)分行業(yè)的針對(duì)性打磨,。
不過(guò),AI生成3D模型賽道還遠(yuǎn)未到達(dá)“Sora”時(shí)刻,。技術(shù)角逐才剛剛開(kāi)始,,這些公司仍然有足夠的時(shí)間和金錢(qián)來(lái)應(yīng)對(duì)挑戰(zhàn)。