在發(fā)布文心一言兩周年之際,,百度又發(fā)布新款模型,。
3月16日,,百度正式發(fā)布文心大模型4.5及文心大模型X1,。與此前不同的是,此次百度并未召開發(fā)布會,而是直接宣布新模型在文心一言官網(wǎng)上線,,并免費(fèi)向用戶開放,。
近期,國內(nèi)AI大模型廠商紛紛宣布“迭代”,。3月10日,,字節(jié)跳動豆包大模型團(tuán)隊(duì)官宣開源一項(xiàng)針對MoE架構(gòu)的關(guān)鍵優(yōu)化技術(shù),可將大模型訓(xùn)練效率提升1.7倍,,成本節(jié)省40%,。3月6日,阿里巴巴發(fā)布并開源全新的推理模型通義千問QwQ-32B,,通過強(qiáng)化學(xué)習(xí),,可在數(shù)學(xué)推理、代碼生成等任務(wù)上實(shí)現(xiàn)精度提升,。
百度發(fā)布兩款新模型
3月16日,,百度發(fā)布文心大模型4.5及文心大模型X1,。據(jù)介紹,,文心大模型4.5是百度首個原生多模態(tài)大模型。百度稱,,文心大模型4.5在多項(xiàng)測試中表現(xiàn)優(yōu)于GPT4.5,,API調(diào)用價格僅為GPT4.5的1%;文心大模型X1為深度思考模型,,性能對標(biāo)DeepSeek-R1,,調(diào)用價格約為R1的一半。
具體來看,,百度方面稱,,文心大模型4.5多項(xiàng)基準(zhǔn)測試成績優(yōu)于GPT4.5、DeepSeek-V3等,,并在平均分上以79.6分高于GPT4.5的79.14,。而文心大模型4.5在多模態(tài)理解能力上提升,不僅有較強(qiáng)的圖形推理,、圖表分析能力,,還具備理解梗圖、漫畫,、歌曲,、電影等多模態(tài)內(nèi)容的能力。
文心大模型X1定位為深度思考模型,,在性能上對標(biāo)DeepSeek-R1,,具備“長思維鏈”,擅長中文知識問答、文學(xué)創(chuàng)作,、邏輯推理等,,而且增加了多模態(tài)能力和多工具調(diào)用,能理解和生成圖片,,還能調(diào)用工具生成代碼,、圖表等內(nèi)容。
作為能自主運(yùn)用工具的大模型,,文心大模型X1支持高級搜索,、文檔問答、圖片理解,、AI繪圖,、代碼解釋器、網(wǎng)頁鏈接讀取,、TreeMind樹圖,、百度學(xué)術(shù)檢索、商業(yè)信息查詢,、加盟信息查詢等多款工具,。
據(jù)百度介紹,文心大模型4.5已上線百度智能云千帆大模型平臺,,企業(yè)用戶和開發(fā)者登錄即可調(diào)用API,;文心大模型X1也即將在千帆上線。百度搜索,、文小言APP等產(chǎn)品,,將陸續(xù)接入文心大模型4.5和文心大模型X1。
隨著大模型技術(shù)的快速迭代,,訓(xùn)練和推理成本的降低,,大模型開源已成大勢所趨。
今年2月,,百度曾宣布文心一言將于4月1日免費(fèi),,并宣布推出的文心大模型4.5,將于6月30日正式開源,。彼時百度還表示,,將在今年下半年發(fā)布文心大模型5.0。
“從DeepSeek身上,,我們學(xué)到了一件事,,那就是開源最佳模型能大大促進(jìn)人們使用或采納這個模型?!?月18日晚,,在百度2024年第四季度及全年財(cái)報(bào)電話會上,百度創(chuàng)始人李彥宏表示,開源的決策源自對技術(shù)領(lǐng)先地位的堅(jiān)定信心,,開源將進(jìn)一步促進(jìn)文心大模型的廣泛應(yīng)用,,并在更多場景中擴(kuò)大其影響力。他還強(qiáng)調(diào),,無論開源還是閉源,,基礎(chǔ)模型只有在大規(guī)模解決現(xiàn)實(shí)問題時,才具備真實(shí)價值,。
AI廠商加速迭代
近期,,AI大模型領(lǐng)域呈現(xiàn)技術(shù)迭代加速、多模態(tài)與深度思考能力突破,、開源生態(tài)完善等趨勢,。國內(nèi)外廠商在模型能力、應(yīng)用場景等方面展開全方位競爭,。
3月12日,,谷歌DeepMind推出用于機(jī)器人技術(shù)的人工智能模型,這個機(jī)器人基座大模型名為 Gemini Robotics 和 Gemini Robotics-ER,,旨在利用大語言模型的推理能力,,幫助機(jī)器人適應(yīng)復(fù)雜環(huán)境,從而完成現(xiàn)實(shí)世界中的復(fù)雜任務(wù),。
3月10日,,字節(jié)跳動豆包大模型團(tuán)隊(duì)官宣開源一項(xiàng)針對MoE架構(gòu)的關(guān)鍵優(yōu)化技術(shù),,可將大模型訓(xùn)練效率提升1.7倍,,成本節(jié)省40%。據(jù)介紹,,MoE是當(dāng)前大模型的主流架構(gòu),,但其在分布式訓(xùn)練中存在大量跨設(shè)備通信開銷,制約了大模型訓(xùn)練效率和成本,。針對這一難題,,字節(jié)在內(nèi)部研發(fā)COMET計(jì)算-通信重疊技術(shù),可大幅壓縮MoE專家通信空轉(zhuǎn)時間,。
3月6日,,阿里巴巴宣布推出最新的推理模型通義千問QwQ-32B。這是一款擁有320億參數(shù)的模型,,通過大規(guī)模強(qiáng)化學(xué)習(xí),,千問QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)提升,,整體性能比肩DeepSeek-R1,,在消費(fèi)級顯卡比如家用電腦上也能實(shí)現(xiàn)本地部署。隨后,國家超算互聯(lián)網(wǎng)平臺正式上線通義千問QwQ-32B API服務(wù),,向用戶提供免費(fèi)100萬tokens的試用額度,。
日前,全球知名創(chuàng)投機(jī)構(gòu)Andreessen Horowitz(a16z)發(fā)布了2025年全球100大生成式AI 應(yīng)用排行榜,,中國的AI技術(shù)實(shí)力在此次榜單中展現(xiàn)出強(qiáng)勁的競爭力,。其中,DeepSeek在網(wǎng)頁版應(yīng)用中排名第二,,僅次于OpenAI 的ChatGPT,,其驚人的成長速度引起全球關(guān)注。
此外,,在中國生成式AI中,,字節(jié)跳動旗下的豆包也位列第十。中國其他知名的大型模型也成功進(jìn)入榜單,,包括月之暗面(第11名),、海螺視頻(第12名)和快手可靈(第20名),它們的排名均超越了Sora,、Midjourney,、Runway 等全球知名應(yīng)用。
平安證券研報(bào)認(rèn)為,,全球大模型的競爭仍然激烈,,這種激烈競爭將持續(xù)拔升全球大模型的能力上限。同時,,全球領(lǐng)先大模型廠商對大模型研發(fā)的持續(xù)投入,,也將為AI算力需求的持續(xù)增長提供有力支撐。
中國銀河證券研報(bào)分析認(rèn)為,,AI Agent(智能體)落地使得大模型集成度更高,、算力資源需求更加旺盛,重心逐步從預(yù)訓(xùn)練轉(zhuǎn)移到了特定應(yīng)用場景的后訓(xùn)練,,推理端算力規(guī)模有望提升,。總體來說,,推理算力有望推動應(yīng)用的進(jìn)一步增長,,低成本算力時代帶動應(yīng)用端繁榮度提升,AI能力邊際擴(kuò)張依然需要依賴更強(qiáng)的模型和強(qiáng)大的算力支撐,,有望開拓AI行業(yè)大模型共振發(fā)展新局面,。
校對:李凌鋒?????????????