3月31日,,智譜(即北京智譜華章科技有限公司)在中關(guān)村論壇上正式發(fā)布了智能體“AutoGLM沉思”,,其具備深度研究能力(Deep Research),同時(shí)實(shí)現(xiàn)實(shí)際操作,推動(dòng)人工智能Agent(智能體)進(jìn)入“邊想邊干”的階段,。
對于Agent層面的探索,公司CEO張鵬在發(fā)言中表示,,Agent也存在類似Scaling Law(規(guī)模定律)的特點(diǎn),,通過擴(kuò)展訓(xùn)練時(shí)的inference compute(推理計(jì)算),Agent展現(xiàn)出了更強(qiáng)的性能,。
張鵬表示,,在Agent Scaling Law的基礎(chǔ)上,他們進(jìn)一步發(fā)現(xiàn)了Agent的能力,。他舉例稱,,在訓(xùn)練過程中,工作人員從未教過AutoGLM沉思訪問巨潮資訊網(wǎng),。然而,,當(dāng)發(fā)送指令“幫我收集昨天關(guān)于具身智能的相關(guān)研報(bào)”時(shí),AutoGLM沉思能夠規(guī)劃出通過訪問巨潮資訊網(wǎng)解決問題的方案,。
AutoGLM沉思的技術(shù)演進(jìn)路徑為:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型,。張鵬表示,其中核心鏈路的模型和技術(shù)將于4月14日正式開源,,以此推動(dòng)行業(yè)生態(tài)發(fā)展,。
張鵬在發(fā)布會上表示,基于最新的技術(shù)積累,,智譜重新訓(xùn)練了一個(gè)320億參數(shù)的基座模型GLM-4-Air-0414,,在其預(yù)訓(xùn)練階段加入了更多的代碼類、推理類數(shù)據(jù),,并在對齊階段針對智能體能力進(jìn)行了優(yōu)化,,該模型在工具調(diào)用、聯(lián)網(wǎng)搜索等智能體任務(wù)上的能力得到大大加強(qiáng),。