證券時報網(wǎng)
劉茜
2025-03-21 23:07
3月21日深夜,,騰訊混元宣布,,正式推出自研深度思考模型混元T1正式版,。
在體現(xiàn)推理模型基礎(chǔ)能力的常見benchmark上,,如大語言模型評估增強數(shù)據(jù)集MMLU-PRO中,,混元T1取得87.2分,僅次于o1。在CEval,、AIME,、Zebra Logic等中英文知識及競賽級數(shù)學(xué)、邏輯推理的公開基準(zhǔn)測試中,,混元T1的成績也達到業(yè)界領(lǐng)先推理模型的水平,。
此前,騰訊宣布,,混元大模型首次登上 Chatbot Arena 榜單,,躋身全球 Top 15。用戶在該平臺上以匿名方式與多個模型互動,,投票決定何種模型更佳,,從而根據(jù)分數(shù)生成排行榜。這種測評也被看成是大模型直接 PK 的競技場,,簡單直接,。
去年 9 月 5 日,騰訊發(fā)布了新一代大模型混元 Turbo,,采用 MoE 架構(gòu),,比上一代產(chǎn)品推理效率提升 100%,推理成本降低 50%,。
在本月 1 日發(fā)布的騰訊元寶電腦版 App 中則是內(nèi)置了混元和 DeepSeek 兩種模型,,支持雙模切換,。
部分內(nèi)容綜合自:騰訊等