DeepSeek因為對美股的“暴擊”迅速站上市場暴風眼,,這只“來自東方的神秘力量”引發(fā)海內(nèi)外空前的高度關注。DeepSeek的爆火,,不僅是中國AI技術的里程碑,,更是全球AI行業(yè)的一次“范式革命”,。
這種關注是把雙刃劍,。在這個過程中,,DeepSeek迅速經(jīng)歷自身宕機到被攻擊的諸多事件,。但這并沒有妨礙其最新開源模型的發(fā)布,。
除夕,,DeepSeek發(fā)布分別名為Janus-Pro等開源多模態(tài)AI模型,文生圖測試優(yōu)于OpenAI,。有科技圈人士表示,,這“絕對是AI行業(yè)最難眠的一夜了”,。
從宕機到被攻擊
DeepSeek的輿情熱度崛起,幾乎是一夜之間,。從力壓ChatGPT,,登頂美區(qū)App Store 免費榜,到國內(nèi) App Store 免費榜,,均樣位居第一,。
熱度是把雙刃劍。昨晚至今日,,DeepSeek連續(xù)發(fā)布聲明稱:近期 DeepSeek 線上服務受到大規(guī)模惡意攻擊,,注冊可能繁忙,請稍等重試,。已注冊用戶可以正常登錄,,感謝理解和支持。
就在一日前,,新模型發(fā)布后的訪問量激增,,一度讓DeepSeek閃崩,,但問題都在數(shù)分鐘內(nèi)得到解決,。AI界上一次出現(xiàn)宕機情況,還是月之暗面的Kimi出圈爆火之時,。
DeepSeek爆火的原因,,在于其能與OpenAI“掰手腕”。
當DeepSeek-V3和R1橫空出世,,全球AI界仿佛被投下了一顆“技術核彈”,。推出后不久,R1就憑借其性價比,、開源及推理能力的提升等方面獲得了廣泛關注,。DeepSeek表示,最新的AI模型可以與OpenAI的ChatGPT媲美,,且開發(fā)成本遠低于競爭產(chǎn)品,。海外AI界評論,這是大模型行業(yè)的最大“黑馬”,,在外網(wǎng)被不少人稱為“神秘的東方力量”,。
這股力量在資本市場掀起巨浪。當?shù)貢r間1月27日,,美國股市開盤即大幅下跌,,科技板塊尤為慘重。尤其是英偉達,,1月27日美股收盤,,英偉達股價暴跌17%,。
對此,英偉達方面回應稱:“DeepSeek是一項卓越的人工智能進展,,也是測試時擴展的絕佳范例,。DeepSeek的研究展示了如何運用該技術,借助廣泛可用的模型以及完全符合出口管制規(guī)定的算力,,創(chuàng)建新模型,。推理過程需要大量英偉達GPU和高性能網(wǎng)絡。如今我們有三條擴展定律:持續(xù)適用的預訓練和后訓練定律,,以及新的測試時擴展定律,。”
根據(jù)初步統(tǒng)計,,隨著英偉達股價的暴跌,,黃仁勛的身家大幅縮水210億美元。
此外,,還有報道表示,,美國總統(tǒng)特朗普在佛羅里達州邁阿密舉行的共和黨會議上表示,中國人工智能初創(chuàng)公司DeepSeek的崛起應當為美國企業(yè)敲響“警鐘”,,美國公司“需要專注于競爭以贏得勝利,。”
又推新模型
1月28日凌晨,,人工智能社區(qū)Hugging Face顯示,,DeepSeek剛剛發(fā)布了開源多模態(tài)人工智能模型Janus-Pro,擁有10億和70億參數(shù)規(guī)模,。其中Janus-Pro-7B在GenEval和DPG-Bench基準測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion,。
這個模型既能讓AI讀圖(基于SigLIP-L),又能讓AI生圖(借鑒LlamaGen),,分1.5B和7B兩個大小,。對比來看,GPT-4o的圖片生成多模態(tài)模型至今沒開放,。
主流市場分析認為,,作為中國人工智能初創(chuàng)公司的DeepSeek,其最新突破動搖了美國科技行業(yè)的“無敵”地位,。
那么,,DeepSeek究竟厲害在哪?低成本,、高性能,、開源是外界提到的高頻詞。
實際上,,在推出后不久,,R1就憑借其開源的性質(zhì),、大幅下降的售價和訓練成本獲得了廣泛關注。作為一款開源模型,,R1在數(shù)學,、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,,并采用MIT許可協(xié)議,,支持免費商用、任意修改和衍生開發(fā)等,。
同時,,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成,。
這是個什么概念,?557.6萬美元,僅是OpenAIGPT-4o模型訓練成本的不到十分之一,。因此,,這有望引發(fā)行業(yè)重估大模型成本——有一種分析認為,大模型和算力這兩個親兄弟,,有望從此分道揚鑣,。
據(jù)統(tǒng)計,2024年1—8月,,微軟,、Meta、谷歌,、亞馬遜總計向AI數(shù)據(jù)中心投入1250億美元,包括AI資本支出,、總數(shù)據(jù)中心運營成本,,現(xiàn)金運營費用、軟件,、折舊和電費也納入統(tǒng)計,。預計2024年美國四大科技巨頭全年投入約2180億美元。而隨著DeepSeek的發(fā)布,,會否引發(fā)市場對科技巨頭越來越多AI投入的質(zhì)疑,,值得關注。
量化基金轉(zhuǎn)型“AI拼多多”
在國內(nèi)7家頭部的大模型創(chuàng)業(yè)公司當中,,DeepSeek可以說是最不顯山不露水的一家,。另一方面,雖然市場是從最近才開始突然關注DeepSeek,,但是它卻是中國AI界的老面孔,。
最受關注的事件之一,,就是去年引爆的“大模型價格戰(zhàn)”。
去年5月,,字節(jié)跳動宣布旗下豆包主力模型,,輸入價格為0.0008元/千Tokens。6天后,,阿里巴巴宣布通義千問主力模型大幅降價,,主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,,直降97%,。此后,百度跳過降價,,直接宣布,,旗下大模型文心一言的兩款入門級產(chǎn)品ERNIE Speed和ERNIE Lite免費。大模型價格戰(zhàn)戰(zhàn)火點燃,。
雖然市場普遍關注大廠,,但實際上,DeepSeek與智譜AI的入門級大模型降價得更早,。去年5月7日DeepSeek就曾宣布將旗下大模型DeepSeek-V2的價格降到了每百萬token輸入1元,、輸出2元(32K上下文)。
對此,,幻方創(chuàng)始人梁文鋒曾回應稱,,“大廠的模型成本比DeepSeek高很多,所以DeepSeek沒想到會有人虧錢做這件事,,最后就變成了互聯(lián)網(wǎng)時代的燒錢補貼的邏輯,。”
再往前回溯,,DeepSeek被視為量化基金轉(zhuǎn)型人工智能的典型代表,。
在DeepSeek背后是量化私募巨頭幻方,也是大廠外唯一一家儲備上萬張英偉達 A100芯片的公司,?;梅娇偛课挥诤贾荩瑢W⒂诶脭?shù)學,、統(tǒng)計學和計算機技術進行金融市場的量化分析和交易,。相當一段時間內(nèi),還曾受到負面輿情的困擾,。
此后,,DeepSeek-V2發(fā)布,主流判斷認為,幻方量化轉(zhuǎn)型為人工智能先驅(qū),,其超低價格甚至引發(fā)了國內(nèi)大模型的價格戰(zhàn),,DeepSeek也被迅速冠以“AI界拼多多”之稱。
無論是DeepSeek的橫空出世,,還是后來的價格戰(zhàn)戰(zhàn)火點燃,,AI界人士普遍認為,這反映出百度和阿里巴巴等科技巨頭,,盡管在生成式人工智能領域已處于領先地位,,但仍需要面對著來自新玩家的激烈競爭。
從目前來看,,這種轉(zhuǎn)型不僅仍在推進,,而且在這一年多時間里,DeepSeek進展迅速,。
更多故事或啟幕
“投身于探索 AGI 的本質(zhì),,不做中庸的事,帶著好奇心,,用最長期的眼光去回答最大的問題”,,這是DeepSeek官方微信號寫下的簡介。
對于DeepSeek大火,,e公司記者嘗試聯(lián)系通義千問,、文心一言、騰訊等大廠,,均表示“未有回應,。”有些則對記者回復,,會及時關注,。
出圈后的DeepSeek,目前依然低調(diào),。
從產(chǎn)業(yè)生態(tài)來看,,不少大模型廠商都已開啟投放買量,以期早日實現(xiàn)商業(yè)化變化,。不過,記者的通過多種方式試圖聯(lián)系DeepSeek,,但都未成功,。多信源透露,其至今尚未有公關團隊,。
不過這反而增加了市場討論的熱情,。從昨天開始,各科技群中,,關于DeepSeek的討論不絕于耳,。有人問:“今年春晚,,(DeepSeek)會不會露下臉?
業(yè)內(nèi)普遍認為,,DeepSeek的進展顯示出,,美國的領先優(yōu)勢正在縮小,各國應該采取合作方式建設先進AI,,而不是在AI領域進行“軍備競賽”,。
不過也有觀點認為,客觀來看,,雖然DeepSeek勢頭驚人,,但其技術目前仍落后于OpenAI和谷歌。爆火出圈后,,DeepSeek未來可能將面臨更多的壓力和挑戰(zhàn),。
但不可否認的是,衍生影響仍將蔓延,。有AI界人士接受e公司記者采訪時預判,,不止是中國,世界上很多AI公司本來因為大模型訓練的高昂成本,,已經(jīng)放棄了自研大模型?,F(xiàn)在看到DeepSeek的成功,未來有望繼續(xù)研究起來,。
從這個意義來看,,DeepSeek的爆火,不僅是中國AI技術的里程碑,,更是全球AI行業(yè)的一次“范式革命”,。
從更廣闊的視野來看,DeepSeek代表了中國“硬核技術創(chuàng)新”的一種敘事,。而除了DeepSeek之外,,市場還在關注更多類似的中國科技硬核力量。隨著DeepSeek的爆火,,包括人形機器人公司宇樹科技等,,也都在被市場寄予更多期待。