金沙江創(chuàng)投管理合伙人朱嘯虎向人形機器人“開炮”了。
3月28日,,他在采訪中稱,,因“商業(yè)化不清晰”,正批量退出對人形機器人的投資,,引發(fā)行業(yè)震動。
對此,,經緯創(chuàng)投創(chuàng)始合伙人張穎發(fā)朋友圈調侃:“朱老板別鬧”,,直言朱嘯虎的言論可能影響其未來在機器人領域的投資機會;眾擎機器人CEO趙同陽更尖銳批評其“用眼前否定未來”,。
趙同陽直言:“他(朱嘯虎)是非常成功和精明的商人,,但很多創(chuàng)業(yè)者不是?!?/p>
一場投資人與創(chuàng)業(yè)者之間的唇槍舌劍,,折射出人形機器人在資本狂熱,、“泡沫疑云”與技術攻堅之間的復雜處境。
中關村論壇期間,,21世紀經濟報道記者見到了銀河通用,、星動紀元、穹徹智能,、樂聚機器人等具身智能公司創(chuàng)始人,,也采訪了智源研究院院長王仲遠,本文將總結他們對人形機器人“泡沫論”,、“訓練數據瓶頸”,、“人形必要性”、技術路線分歧等方面的觀點,,全面拆解人形機器人爭議,。
爭議一:人形機器人是否存在“泡沫”?
朱嘯虎的退出理由直指商業(yè)化前景不明,,“誰會花十幾萬買一個機器人去干這些活,?”但這一觀點遭到多位從業(yè)者反駁。
經緯創(chuàng)投張穎認為,,機器人領域“大賽道,,百花齊放,過程中有點泡沫也非常正?!?,并強調“時間拉長,人形機器人賽道一定能出大公司”,。
眾擎機器人趙同陽則表示,,朱嘯虎更適合“今年投入后年見效的快餐式項目”,而AI和人形機器人需要長期投入,,“質問人形機器人現階段有什么用,,就像否定剛出生嬰兒的未來”。
智源研究院院長王仲遠告訴21世紀經濟報道記者,,具身智能的訓練非常復雜,,需要海量數據,5年時間都是樂觀的,,也許需要10年后才能成熟,,不同風格的投資機構就會出現分歧。
“如果是比較看重產業(yè)落地,、希望迅速實現行業(yè)應用的機構,,也許當下并不是進入具身智能的好時機。”王仲遠表示:“但我們對于具身智能長期發(fā)展是非常樂觀的,,就好像10年前看無人駕駛技術是一樣的,。”
樂聚機器人冷曉琨從產業(yè)視角補充:“具身智能是硬件與軟件的耦合,,硬件從實驗室到產業(yè)化,,需要3~5年,軟硬件最終合起來才能真正迎來質變,?!?/p>
爭議二:訓練數據瓶頸如何突破?
數據是具身智能發(fā)展的核心難題,。銀河通用創(chuàng)始人王鶴指出,,當前數據分為真實數據與仿真合成數據兩類。真實數據中,,互聯(lián)網視頻雖量大但“不足夠”:“看別人游泳無法學會游泳,,除非你已具備基本運動機能?!?/p>
他主張“用合成數據做預訓練,,用真機數據完成后訓練”,并類比自動駕駛:“人形機器人存量達百萬臺前,,合成數據是最寶貴資產,。”
樂聚機器人冷曉琨坦言硬件采集觸覺等模態(tài)數據成本高企,,現在采集的數據模態(tài)數量不夠,,包括視覺信息、觸覺信息等,,在模型未完全確定的時候,,投入大量精力采集的數據有被推翻的可能性。
穹徹智能盧策吾更強調實踐檢驗:“數據價值如同配方,,需在實踐中動態(tài)調整比例,,互聯(lián)網數據、仿真數據,、真機數據各有優(yōu)劣,,需互補克服缺點?!?/p>
爭議三:人形是必需還是噱頭,?
關于“人形必要性”的爭論由來已久。
行業(yè)里有觀點認為,,當前70%的場景并不需要機器人具備“人形”,所以“機器人做成人形”的必要性不夠充分。
王仲遠在一定程度上認同這一觀點,,他舉例說明,,行業(yè)內也有不少機器人公司已開始迭代輪式構型機器人,以克服雙足機器人穩(wěn)定性欠佳的問題,。
“不過,,從長遠來看,人形機器人具有獨特優(yōu)勢,,因其與人的構型相似,,能更好地適應社會基礎設施,復用技能,,從互聯(lián)網數據中學習人類技能,,推動具身智能和具身大腦模型的迭代?!蓖踔龠h表示,。
樂聚機器人冷曉琨透露:“我們交付的100臺人形機器人已進入工廠,需先解決拿,、放,、走等基礎技能泛化,再拓展復雜場景,?!睓C器人進工廠以后,樂聚給自己定的標準是連續(xù)工作1500個小時左右,,才能說人形機器人可以實際用起來,。不過,目前人形機器人完成的任務比較簡單,,比如搬箱子等,,更多精細性任務,需要后期更復雜的訓練,。
銀河通用王鶴認為,,輪式機器人與人形機器人有不同的適應場景?!拜喪綑C器人成本低,、續(xù)航長,貨架場景無需雙腿,,制約因素是智能而非形態(tài),。”他舉例說明,,但有些復雜地形,,就需要人形機器人穿越,,并且,最終人形機器人的目標是走進家庭,,不過,,距離這個目標,還有很長的一段旅程要走,。
穹徹智能盧策吾從工具使用角度力挺靈巧手:“拿錘子,、筷子需五指靈活調整,二指無法完成復雜操作,?!?/p>
爭議四:機器人泛化、跨本體的難度
當前,,隨著具身機器人任務種類和任務量不斷增加,,如何在跨本體、跨場景以及跨任務的情況下解決具身機器人的泛化問題,,成為具身機器人和具身智能領域面臨的重大挑戰(zhàn),。
智源研究院王仲遠分享女兒的學習經歷,不到兩歲的孩子在春節(jié)期間通過觀看大量短視頻,,自主學會拆糖果,、用牙簽穿藍莓。在不斷嘗試失敗后最終成功,。人類大腦的這種自主學習能力遠超當前具身智能模型,。科研機構和模型公司始終要攻克的方向,,就在于怎么讓機器人能夠自主學習,,掌握技能。
銀河通用王鶴認同對人類學習過程的觀察很重要,。他指出,,人類在學習過程中,通過大模型提供獎勵函數助力強化學習,。但目前具身智能在這方面仍處于探索階段,。
具身機器人的物理世界智能研發(fā)需遵循特定過程。首先,,沿著能產生生產力價值的維度探索泛化,,如抓取、放置和場景移動等基礎技能,。通過合成大數據和少量真機數據實現這些技能的泛化,,為人形機器人創(chuàng)造生產力價值。隨后,,研究機器人在家庭,、工廠等更多場景中跨越技能,,最后再探索跨本體。
爭議五:ChatGPT時刻何時到來,?
對于人形機器人的爆發(fā)節(jié)點,,各有闡述。
穹徹智能盧策吾認為,,具身智能的ChatGPT時刻不是單一的,而是一批場景,,階梯性,、漸進地實現?!皟赡暌恢芷?,物流、食品加工等場景可能會有第一波變化,?!?/p>
星動紀元陳建宇表示,爆發(fā)點要看設定的標準是什么,,如果只是簡單的推理問答,,可能就比較早,但如果是復雜場景的實際應對與執(zhí)行,,這個標準還是蠻高的,。“但這并不妨礙人形機器人的持續(xù)應用,,一些垂類場景的規(guī)?;瘧檬窃诔掷m(xù)推進的?!?/p>
銀河通用王鶴預測,,輪式機器人貨架級別的智能可能在2025年、2026年迎來突破,,但如果是每個人都用上人形機器人,,這個目標實現的周期就會比較長,尤其未來,,人形機器人走進家庭,,需要硬件成本與安全性再突破。
智源研究院王仲遠類比深度學習發(fā)展史:“從2006年論文到ChatGPT用了16年,,具身智能受硬件制約,,比較可能的突破時刻,可能是會現在受限的場景下具備可用性,、一定的智能性以及一定程度的泛化,,積累幾年之后,,逐步進化?!彼赋?,受到大模型快速迭代的正面影響,具身智能的發(fā)展也會加速,。
樂聚冷曉琨直言:“我覺得可能不會是忽然眼前一亮的時刻,,而是整個社會面逐漸用起來,隨著產業(yè)化不斷成熟,、智能性不斷成熟,,慢慢泛化?!彼f,,硬件產業(yè)化沒有捷徑,五年后回頭看方知滲透,,而非某刻突然爆發(fā),。
朱嘯虎的“撤退”,揭開了人形機器人行業(yè)理想與現實的激烈碰撞,。短期內,,商業(yè)化路徑不明、數據成本高企,、硬件成熟度不足仍是攔路虎,;但長期來看,多模態(tài)大模型,、世界模型與硬件迭代的共振,,可能逐步將具身智能推向“數字—物理”融合的臨界點。
泡沫是技術爆發(fā)的前奏,,耐心者才能等到春天,。當人形機器人真正走入家庭時,今天的爭議或許會成為一段精彩的注腳,。