
(北京,2026年6月2日) 于具身智能海潮囊括全世界的今天,绝年夜大都公司选择了一条“自上而下”的路径:用年夜模子理解使命,用海量数据练习端到端计谋,试图让呆板人模拟人类事情。然而,一家名为橡木果呆板人(Acorn Robot)的公司,却走出了一条大相径庭的门路——自下而上,从底层本能出发,让呆板人先获取操作本能,继而于与物理世界的交互中自立涌现操作智能。 这家由清华机械工程博士、哈佛神经科学博士后领衔的团队,用9年时间完成为了从理论发明到产物落地的闭环。 1、出发点:一个被纰漏的要害发明——操作存于本能 橡木果开创人的经历横跨三年夜范畴:本科到清华博士阶段,攻读机械工程专业;博士后在哈佛年夜学神经科学系,主攻人脑进修举动特征研究。2018 年返国后,投身具身智能。恰是哈佛的履历,让他意想到一个被呆板人范畴持久纰漏的事实:操作举动与语言举动,于底层运行机制上存于素质差异。 语言没有天赋本能——小孩出生后若不接触语言,一辈子都学不会措辞,且学甚么语言就说甚么语言。但操作偏偏相反:全世界所有人抓取物体的举动高度一致,不管春秋、文化、情况,但从未有人“教”过咱们怎样抓工具。这申明操作举动暗地里存于本能——出生即有、不受后天情况影响。 生成操作本能 vs 后天语言练习 本能其实不直接计划详细的履行路径,而是为举动树立内涵指望,一旦确立,所有举动城市自觉地向这个指望连续收敛。 这个发明成了橡木果技能线路的原点:与其让呆板人经由过程模拟进修去拟合人类的操作数据,不如付与它类人的操作本能,让它本身于与情况的交互中“长”出操作能力。 2、对于数据驱动、自上而下技能路径的审阅:没有最佳的预练习模子,只有最适配硬件的模子 当前具身范畴广泛采用的技能线路,如VLA(视觉-语言-动作)端到端架构,将使命计划与操作履行耦合于“感知-动作”这一黑盒映照中,试图用“更大都据、更年夜算力”解决所有问题。这类数据驱动、自上而下的技能线路,面对着三年夜不成逃避的实际困境: 第1、数据范围问题:语言只有一个信息模态,而操作触及语言、视觉、触觉三个模态,而且动作输出还有与详细的硬件(机电、传动情势、手指数目等)强相干。使命及硬件一旦耦合,泛化所需的数据量将是指数级增加,远超天然语言Scaling Law的领域。任何一家公司都不成能收罗到足以笼罩所有硬件本体及操作场景的数据。 第2、算力耗损问题:操作履行要求毫秒级的及时相应。一个动作要末刹时完成,要末掉败。这就要求模子必需于边沿端以严苛的功耗及时延限定下运行,没法像语言模子同样依赖云端算力举行“慢思索”。 一个很实际的对于比是:GPT这类纯语言模子,纵然依托无比重大的云端算力,今朝依然是“一个字一个字往外蹦”。操作使命触及的模态远多在语言,所需的算力更是呈指数级剧增,然而物理世界中的操作履行,没法容忍像语言模子那样“一个字一个字地蹦”,当物体行将从指尖滑落,呆板人莫非要等候模子逐步吐出下一个指令?这显然是不成能的。 第3、泛化迁徙问题:当前具身操作模子的泛化性及迁徙性仍处在很低级的阶段,间隔可以跨使命、跨本体泛化迁徙的通用操作能力还有有着很年夜的差距,“换场景就掉灵”就像一个魔咒,拦阻着具身操作模子的落地运用。 为应答以上问题,外貌解法是构建海量、优质、多元的数据,并连续晋升算力。但更深层的焦点问题值患上寻思:年夜语言模子所依托的数据驱动、自上而下的技能线路,是否一样合用在操作模子? 于具身操作中,使命计划与操作履行同时存于,使命(如“叠衣服”)是常识层面的,可以自上而放学习,做到法则同一。但硬件履行必需适配每一个个别硬件的细微差异——纵然两个外不雅如出一辙的夹爪,导轨松紧差别,练习出的模子参数就天差地别。 橡木果用了一个活泼的类比:打乒乓球的法则全球同样(使命),但差别选手的打法彻底差别(硬件适配)。 以是,使命泛化与硬件泛化的逻辑彻底差别。对于操作而言,没有最佳的预练习模子,只有最适配硬件的模子。 打乒乓球法则同样,但差别选手打法差别 3、橡木果技能路径:使命计划与操作履行解耦,自下而上构建通用操作模子 “使命”与“硬件”于泛化逻辑上的天赋区分决议了,它们不克不及于统一个黑箱模子中练习,而应各自自力演进,经由过程尺度化接口协同事情。 基在此,橡木果认为,应将使命计划与操作履行完全解耦: • 使命计划层:卖力常识推理、使命分化及全局计划。可经由过程自上而下的常识进修,其输出并不是详细的机电电流指令或者枢纽关头角度,而是要害图象帧及语义约束。例如,对于在“把这杯水端到桌上,不要洒”的使命,计划层输出的是一系列“物体最先于哪”、“物体终极应该落于哪”的方针画面以和“不要洒”的约束,而非结尾履行器的详细动作路径。 • 操作履行层:卖力将使命计划指令于真什物理世界中精准、鲁棒地履行。这是橡木果重点聚焦及冲破的层面,由具身本能出发,采用了自下而上、自立涌现操作智能的技能线路。 具身智能的两种技能路径:自上而下数据拟合 vs 自下而上本能驱动 4、本能催生举动涌现:让呆板人自立“长”出操作能力 于操作履行层面,橡木果的终极方针是构建通用操作技术模子,实现“一上来就纯熟”。但技术没法平空把握。是以,于通向具身智能以前,橡木果先付与呆板人具身本能:经由过程构建端侧自立决议计划模子 Natus,让呆板人得到类人的操作本能,催生举动涌现,包管“一上来就会做”;再依托真什物理世界中的摸索与交互,不停纯熟,终极构建第二个焦点模子——通用操作技术模子 Magis,实现“一上来就纯熟”。 橡木果具身操作模子架构 Natus——端侧自立决议计划模子:零数据,冷启动,即插即用 从被付与法则到把握纪律,橡木果认为,操作能力的来历,不该是数据拟合,而是物理世界中的具身交互。基在这一判定,橡木果摒弃了“输入-输出”的黑盒线路,转向由触觉感知驱动的本能驱动——这即是端侧自立决议计划模子 Natus 的底层逻辑。 Natus彻底嵌于结尾的履行器中,是一个由触觉刺激直接驱动的、毫秒级相应的端侧模子。它付与了呆板人三年夜本能: • 定向本能:用在构建接触瓜葛。与视觉协同,指引结尾向方针物体挪动,犹如婴儿对于挪动物体孕育发生视觉跟随的本能反映。 • 摸索本能:用在构建约束瓜葛。这是最繁杂、也最表现“智能涌现”的本能。当结尾接触物体后,该本能主动激活,它不预设任何动作,而是经由过程感知滑移、接触面积、漫衍力、形变等触觉信息,自立地沿着物体外貌摸索,寻觅不变的接触构型——不是经由过程预设步伐,也不是经由过程模拟进修,而是由“成立不变接触”这一本能催生出的自立举动(新计谋)。这类摸索举动极其天然,犹如婴儿探索一个新玩具,布满了“智能涌现”的色采。 • 交互本能 (如抓握/装置):用在推进履行动作。当摸索本能构建出不变约束瓜葛后,该本能主动激活,以“滑移最小化”或者“阻抗匹配”为指望,自立地及时调治肌肉张力。如抓豆腐时增益调低(松),抓锤子时增益调高(紧)——所有调控均来自在触觉信息的及时反馈,无需任何练习数据。 Natus付与呆板人的焦点能力是“零数据冷启动”、“硬件自顺应”及“毫秒级相应”。它不需要任何练习数据,不需要任何微调,依赖本能反射构建触觉感知与肌肉动作之间的映照瓜葛,出厂即具有操作的本能,可以或许顺应差别物体及工况的特色,实现“一上来就会做”。进一步,可以于不停的摸索历程中强化肌肉动作,形成肌肉影象,实现“越做越纯熟”。 正如痛苦悲伤反射不需要年夜脑思索,Natus让操作履行于物理世界中变患上天然、流利、鲁棒。 Natus端侧自立决议计划模子架构 于橡木果的测试中,团队发明,呆板人面临从未见过的各类不法则形态的物体,会沿其外貌自立摸索,及时调解抓取计谋,直到成立不变的接触构型后乐成抓起。 面临一个倾倒了半瓶水的瓶子,它会重复试探重心,慢慢调解抓力。 面临一个外貌极黏、极易变形的解压球,也涌现出极为类人的举动。 甚至,面临极薄卡片状物体,也能经由过程自立摸索,不停测验考试(推、翘、扣),乐成抓起。 于交互本能的测试中,呆板人未颠末任何数据预练习,于抓取易碎的豆腐、水量不停变化的塑料杯、受外界动态扰动的极薄铁皮卷,抓取力都可以或许及时调解,确保抓取不变且靠得住。 于装置从未见过的线缆插头,纵然存于较年夜的初始误差,呆板人会自立调解推进动作,直至鲁棒地完成接插使命。 这些举动不是编程预设,也不是数据喂养患上来,而是本能催生出的举动涌现。这类自下而上的举动涌现不直接划定动作,而是划定“纪律”,让动作自立孕育发生。 这类纪律可以类比万有引力定律——万有引力定律自己不描写任何详细的运动轨迹,却支配了从天体运行到苹果落地的无限举动。本能一样云云:它不划定详细动作,却支配了操作举动暗地里的底层逻辑。它让呆板人于真什物理交互中拥有自立“长”出操作能力的可能性,而非被监禁于一组预设的动作指令之中。 而且,由本能催生的举动,与数据喂养的路径大相径庭——它不会附带任何过剩的小动作,而是始终锚定在自身的本能指望,连续地向方针状况收敛。 5、从本能到技术:让操作智能于真实交互中涌现 Natus经由过程付与呆板人本能解决了“零样本启动与顺应性”问题,但若每一次都靠摸索,效率过低。 Magis——通用操作技术模子:跨本体、跨使命的技术迁徙与泛化 Magis的任务,是让呆板人实现“一上来就纯熟”。实在现路径倾覆了行业范式:不是用海量视频去“教”呆板人,而是使用Natus于真什物理世界中自立摸索孕育发生的、带有富厚精准触觉语义的数据,对于视觉数据举行语义加强,然后练习技术模子。 详细来讲:当Natus驱念头器人于真实世界中完成一次乐成操作时,它记载的不仅是“乐成了”这一成果,更是一整套富厚的物理信息——物体的重量、质心的位置、外貌的软硬与粗拙度、抓取时的力漫衍与滑移趋向等。这些由触觉直接感知并主动“打标”的力学语义,会被叠加对于齐到视觉数据上,进一步被用在练习构建技术模子。 这类做法的利益是: • 练习数据需求年夜幅降低:无需百万小时级另外操作视频。 • 模子理解深层物理属性:能泛化到从未见过的物体及场景。 • 视觉追踪鲁棒性晋升:触觉可奉告“物体始终于手上”,视觉不会因遮挡或者相似物体而跟丢。 Magis是操作智能涌现的主要标记,它将实现从【一上来就会做】到【一上来就纯熟】的技术迁徙。 以抓喷鼻蕉为例:Natus 经由过程屡次自立摸索,终极完成喷鼻蕉的乐成抓取。于此历程中,它不仅记载视觉图象,更经由过程触觉感知并主动完针言义打标——喷鼻蕉重120g,质心偏左,表皮粗拙,硬度中等。这些力学语义被及时叠加到视频帧上,使患上用在练习的 Magis 技术模子可以或许真正“理解”物理世界的力学属性,而不单单是外不雅。基在此,呆板人后续可直接拔取最适合的抓取位置并施加得当的抓取力,高效地完成方针使命,且具有跨物体的泛化能力。 6、触觉:构建操作模子的信息底座 — 完整性是第一原则 一切根底始在本能。那末,橡木果是怎样构建本能的? 构建本能,要有完整的触觉信息输入。橡木果对于触觉信息的分类极具体系性,远超市道上“测力”“测压”的粗浅理解。 操作相干的触觉信息分为三年夜类,缺一不成: 1. 界面信息(直接接触感知):手指与物体接触界面上的信息,包括漫衍力、变形、滑移等。此中滑移是最要害、也最难丈量的信息。没有滑移感知,呆板人抓取差别物体(轻重、软硬、平滑粗拙)需要海量数据练习;有了滑移感知,零数据冷启动便可自顺应调治抓力。 2. 物体信息(经由过程界面间接感知):包括物体的软硬度、磨擦系数、质量、质心漫衍等。这些是视觉没法获取的力学属性。 3. 情况信息(经由过程东西或者物体间接感知):包括接触位置、刚度、阻抗、扰动等。利用东西举行的装置、打磨、抛光等非直接操作使命,高度依靠情况信息。例如为何装置比抓取难?这是由于装置需要感知“孔”对于“轴”的阻抗。 图6 - 多模态触觉信息,三年夜类:界面信息、物体信息、情况信息 为了获取这些完整信息,橡木果自研了视触觉传感器(Vision-based Tactile Sensor),颠末7年迭代、十余代原型机,已经推出第三代成熟产物。 该传感器采用弹性体(硅胶)加微型相机的方案,不依靠任何敏感质料,经由过程图象表征与重构算法将弹性体的变形反演为所需的多模态触觉信息。 然而,真实的技能壁垒不于在道理样机,而于在: • 多模态表征技能:橡木果拥有静态(光度立体)、动态(特性追踪)、交融态三类表征技能,此中,动态表征技能由公司在2020年初次提出,可用在捕获滑移这一动态历程,而行业直至2025年末才最先跟进。 • 工艺与工程化标定:霸占了从图象到物理量的非线性、黏弹性逆问题求解与精准标定,以和万万次按压、切向、扭转轮回测试下的经久性包管等。 • 算力集成与优化:将图象预处置惩罚算法压缩到指尖内的芯片,优化信息重构算法,可及时输出多模态、尺度化的触觉信息,而非原始图象——防止了硬件差异性致使模子掉效。 7、从“具身本能”到“具身智能”:非共鸣线路,已经贸易先行 橡木果创始的【本能驱动】这一具身操作技能线路,让呆板人的“发展”路径,从“数据填鸭”转向“体感习患上”,并理解物理世界操作中的“正义”。使操作技术从“单一场景的影象”走向“底层纪律的迁徙”。这类从“影象”到“理解”再到“创造”的跃迁,恰是迈向通用智能的必经关卡。 这也标记着行业叙事的一次演变:从迷信“多模态输入”的表层热闹,回归到对于“操作毕竟需要理解甚么”这一素质问题的追问。橡木果信赖,当呆板人于物理世界中真正拥有了本身的“本能直觉”及“肌肉影象”,它所揭示出的操作智能,将远超简朴地复刻人类动作所到达的上限。 橡木果的技能线路并不是蜃楼海市,而是已经颠末了贸易化验证。公司聚焦在工业柔性出产场景(如消费电子、日化、新能源汽车、生物医药),针对于性解决产线“换产频仍、物料复杂、参数调试耗时”的行业痛点。 依附Natus的“零数据冷启动”特征,橡木果的解决方案可以做到冷启动、快速闭环。项目落地效率凸起,仅用两个月时间,即于全世界某头部化妆品ODM厂商的产线上完成为了POC验证,并实现贸易营收。于POC中,呆板人被要求抓取、旋拧及放置外形、巨细、材质各别的化妆品(软管、瓶状、盒状等),其零数据、快速适配的能力博得了客户的高度承认。 团队暗示:“工业场景对于使命计划的要求相对于固定,每一个工位的使命已经被既定。这偏偏是咱们的技能上风阐扬到极致之处。咱们不需要等候上层年夜模子成熟,就能用底层的操作能力孕育发生贸易价值。” 跟着模子的不停迭代与产物年夜范围出货,橡木果正试图为具身智能财产打造真实的“操作基座”。 2026 年 3 月,橡木果呆板人完成近亿元种子轮融资,领投方包括钱唐质料试验室、普华本钱等知名投资机构。该笔融资不仅是市场对于“本能驱动”这一非共鸣技能线路投下的一张信托票,更标记着一个要害节点的到来:具身智能的投资叙事,正于逐渐回归对于技能本源、底层逻辑与客不雅纪律的尊敬与审阅。 “假如有人问咱们:‘你们的壁垒是甚么?’ 我的回覆很简朴——咱们的认知领先了行业至少一个代际,而咱们的工程细节领先了行业至少5年。 ”橡木果开创人暗示,“这二者叠加于一路,组成了一条结实的护城河。” 普华本钱暗示,“橡木果所做的事,早已经逾越‘做一款更好的呆板人’的领域,而是于为整个具身智能行业构建一块最基础、最稀缺、最难被绕过的基础举措措施——让所有呆板人都能快速上手、不变动手的‘底层基座’。” 钱唐质料试验室暗示,“咱们信赖,真正能穿越周期的,不是风口上的叙事,而是那些让呆板人能于物理世界中不变完成每一一次抓取、每一一次装置,从而真正创造价值的底层能力。” 橡木果的技能线路向行业通报了一个清楚的旌旗灯号:于年夜模子、年夜数据、年夜算力的热潮中,回归物理世界的第一性道理也许才是通往通用操作智能的更短路途。 “橡木果的持久方针,是成为全世界具身智能范畴不成或者缺的底层基座。” 橡木果开创人暗示,“公司不寻求成为何都做的万能选手,而是专注在构建最底层、最要害的操作基石。公司坚信,将来的技能格式将是交融共生的:上层由年夜模子卖力使命计划,解决‘做甚么’;基层则由橡木果的本能驱动体系卖力操作履行,解决‘怎么做’。两者经由过程尺度化接口深度协作,配合组成真正通用、靠得住的具身智能体系。” 一枚橡果,既是收成的果实,更是孕育无穷可能的种子,橡木果的品牌内核与其 “本能驱动、自下而上” 的通器具身操作线路一脉相承。 从零到一,从非共鸣理念到转变行业的技能范式,橡木果呆板人以其“自下而上”的怪异视角及“回归本源”的坚定刻意,正于为具身智能的将来铺就一条全新的、更坚实的门路。这恰是“种子”的气力:看似微小,却能撼动全局。 关在橡木果呆板人:本能驱动的通器具身操作创始者与引领者 橡木果呆板人(Acorn Robot)建立在2024年末,焦点团队交融清华年夜学机械工程与哈佛年夜学神经科学前沿交织配景。公司致力在为通器具身操作构建全新的技能基座,让呆板人真正拥有与生俱来的类人本能与操作聪明。 团队自2011年起深耕呆板人操作范畴,2017年率先提出“本能驱动具身操作”这一非共鸣技能线路,并在2018年搭建试验室团队。2025年正式启动贸易化,于短短一年内完成从技能堆集到落地的闭环,以光鲜的底层技能逻辑,引领新一代具身智能成长范式。 大众事件和媒体联结:info@acornrobot.com
















