具身智能元年:大厂争「身体」,聪明钱正在布局另外三个位置【黑马雷达 第004期】

具身智能三层架构投资格局——大脑模型、小脑策略层与整机本体的竞争态势分析。来源:投黑马 Touheima.com

黑马雷达 / 第004期 / 2026年3月 / 阅读时间约15分钟

2026年第一季度,全球具身智能赛道融资超过250亿元,每天平均有逾5亿元涌入这个赛道。但投黑马的判断是:90%的资本正在挤进最拥挤的地方——整机本体,而最具左侧价值的三个层次,几乎无人在认真布局。本文拆解具身智能的三层架构,点名当前竞争格局中的真实赢家和潜在输家,并给出四个被市场严重低估的早期机会坐标。


一、为什么现在是关键窗口

具身智能投资正在经历一场认知错位:每个人都知道这个赛道很重要,但绝大多数人正在把钱押在错误的地方。

2026年3月,新浪财经的一篇报道提供了一个刺眼的数据:仅中国一级市场,第一季度就发生了超过30笔具身智能融资,披露金额合计约200亿元,有9家公司估值突破百亿元。全球范围内,Skild AI刚完成14亿美元C轮融资,将自身估值推上140亿美元;Apptronik在一年内完成两轮融资,累计超过10亿美元。这个数字放在三年前,足以让整个一级市场集体失声。

问题在于:这些钱大多数流向了哪里?

如果你打开任何一份一级市场的具身智能融资清单,你会发现一个共同规律:资本高度集中在「整机本体」和「知名整机品牌」身上——Figure AI、宇树科技、Agility Robotics、银河通用……这些能让投资人拍一张机器人站立行走的照片、发一条朋友圈的公司,获得了绝大多数关注。

但投黑马的核心判断是:在具身智能真正商业化落地的路径上,整机本体不是壁垒最高的层次,也不会是回报最丰厚的层次。

类比一下移动互联网的历史。2007年iPhone发布后,绝大多数资本涌入了手机硬件制造商,而不是那家叫做Android的操作系统、那些叫做App Store或Google Play的分发平台,以及那些叫做ARM、高通的芯片IP公司。十年后,谁是移动互联网的真正赢家,答案不言而喻。

具身智能正在经历类似的认知错位。整机本体是最容易被理解的投资标的——你能看到它,能拍到它,能给投资人演示它。但真正的壁垒,往往在你看不见的地方:控制机器人每一个动作的大脑模型、让大脑高效执行垂直任务的小脑策略层、以及给大脑持续「喂食」的数据基础设施。

2026年,具身智能的关键窗口正在开启。不是因为机器人变得更好看了,而是因为一个底层变量正在临界点:机器人基础模型的能力,正在从「演示级」跨越到「部署级」。NVIDIA在GTC 2026上宣布GR00T N1.7已达到「可商业化部署」级别;Physical Intelligence的π0.5模型在68个任务上实现了零样本泛化;Skild AI的商业化收入在数月内达到3000万美元。

这意味着什么?意味着接下来的18-24个月,是左侧投资者建立头寸的最后窗口。在聚光灯完全照亮这个赛道之前,真正的机会正在三个被市场忽视的层次中悄然聚集。


二、核心变量 / 战场定义:具身智能的三层架构

要理解具身智能的投资逻辑,首先要打破一个错误的认知框架:「具身智能 = 人形机器人」。

这个等式导致了大量投资者在做一件本质上相同的事:为机器人的「身体」付溢价,却对驱动这具身体运动的「大脑」和「小脑」视而不见。

投黑马将具身智能的技术架构拆解为三个层次:

第一层:大脑(Cortex)——通用机器人基础模型

大脑层负责最高层次的感知、推理和规划。它类似于LLM对自然语言的作用:在海量机器人操作数据上预训练,形成对物理世界的通用理解能力。这一层的核心产出是Vision-Language-Action(VLA)模型——能够理解自然语言指令、感知视觉输入、输出动作序列。

代表玩家:Physical Intelligence(π0/π0.5)、Skild AI(Skild Brain)、NVIDIA Isaac GR00T N系列。

这一层的核心壁垒是数据规模和多任务泛化能力,而非算法创新本身——这是一场「谁能喂进去最多、最多样化的机器人行为数据」的竞赛。

第二层:小脑(Cerebellum)——垂直场景策略模型

小脑层负责将大脑的通用能力「微调」为特定场景的高精度执行。它类似于在通用LLM基础上训练的垂直行业模型:同样需要基础模型能力,但核心竞争力在于特定场景的数据积累和执行精度。

比如:工业流水线上的精密零件组装(±0.1mm精度)、外科手术辅助(颤抖抑制+力觉反馈)、餐饮服务(液体控制+软体物操作)。每个场景都需要一个独立的「小脑」,因为通用大脑在极高精度要求下表现会急剧下降。

代表玩家:目前这个层次几乎是空白——正是本文最重要的机会之一。

第三层:本体+感知(Body+Perception)——硬件+传感器

这是最容易被理解、被投资、也最容易陷入价格战的层次。本体层包括机械结构、驱动器、电源系统;感知层包括视觉传感器、触觉传感器、力矩传感器。

这一层的竞争正在快速走向红海:宇树科技已经将人形机器人本体价格压至15万人民币以下,这个数字还在继续下降。当一件商品化的事情在发生,投资逻辑就要转移。

三层的关系:不是独立存在,而是相互依赖

真正理解这个架构后,一个反常识的结论会浮现:控制整机本体的公司,不一定控制整个价值链。

理由在于:大脑模型可以是「跨本体」的——同一个Skild Brain,可以同时驱动Figure AI的人形机器人、宇树科技的H1机器人、以及工厂里的工业机械臂。这意味着大脑层具有天然的平台化潜力,而本体层的竞争者越多、商品化越快,反而对大脑层的需求越强。

这和移动互联网时代Android的崛起逻辑几乎相同:硬件竞争越激烈,操作系统层的价值就越凸显。


三、竞争格局分析:谁在赢,谁在输,为什么

Physical Intelligence (π):学术基因的「模型先行」派

卡位逻辑:由前斯坦福、Google DeepMind研究人员创立,以模型研究能力和数据规模为核心优势。π0是业内第一个真正意义上的「通用机器人策略」——在7类机械臂平台、68项任务上训练,实现了从叠衣服、收餐具到组装纸箱的零样本泛化。其最新模型π0.5进一步扩展了开放世界的泛化能力。

护城河:最强大的学术研究网络,加上50亿美元估值背后的顶级投资者(Spark Capital、Lux Capital等)带来的数据合作关系网络。π0在2026年初开源后,迅速成为机器人研究社区的基准模型,形成了社区飞轮——这是极少数「开源反而强化品牌」的成功案例。

隐患:开源π0是一把双刃剑——社区贡献加速了改进,但也削弱了模型本身的独家壁垒。最大的风险是:当NVIDIA的GR00T N系列在性能上持续追赶,Physical Intelligence的差异化叙事将变得越来越难以维持。此外,公司至今没有清晰的收费模型,「最好的机器人大脑」如何转化为可持续商业收入,仍是悬而未决的核心问题。

投黑马判断:最具研究深度的「大脑」玩家,但商业化路径仍不清晰,估值与收入严重不匹配。2026年的关键验证点是:能否将π0.5转化为可计费的API服务,建立可重复的商业循环。暂不建议在当前估值水平追入,等待商业化信号确认。

Skild AI:目前「商业化最快」的大脑

卡位逻辑:由CMU机器人学教授创立,选择了与Physical Intelligence截然不同的路线——不追求模型研究突破,而是以「全身脑」(Omni-bodied Brain)概念抢先商业化。Skild Brain已在安保巡逻、仓储搬运、工厂检测三个场景实现规模部署,并在数月内实现3000万美元收入。14亿美元C轮(估值140亿美元,投资方包括Lightspeed和Bezos Expeditions)进一步巩固了其资金优势。

护城河:数据飞轮已经开始转动——每次商业部署都在生成新的真实世界训练数据,而这些数据反哺模型改进,形成良性循环。「先商业化、后飞轮」的策略在AI领域被证明是最有效的壁垒构建方式之一。

隐患:3000万美元收入听起来很亮眼,但与140亿美元估值相比,市销率高达467倍——这个数字建立在「数据飞轮会持续加速」的假设上。如果早期商业部署中机器人的实际表现不达预期,客户续约率和扩张速度将大幅低于预期,估值将面临重新定价压力。

投黑马判断:当前最值得紧密追踪的大脑玩家。商业化节奏领先,数据飞轮逻辑自洽,但估值已提前消化了大量预期。早期布局已失去左侧窗口,重点追踪其季度收入增长数据和客户留存率。

NVIDIA:想做「机器人界的Android」

卡位逻辑:NVIDIA的真实战略意图不是制造机器人,而是成为机器人AI的底层平台——Isaac GR00T N系列模型+Isaac仿真框架+Jetson边缘计算芯片,三位一体构建生态锁定。GTC 2026宣布GR00T N1.7达到「可商业化部署」级别,同时已有110个机器人大脑开发商基于GR00T平台构建,涵盖ABB、KUKA、Figure AI、Agility等核心玩家。

护城河:GPU + CUDA的生态锁定效应是科技史上最强护城河之一;Isaac仿真框架的合成数据生成能力创造了颠覆性优势——11小时可生成78万条合成轨迹,等效6500小时人工演示数据,将整个生态的数据成本降低了数量级。GR00T N2基于DreamZero架构的预告版本显示其在新环境下的任务成功率已是领先VLA模型的两倍以上。

隐患:平台策略的天敌是「生态反叛」——如果Physical Intelligence、Skild AI等核心玩家在模型能力上显著超过GR00T,开发者生态可能发生分裂。此外,NVIDIA的机器人业务目前仍是GPU主营业务的「附属叙事」,当GPU周期下行时,机器人生态的战略优先级可能下调。

投黑马判断:最安全的间接标的,但已经是公开市场标的,左侧价值有限。对一级市场投资人的意义在于:在NVIDIA所构建的平台生态中,寻找尚未被充分定价的「应用层和工具链」公司。GR00T N2一旦开源,将是重要的时间节点信号。

Figure AI:硬件整合派的「亚马逊验证」

卡位逻辑:Figure AI是整机本体路线中最有商业说服力的公司之一——它是少数几家真正拿到大型企业量产订单(而非试点合作)的公司,亚马逊在其仓储自动化项目中采购了Figure机器人,进行了可量化的商业验证。估值超过30亿美元,投资方包括微软、英伟达、亚马逊AWS等战略资本。

护城河:核心护城河不是机器人本身,而是与亚马逊共同开发的「亚马逊仓储场景专有数据集」——这是任何后来者在相同时间窗口内难以复制的资产。与Helix基础模型(OpenAI联合开发)的深度绑定也提供了额外的技术护城河。

隐患:整机本体是竞争最激烈的层次。特斯拉的Optimus已在内部工厂大规模部署,宇树科技在价格上构成强力压制。如果Figure无法将仓储场景的成功复制到其他行业,其商业化路径将显著收窄,高额研发投入的回收周期将被拉长。

投黑马判断:整机本体路线中的优质标的,但不是左侧机会。亚马逊验证提升了确定性,同时也压缩了超额回报空间。适合作为组合配置中的「验证型」标的,而非「非共识型」押注。

宇树科技 (Unitree):价格战的发动者,也是价格战的受害者

卡位逻辑:宇树用硬件工程能力把四足机器人和人形机器人的价格打穿——H1人形机器人本体在2025年末降至9万美元,到2026年初进一步降至约15万人民币。这一策略使其成为全球出货量最大的机器人本体制造商之一,也是NVIDIA、Physical Intelligence等生态玩家的重要硬件合作伙伴,GR00T N1.7支持的参考本体之一即为宇树H1。

护城河:供应链效率和制造成本控制是真实壁垒,短期内中国以外的竞争者难以复制。规模化出货量也带来了一定的学习曲线优势。

隐患:价格战没有终点。当宇树把价格压到15万人民币,市场上立刻出现了目标价格为8万人民币的竞争者。本体的商品化意味着利润空间将持续被压缩,除非能控制上游的大脑模型层或关键感知器件层。目前宇树在软件层投入有限,是其最大的结构性弱点。

投黑马判断:优质的硬件制造商,长期价值将面临价格战压力。值得关注的是宇树是否会向软件层延伸——这是判断其能否从「制造商」升级为「平台」的关键信号。如果2026年H2出现宇树与大脑模型公司的深度合作或收购动作,则需要重新评估其估值逻辑。

银河通用:中国大脑派的早期代表

卡位逻辑:银河通用是少数坚持「大脑优先、本体中立」路线的中国公司,其Galbot G1配备自研大脑模型,强调多本体兼容性。获得字节跳动和红杉中国领投的10亿元融资,是2026年开年最大的中国具身智能单笔融资之一。百亿估值使其成为中国具身智能「大脑派」的旗帜性标的。

护城河:在中国场景下的数据积累,以及字节跳动在内容和用户行为数据处理方面可能的技术溢出效应。更重要的是,银河通用的「大脑中立」策略意味着它在未来可以与多家整机厂商合作,避免了单一硬件合作伙伴依赖的风险。

隐患:中国场景数据的多样性和复杂度与海外场景有显著差异,在高端工业和医疗场景,中国公司的数据优势尚未体现。此外,百亿估值与当前收入规模之间的差距,使得其后续融资和估值压力不小。

投黑马判断:中国大脑派的代表性观测窗口。2026年H2能否拿到规模化工厂订单,是判断其故事能否兑现的关键节点。字节跳动的战略意图(是否将其整合进自身AI基础设施体系)也是需要持续追踪的变量。


四、被市场低估的早期机会

机会一:机器人技能数据基础设施

核心逻辑:具身智能的「大脑」训练,本质是一场数据战争。训练一个具有真实商业价值的机器人基础模型,需要数十万乃至数百万条高质量的机器人操作轨迹数据——而收集这些数据,需要人工遥操作、传感器采集和数据标注的完整流水线。这是一个规模超大、专业门槛极高、但目前极度碎片化的市场。

当前空白:NVIDIA用合成数据部分解决了这个问题(11小时生成相当于6500小时人工演示数据),但合成数据与真实数据之间存在「物理差距」(sim-to-real gap),需要一定比例的真实数据来校准。这个「真实数据采集和处理」的服务市场,目前没有规模化的独立服务商。Scale AI正在向机器人行为数据标注方向延伸,但其体量和定价对早期机器人公司并不友好。

护城河来源:积累特定场景的高质量数据集形成先发优势;建立与机器人本体厂商的深度集成降低数据采集边际成本;构建数据标注质量标准形成话语权。

追踪信号:Universal Robots与Scale AI在2026年3月联合发布的「模仿学习系统」(Imitation Learning System)是一个早期市场验证信号。如果这个方向在Scale AI体量上取得成功,说明独立机器人数据基础设施公司的市场空间足够大。另一个信号是NVIDIA Isaac仿真框架的API调用量——如果2026年Q2-Q3出现显著加速,意味着对高质量「仿真-真实」数据转换工具的需求正在爆发。建议关注2026年Q2是否出现专注机器人遥操作数据采集、完成千万人民币级别天使轮的中国团队。

机会二:触觉感知与灵巧手——「最后一厘米」解决方案

核心逻辑:机器人的手,是整个具身智能商业化最大的物理瓶颈。目前所有主流人形机器人都能做到「拿起一个苹果」,但几乎没有一家能稳定做到「拿起一个生鸡蛋而不破」。这个差距背后,是触觉感知系统的缺失——机器人的手指没有感觉,导致力度控制极不稳定,限制了绝大多数需要精细操作的应用场景(食品加工、手术辅助、电子组装)。

当前空白:主流人形机器人厂商对触觉传感器的集成普遍不足,这是商业化路径上已知的最大技术瓶颈,但专注于「触觉感知+灵巧手」的独立公司,目前仍处于极早期阶段,几乎没有头部资本进入。清华大学在2026年1月披露了柔性「类皮肤」触觉传感器的技术突破,结合视觉触觉反馈循环实现了对材质属性和握力稳定性的精准感知,但相关团队尚未进入创业状态。

护城河来源:物理传感器设计本身具有相当高的技术壁垒(材料学、信号处理、与AI模型的联合优化);且一旦某个触觉感知方案被主流本体厂商采用,供应链切换成本极高;灵巧手作为独立可替换模组的「标准件」化,能够在多个本体上销售,形成规模效应。

追踪信号:①清华大学类皮肤触觉传感器团队是否分拆创业(2026年Q2-Q3为关键观察窗口);②Figure AI、宇树科技等头部整机厂商是否发布「触觉传感器合作伙伴计划」——如果发布,意味着上游供应链窗口打开,独立触觉感知公司将迎来批量询价机会。

机会三:垂直场景专用「小脑」——被遗忘的精度层

核心逻辑:通用大脑模型的泛化能力在±5mm精度内表现优异,但工业制造、外科手术、珠宝首饰加工等场景要求±0.1mm甚至更高的精度——通用大脑在这里「不够用」。这就是垂直场景「小脑」的价值:在通用大脑基础上进行场景专属微调,并结合力反馈、视觉伺服等传统机器人控制技术,实现高精度执行。

当前空白:大脑层已经有Physical Intelligence、Skild AI在争;整机本体层有Figure AI、Agility、宇树在争;但夹在中间的「场景专用小脑」层几乎没有独立公司进入,绝大多数整机厂商在自己做,且大多数做得很粗糙。这是一个「需求真实 + 当前解决方案稀缺 + 认知差显著」的典型左侧机会。

护城河来源:特定场景的训练数据积累(比如5000小时的外科辅助手术数据)是极难复制的资产;场景认证和法规合规(医疗领域的FDA审批、工业领域的安全认证)是天然护城河;与垂直行业头部客户的深度绑定提升了切换成本。

追踪信号:①是否出现专注单一垂直场景(如「手术机器人小脑」「PCB组装小脑」)且完成Pre-A轮的公司——建议在YC、Sequoia Scout、以及具身智能专项基金的portfolio中进行地毯式扫描;②NVIDIA Isaac平台上垂直行业SDK的发布节奏——每发布一个新行业SDK,意味着NVIDIA在帮这个行业验证数据和技术可行性,对应的垂直小脑机会随即出现。

机会四:机器人仿真与评测工具链

核心逻辑:当整个行业有数十个机器人本体型号、数百个基础模型变体在同时迭代时,「如何客观评估一个机器人大脑/小脑的能力」变得极其重要。但目前没有一套被行业广泛认可的标准测评体系——机器人公司的能力宣称大多依赖自行设计的演示场景,缺乏第三方可重复验证的基准。

当前空白:这是一个典型的「行业发展到一定阶段必然出现的工具层需求」。类比AI大语言模型领域:当GPT-3发布后,HELM(斯坦福)、SuperGLUE等测评基准迅速成为行业标准,背后公司获得了不成比例的话语权和商业价值。具身智能目前还没有这样的权威评测机构或工具链公司,现有的评测框架(如OpenAI的RoboSuite、DeepMind的AlfWorld)在工业实用性上仍有很大差距。

护城河来源:先发的基准设计权——谁先设计出被行业认可的评测基准,谁就占据了技术话语权;仿真环境的逼真度和多样性是壁垒(需要大量场景建模和物理引擎优化);标准一旦被采用,替换成本极高(因为历史数据的可比性依赖于持续使用同一套基准)。

追踪信号:①学术界是否出现被引用超过100次的具身智能综合评测论文(2026年H1如果出现,说明学界在推动标准化,商业化机会随之出现);②是否有专门针对「机器人能力评测即服务」(Evaluation-as-a-Service)的公司在Y Combinator S26批次或类似孵化器中出现——这是行业认可的先行指标。


五、关键变量追踪

变量一:数据飞轮速度

为什么这个变量是关键指标:具身智能的大脑模型能力,不是由算法突破驱动的,而是由训练数据的规模和质量驱动的——这是物理AI领域区别于语言AI最重要的特征之一。数据飞轮速度决定了谁能在模型代际迭代中保持领先,也决定了现有领先者的护城河是否真实可持续。

追踪信号1:NVIDIA Isaac仿真框架的月活跃开发者数量(来源:NVIDIA季报/GTC大会开发者数据)——这是合成数据生产能力的代理指标。如果2026年Q3月活跃开发者超过5万,意味着合成数据生产速度已到达「供给过剩」临界点,行业竞争焦点将转移到真实数据差异化,对应的机会是真实数据采集服务商的价值大幅提升。

追踪信号2:Physical Intelligence开源π0模型在Hugging Face的下载量增长曲线(来源:Hugging Face公开页面)——这是社区数据飞轮速度的代理指标。如果季度环比增速超过100%,说明开源社区正在形成对该模型的数据贡献飞轮,Physical Intelligence的「开源战略」将被证明是成功的护城河构建方式。

变量二:工厂量产订单转化率

为什么这个变量是关键指标:工厂量产订单(区别于试点订单)是具身智能商业化的真实分水岭。试点订单证明概念,量产订单证明经济性和可靠性。2026年是否出现第一批「超过1000台单次订单」,是行业从「演示期」进入「商业化期」的关键节点,也是判断整个估值体系是否可持续的关键数据。

追踪信号1:Figure AI/Agility Robotics与亚马逊、宝马等头部客户的合同披露(来源:企业新闻稿、美国证券备案文件,如IPO前的S-1文件)——具体关注「部署台数」和「合同金额」,而不仅仅是「合作宣布」。没有具体台数的「战略合作」不构成有效信号。

追踪信号2:宇树科技H2本体的月度出货量数据(来源:中国海关出口数据、供应链上游零部件采购量的行业渠道核查)——宇树作为价格最低的头部玩家,其出货量变化是最敏感的市场温度计。如果2026年Q3月出货量超过500台,意味着工厂采购决策已从「观望」转向「行动」,整个行业的商业化判断需要上调。

变量三:基础模型开源化进展

为什么这个变量是关键指标:机器人基础模型的开源化,对整个行业生态有结构性影响——它降低了小脑层和工具链公司的进入门槛,同时加速了数据生产的社区化。如果NVIDIA、Physical Intelligence等继续推进大模型开源,将显著加快整个生态的成熟速度,并提前引爆对「垂直场景小脑」的商业化需求,即本文机会三的兑现时间线将被压缩。

追踪信号1:NVIDIA GR00T N2(预告中的下一代机器人基础模型,基于DreamZero架构,在新环境任务成功率上优于领先VLA模型逾一倍)的发布时间和开源计划(来源:NVIDIA官方公告/GTC 2026发布节奏)——GR00T N2一旦开源,标志着基础模型层已进入「基础设施」阶段,投资重心将快速向上层应用和工具链迁移。

追踪信号2:GitHub上具身智能相关开源项目的月度Star增长率(来源:GitHub trending公开数据)——如果包括openpi(Physical Intelligence开源项目)在内的机器人基础模型项目,2026年月度新增Star超过10000,意味着开发者社区已形成规模,商业生态的爆发时间点即将到来。

三个变量的联动逻辑:

[数据飞轮加速] → [基础模型迭代速度加快] → [工厂客户对机器人能力的信心提升] → [量产订单转化率上升] → [更多真实部署数据回流飞轮] → [模型进一步改进] → [市场重新定价]


投黑马 · 独家评级

赛道热度:🔥🔥🔥🔥🔥  2026年全球融资最热赛道之一,每天超5亿元进场,无需争议
左侧机会:⭐⭐⭐⭐    整机本体已失去左侧窗口,但大脑/小脑/数据三层仍有显著认知差
布局紧迫度:⚡⚡⚡⚡  GR00T N1.7商业化节点已到,量产订单窗口18个月内打开,格局即将固化

推荐关注层次:
机器人数据基础设施 > 垂直场景专用小脑 > 触觉感知与灵巧手

分层布局建议 + 风险披露 + 结语

分层布局建议

第一层:低风险 / 长周期——数据与工具链基础设施

投资逻辑:机器人大脑模型的训练需要持续的数据供给,无论最终谁赢得「大脑」层的竞争,数据和工具链基础设施都是必要的上游。这是一个「卖水」而非「挖金」的逻辑,在赛道格局未定之前,先布局这一层更稳妥,且不需要押注特定的技术路线赢家。

选股标准:团队要求——至少一位在机器人学/控制系统方向有10年以上经验,不接受纯AI背景团队;数据方向——已与至少2家头部整机厂商建立正式数据采集合作协议(不是意向书);工具链方向——已有被≥3个知名研究机构采用的开源评测框架,且GitHub Star超过500。

时间窗口:2026年Q2-2027年Q1。在机器人基础模型能力验证完成、行业开始进入规模商业化之前完成布局,Pre-A至A轮为理想进入节点。

第二层:中风险 / 中周期——垂直场景专用小脑

投资逻辑:当通用大脑完成从「演示」到「部署」的跨越后,精度要求最高的垂直场景将成为下一个需要专项解决方案的市场。工业制造(±0.1mm精度)、医疗辅助(颤抖抑制+力控)、食品加工(软体物操控)是三个需求最真实、当前解决方案最稀缺的场景。

选股标准:团队——至少一位在目标垂直场景有5年以上行业经验(非纯AI背景);场景验证——已在目标场景完成≥100小时的真实部署数据采集,且有客户付费意愿书(LOI);精度指标——目标场景的关键精度指标(如力控精度、成功率)优于通用大脑至少50%,且有可复现的第三方测试数据。

时间窗口:2026年Q3-2027年Q2,在垂直场景客户完成「试点→量产」决策窗口之前完成布局。

第三层:高风险 / 短周期——平台层非共识押注

投资逻辑:具身智能「大脑」层存在平台化的可能——如果某个基础模型以「跨本体」「可商用API」的方式快速扩张,它可能成为类似OpenAI API在语言AI领域的存在。这是最高风险、但也是潜在回报最高的押注。目前Skild AI是这条路线最接近验证节点的公司,但估值已相当高;值得关注的是是否有中国本土的「跨本体大脑」公司在A轮前完成商业化验证。

选股标准:已有商业化收入(不仅是试点,需要付费合同);已验证跨≥3类本体的部署能力;季度收入环比增速超过30%;具备清晰的数据飞轮机制(真实部署→数据采集→模型迭代的闭环)。

时间窗口:2026年内天使/Pre-A轮是左侧进入的最后窗口。对于Skild AI的S-1文件(如果IPO计划在2026-2027年落地),届时二级市场的介入策略另行讨论。

风险披露

风险一:sim-to-real gap迟迟未被解决

即使合成数据生产速度大幅提升,如果仿真物理环境与真实世界的差距始终无法收敛到商业可用水平,具身智能的规模商业化时间线将大幅延后2-3年。这一风险对「数据基础设施」层影响最大——如果真实数据需求大幅超出预期,数据采集成本将阻碍规模化。概率判断:较低(GR00T N1.7和Skild Brain的商业化数据已部分证伪这一风险),但监测信号为2026年Q3-Q4工厂量产订单是否如期出现。若Q4仍未出现1000台级别订单,则需重新评估整个商业化时间线。

风险二:大厂战略收割

如果NVIDIA决定将Isaac平台「全面闭源」并垂直整合,或者Physical Intelligence/Skild AI被苹果、微软等大厂以战略价格收购,整个开放生态的发展逻辑将被打断——对独立数据和工具链公司的影响尤其显著。针对这一风险,早期投资者应优先选择与多个平台保持兼容性、避免单一平台依赖的公司,并在投资协议中明确加速条款(acceleration clause)。概率判断:中等,大厂收购在AI领域已是常见退出路径,但对被收购公司的投资人而言未必是坏事。

风险三:中美技术脱钩加剧

NVIDIA芯片出口限制的持续收紧,可能导致中国具身智能公司在算力获取和模型迭代速度上落后于美国竞争者2-3代。这一风险对「在美上市计划」和「跨境技术合作」均有直接影响,且执行层面的不确定性极高,难以提前对冲。对于人民币基金,建议优先布局中国本土数据和场景优势明确的公司,规避依赖美系芯片和模型的标的,并对美元基金跨境结构保持谨慎。

风险四:整机商品化速度超出预期

如果宇树科技或其他中国整机厂商在2026年底前将人形机器人本体价格降至5万人民币以下,整机层的利润池将被彻底摧毁,布局整机本体的投资人将面临直接损失。但这对大脑层和数据层是利好——这将加速大脑模型的采购需求,并验证本文的核心判断。这一风险的「利好转化」机制要求投资者在组合层面做好对冲,而非在单一层次上all-in。

结语

具身智能的这轮浪潮,与其说是机器人革命,不如说是「AI如何学会使用身体」这个根本性问题正在被解决。每天5亿元涌入这个赛道,但投资的质量远比数量更关键。整机本体的聚光灯之下,隐藏着三个几乎无人覆盖的关键层次——而这三个层次,恰恰是具身智能真正商业化的底层支柱。

数据飞轮、精度壁垒、评测标准——这三件事,没有任何一件能出现在朋友圈里机器人行走的视频中,但它们决定了十年后谁是这个行业真正的平台公司。

聪明的左侧投资者知道:最好的机会,永远不在最响亮的地方。在聚光灯照亮之前,我们已经在那里。


投黑马 · 信号解读

具身智能2026年的核心信号不是融资数字,而是「数据飞轮是否真的开始转」。Skild AI的3000万美元收入、Physical Intelligence的π0开源社区、NVIDIA GR00T N1.7的商业化宣布——这三件事同时在2026年Q1发生,不是巧合,而是整个行业从「研究演示」向「商业部署」临界点跨越的集体信号。但这个信号对于整机本体层的投资价值已经基本透支,真正还在左侧的,是那三个没有PR、没有发布会、没有朋友圈视频的关键层次。

左侧投资者现在真正应该追踪的不是哪家整机公司拿到了大客户,而是以下三个具体信号:①机器人数据采集和标注服务市场中是否出现第一家季度收入超过1000万元的独立服务商;②在工业制造、医疗或食品加工三个场景中,是否出现声称「精度优于通用大脑50%以上」的垂直小脑公司并完成Pre-A轮,且有可验证的第三方精度测试数据;③NVIDIA GR00T N2的发布时间——一旦发布即说明基础模型层已进入基础设施阶段,投资重心将快速上移至应用和工具链。这三个信号中任何一个率先出现,都意味着左侧布局窗口即将关闭。