4月21日,自变量机器人举办发布会,推出新一代机器人进家庭计划。自变量创始人兼CEO王潜在发布会上表示,35天后,搭载自变量新一代自研具身智能基础模型WALL-B、根据家居环境进行硬件升级的新一代机器人将首批入驻真实家庭。
家庭环境的本质是随机、碎片、不断变化,目前,全球还没有任何一台机器人可以在无遥控操作的情况下,独立完成家庭场景中的综合整理任务。在家庭中,一万个动作可能每个只做一次,每次的环境条件都不一样。
“如今机器人硬件已经到位了,双足、灵巧手、力控关节都很好。但大脑没有跟上。当前机器人的核心瓶颈不在本体,而在智能。”王潜在发布会上指出,家庭环境中的每一秒都可能出现全新事件:猫何时跳上桌子、孩子把玩具扔在哪里、地毯的摩擦力等,这些都与实验室场景完全不同,现有技术无法处理这种随机性和碎片化,机器人进入家庭也被视为“这个时代最难的技术问题之一”。
自变量机器人从成立之初聚焦于为机器人构建“大脑”,即端到端的具身智能基础模型。2024年底,自变量机器人发布基于VLA(视觉—语言—动作)架构的第一代具身基础模型WALL-A;2025年9月,该公司将同样思路架构下的轻量化模型版本WALL-OSS开源。
随后,自变量机器人与58同城合作,将搭载WALL-AS模型的机器人送入真实家庭,与保洁阿姨协同作业,实现全球首次机器人进入家庭,并服务人类复杂的家居生活,这个也是首次机器人在C端(个人消费者端)复杂环境的大规模落地。
“正是这些真实家庭的部署,让团队看到了VLA架构的‘天花板’。VLA架构本质上是三个独立模块的拼接:视觉模块负责识别物体,语言模块理解指令,动作模块生成轨迹。”自变量联合创始人兼CTO王昊表示。
王昊进一步分析称,数据在视觉、语言、动作三个模块之间逐级传递,每经过一次模块边界就会发生信息损耗和延迟。但更根本的问题在于,VLA模型只能模仿训练数据中的轨迹,无法真正理解物理世界的规律。
针对无法真正理解物理世界的规律这一困局,自变量在发布会上正式推出新一代自研具身智能基础模型WALL-B,这是全球首个基于世界统一模型架构(World Unified Model,WUM)的具身智能基础模型。
据王昊介绍,WALL-B采用的WUM 的核心理念是将视觉、语言、动作、物理预测等所有能力,放在同一个网络中从零开始联合训练、融为一体,消除模块间的边界和数据搬运损耗。基于这一架构,WALL-B实现了三项区别于行业现有模型的核心技术特征:原生多模态、具备物理世界的“世界观”、与世界交互并自我进化。
值得一提的是,王潜还在发布会上确认,自变量机器人近日完成B轮融资,领投方为小米战投。不久前,美团、阿里和字节分别在A轮、A+轮、A++轮领投或独投自变量机器人。截至目前,自变量已成为国内唯一一家同时被四家互联网大厂投资的具身智能企业。