在近日南京举办的“智汇金陵·AI开源人才峰会”上,魔搭社区联合CCF智能机器人专委会、工信部装备数字孪生技术重点实验室及Lumina具身智能社区等机构,发布了EAI-100(Embodied Artificial Intelligence 100)具身智能年度百项代表性成果与人物榜单。智元(AGIBOT)获“先锋人物”“年度10大突破”“年度10大数据集项目”及“年度10大落地典范”多项荣誉。
此外,智元合伙人、高级副总裁、具身业务部总裁姚卯青荣膺“EAI Pioneer 20”先锋人物。姚卯青以深厚学术积淀与产业经验,全面主导智元在数据基建、模型研发、产业化落地与开源生态建设的系统化布局,成为推动具身智能从实验室走向真实世界的核心推动者。
峰会现场,姚卯青以“具身智能赋能新质生产力”为题发表主题演讲,系统阐述了智元在全链条技术布局与产业落地方面的思考与实践。
“具身智能想要真正走进实际场景、落地部署并赋能客户,是一项极具挑战性的系统工程,必须打通硬件、数据、模型、场景全链条闭环。”姚卯青直言,作为深耕具身智能领域的创新企业,智元构建起从本体研发到场景应用的完整布局,2024年打造国内首个3000平米机器人数据采集场地,采集海量行业数据并开源;依托数据积累,自主研发VLA与世界模型等多款通用具身模型,推出覆盖全流程的一站式开发者平台。
直面数据瓶颈这一行业核心痛点,姚卯青指出:“语言模型可获取数百万亿tokens的训练数据,但具身智能的训练数据量,与之存在4到5个数量级的差距。”为此,智元率先启动真机数据采集,并开源了全球首个基于全域真实场景的百万真机数据集AGIBOT World,该数据集成为全球下载量最高的开源真机数据集,被英伟达等全球领军企业广泛采用。目前智元持续拓展数据维度,同步布局真机实操、人机交互、物理场景等多类数据采集,今年预计产出数百万小时高质量有效数据,以优质数据夯实模型训练基础。
同时,为解决落地成本难题,智元构建了仿真全生命周期流程,“近90%的研发工作在仿真环境中提前搭建、验证并跑通,仅剩余10%的场景适配与落地调试工作。”姚卯青表示,智元利用生成式AI实现小时级场景构建,大幅缩短了从实验室到工厂的“最后一公里”。
围绕核心技术突破,智元构建了“数据—预训练—后训练—世界模型”全链路闭环体系,打造可持续进化的具身智能模型。姚卯青介绍,在预训练层面,智元推出全国首个通用具身基座模型GO-1,开创性提出ViLLA架构,通过VLM与MOE的融合实现通用感知与动作能力及跨任务泛化,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。
相较于语言模型偏向抽象逻辑思维表征,世界模型是从3D物理世界中学习规律,更适配具身智能场景需求。去年7月,智元发布世界模型平台Genie Envisioner,这是行业内首次构建的4D具身世界模型及基准数据集EWMBench。该模型统一了世界动作模型与仿真器,实现了从环境理解、动作推理到仿真训练的全链路能力。
姚卯青介绍,机器人已在3C制造领域实现零部件精准检测与上下料作业,在泛工业场景完成吊箱拆卸与转运,在汽车零部件领域实现自动化上下料,在物流场景完成包裹分拣与拆解。目前相关技术方案已在真实工业现场实现24小时连续不间断作业,产线效率(UPH)达到人类同等作业水平,平均无故障时间(MTBF)达百小时级别。
南方+记者 郜小平
订阅后可查看全文(剩余80%)







