大家好,欢迎来到IT知识分享网。
借助开源,机器人技术开发的门槛又被进一步拉低了。
继开源自研轻量化、高性能通信架构AimRT以及智元机器人灵犀X1之后,就在今天,稚晖君及其背后的创业公司智元机器人(AgiBot)又重磅宣布自今年以来的第三次开源新动作,发布AgiBot World(https://github.com/OpenDriveLab/AgiBot-World),这是一个汇集百万真实机器人数据的开源数据集。
依托这一数据集,不仅可以帮助更多开发者加速机器人开发和测试,还将大大推动相关研究的实际落地,让我们理想中的场景,比如家里机器人洗衣服、擦桌子、整理书架,超市里机器人拣货、收银、整理货架,甚至工厂里的机器人搬运、打包,都将成为触手可及的现实!对此,智元表示,这一里程碑式的开源项目,标志着具身智能领域“ImageNet时刻”已经到来。
为什么要开源机器人数据集?
为什么说AgiBot World的开源,意义非凡?事实上,回看过往,行业中不是没有过机器人数据集的开源案例,譬如谷歌DeepMind此前构建了一个开放的数据集Open X-Embodiment(https://robotics-transformer-x.github.io/paper.pdf),整合了22种不同形态机器人的数据,涵盖了从单臂机器人到双手机器人、四足机器人的各种场景,包含超过100万条真实机器人轨迹。通过这些数据,机器人能够完成多达16万个任务,为机器人学习提供了广泛而多样的训练资源。
Open X-Embodiment, ICRA 2024
不过,在应用这一数据集过程中,不少研究者发现其中大部分数据缺乏统一标准化的采集流程,且许多机器人构型已经过时,数据质量格式参差不齐,在机器人策略学习的过程中甚至会带来副作用。
后来为实现规范化的数据采集,来自斯坦福、伯克利、谷歌等机构与公司又构建的DROID数据集(https://droid-dataset.github.io/),包含了76,000个演示轨迹,跨越了564个场景和84个任务。
尽管涵盖了相对丰富的场景与技能,然而该数据集的作者团队在后续研究中指出DROID存在大量低质量数据,会给机器人的学习过程造成“困惑”,存在一些不足之处。
现如今,已有很多具身大模型初创公司基于自采集的大规模高质量双臂机器人数据训练的模型展现出了整理、分拣、洗衣等执行复杂动作的能力,但相关数据集目前仅在公司内部使用,并未开源。
要知道,高质量数据在当前具身智能研究中至关重要。为了推动通用具身智能领域的进一步发展,让开发者能够更方便地获取高质量的机器人数据,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布了 AgiBot World——全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目。
具身智能领域的ImageNet时刻来了!
相较上文提及的Google Open X-Embodiment数据集,智元官方表示,AgiBot World的长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量从实验室级上升到工业级标准。
据悉,AgiBot World数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
当然,耳听为虚,眼见为实。这个数据集包含的数据究竟有多强大,我们不妨通过下面示例一探究竟:
在插内存条这个任务中,需要毫米级精细控制,稍有不慎可能导致设备损坏。数据集中覆盖了这样一条数据,机器人配备了像“神经末梢”一样灵敏的触觉传感器,能稳稳地把内存条插好,避免出错。
整理家务小能手:整理洗碗池中杂乱的筷碗盘时,在这条数据中,机器人将杂乱的餐具一一准确无误地整理至洗碗机相应卡槽里。
机器人还能通过双手协作,一只手稳稳抓住衬衫的一角,另一只手精准控制挂烫机与衣物的距离,细致地熨烫每一道褶皱。
对于大件物体搬运,单机器人难以完成。通过双机器人协作,分担重量的同时通过实时调整位置与角度确保物体搬运过程中的稳定安全。
上得厅堂下得厨房,覆盖全域场景的数据集
据官方介绍,AgiBot World诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含3000多种真实物品,真实复刻了家居、餐饮、工业、商超和办公五大核心场景,全面覆盖了机器人在生产、生活中的典型应用需求,为机器人提供了一个高度真实的生产生活环境。
在实验基地里,机器人不仅能在家中客厅学习插花、打扫卫生、做饭,还能在超市担任收银员,在工厂协助自动打包物品……可谓无所不能。
对此,智元透露, AgiBot World包含超过100种真实场景,按家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)进行分布。
整体来看,80%的任务为长程任务,时长集中在60s-150s之间,且涵盖多个原子技能,是DROID和OpenX-Embodiment工作的5倍。



背后全靠这款全能硬件的输出
在开源数据集之际,智元还揭晓了以上这些数据的收集者:
这款机器人具有以下功能:
- 360°感知:打造了环绕式8个摄像头,能够实时全方位感知周围环境的动态变化。
- 灵巧操作:配备具有6个主动自由度的灵巧手,保障动作精准且灵活,能够完成熨衣服等多种复杂操作。
- 末端精细感知:标配末端六维力传感器,并可配备高精度视触觉传感器,能够感知力的微小变化,做到“拿捏有度”,从容完成各种精细操作。
- 高自由度:全身最高32个主动自由度,灵活应对洗衣、做饭、分拣、搬运等复杂任务。
在收集这些真实数据的过程中,智元也对数据质量进行了严格的把控,全程人工在环:
- 任务设计阶段:从设计初稿和设计迭代流程中,邀请了学术界、工业界、消费者多视角进行任务把关。这样设计出的任务更加贴近真实的工作和生活场景。
- 数据采集阶段:从采集员培训到采集质量把控,由完善的管理体系和专业的管理团队进行全程保障。
- 审核标注阶段:对于采集的数据,首先会经过端云两侧的严格筛选,自动剔除不符合要求的数据。此外,专业的审核员会对全量数据进行逐帧审核,确保每一个动作都符合任务标准,并对关键帧和数据特性进行多维度标注。
- 算法验证阶段:通过人工审核的数据还会进一步通过算法进行验证。对于未能通过验证的数据,会重新设计任务进行数据补采,确保数据可用性。
稚晖君及其团队立下的 2025 年 Flag
毋庸置疑,机器人数据集的开源,特别是高质量数据的开放,正在大幅降低开发门槛,加速算法研发,并提供统一的测试基准,帮助机器人更快速适应复杂场景。同时,这也推动了社区协作与创新,让机器人技术更广泛、更高效地应用于生活和工业中。这对于整个具身智能行业来说,无疑是一个重大利好消息。
对于智元而言,其也并未止步于此。在此次开源之际,智元与稚晖君也立了一些 2025 年的 Flag:
1. 百万真机全量数据将陆续开源
2.千万仿真数据同步推送,支持更泛化和更通用的大模型训练
3.发布具身基座大模型,支持模型微调,赋能千行百业
4.发布全套工具链,实现采集、训练和评测完美闭环
5.举办一系列AgiBot World Challenge
让我们拭目以待。
勿再“浮沙筑高台”
用扎实的 C++ 技术为你的职业发展奠定坚实基础
加入「C++ 大师系列精品课」
带你踏上一条通往技术巅峰的学习之旅!
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/169599.html