它石智航 WIYH 数据集今日正式开源:全球首个具身 VLTA 多模态数据,加速具身智能真实世界落地

2025-12-26 18:35:37     来源:

引语:在具身智能领域,数据是智能的最重要燃料,它石智航正成为“为众人抱薪者”。

12月26日,它石智航重磅开源了全球首个大规模真实世界具身 VLTA(Vision-Language-Tactile-Action)多模态数据集 ——World In Your Hands(简称 “WIYH 数据集”):https://wiyh.tars-ai.com/。该数据集首次亮相于今年10月,并在刚刚结束的它石智航技术首秀发布上,作为「超级算法」中的核心成果之一得到行业广泛认可。首秀现场展示的世界首台可人工刺绣机器人等成果,其丝滑动作背后的核心正是基于 WIYH 数据集训练的AWE2.0模型。

WIYH 数据集通过首创 “Human-centric”(以人为中心)的数据采集新范式,破解了遥操作数据采集规模化成本高、仿真数据在 sim2real 时存在 GAP,难以丝滑迁移到现实世界的痛点,填补了具身智能所需的高质量、可泛化、大规模真实世界数据的空白,为具身基座模型实现 Scaling Law 提供了关键语料。要知道,当前具身智能所需数据量与现有储备之间至少相差两个数量级,WIYH的开源正为填补这一鸿沟提供了核心解法,加速了具身智能落地真实世界的进程。

 
 

在 Human-centric 采集范式下形成的 WIYH 数据集,具备了真实可靠、丰富多元、全面多模态、规模化等特征,并拥有海量数据:包含超过10万条以上的真实人类操作视频、40余种任务类型、100多种人类技能,覆盖了含520 余种真实物品,真实还原商超、酒店、餐饮、工业、办公、家居等多行业的10种核心场景全链路任务,数据将分批次释放。WIYH是业内最大的Human-centric数据集,且仍在不断扩展和丰富中。

场景和任务分布

各场景技能分布

物体和技能词云

采集了丰富的数据之后,行业还面临数据迁移这另一核心难题,为此它石构建了 TARS Datacore 具身数据引擎。作为云端大模型,它实现了全流程的自动化标注,将原始视频转化为机器人能理解的“教科书”。这套标注体系不仅涵盖了标定、深度、动作、指令、思维链 (COT)、掩码(Mask)和触觉(Tactile)等基础信息,更通过以下三类精准标注,形成了从感知到动作的全链路闭环:

原子任务标注:理解“做什么”。将复杂动作拆解为“抓取、移动、放置”等不可再细分的逻辑单元,并配以自然语言指令,让机器人明白长流程任务的操作顺序与步骤内涵;

图像感知标注:看清“在哪里”。通过云端语义模型给每个物体打上清晰的边界标签(掩码),并利用 3D 视觉技术计算画面中物与人的深度距离,赋予机器人精准的空间感,使其能理解物体的边界与远近;

视觉语言标注:思考“为什么”。这是最关键的“大脑训练”,它通过空间明确指代操作对象,防止机器人在杂乱环境中错认目标。同时,让模型预测下一步任务,并设置逻辑陷阱来校验机器人的判断力。

它石首席科学家丁文超博士表示,“Human-centric数据采集范式配合TARS Datacore数据引擎,可以记录和生产最高质量、最丰富的具身智能数据,真正使得scaling law成为可能。”

强大的数据采集与迁移能力,共同打磨出 WIYH 数据集在空间推理、世界模型、跨本体迁移等方面的独特优势。目前,多项基准测试结果已印证了 WIYH 数据集的核心价值:

在视言大模型(VLM)的空间推理评测中,通过对 GPT-4o、Qwen-VL-Plus 等主流模型在空间推理(SR)和空间感知(SP)等维度的对比发现,虽然各模型在通用视觉任务上表现出色,但在处理复杂的以人为中心的空间逻辑时仍存在显著差异。这一基准测试直观地揭示了当前大模型在感知操作空间时的局限,也凸显了 WIYH 数据集在训练更高阶空间感知能力方面的独特价值。

在世界模型(World Model)的物理一致性验证上,WIYH 数据集展现了强大的“物理引擎”属性。评测结果显示,在加入 WIYH 数据后,COGVIDEO 和 DYNAMICRAFTER 等视频生成模型在一致性、流畅度、动态性和质量等四大关键指标上均实现了全面跨越,其中动态性(Dynamic)指标得分提升了 15.6 分。配合 4D 重建技术,通过对“倒酒”、“叠衣服”等任务进行精确的几何重建,为模型理解真实世界的物理动态提供了高真值的监督信号,确保生成的动作既流畅又符合物理常识。

在机器人跨本体迁移实验(Cross-embodiment Experiments)层面,WIYH 数据集真正实现了“从人到机器”的能力迁移。通过将人类演示视频与机器人操作数据进行协同训练(Co-training),机器人在复杂场景下的泛化能力得到了质的提升。实验数据表明,在极其杂乱的场景中,仅机器人操作数据只能达到 8% 成功率的任务,在引入 WIYH 人类视频辅助后,成功率暴涨至 60%。这一显著的性能增益证明了 WIYH 数据集不仅是视觉语料,更是提升机器人实战能力、解决真实世界非结构化环境操作难题的核心“养料”。

它石创始人兼 CEO 陈亦伦博士认为,“在 AI 领域,最极致的开放不是开源模型,而是开源数据集,因为所有的 AI 模型本质上都可以通过数据和合适的训练方法‘生长’出来。” 它石WIYH的此番开源,正是以开放的态度,为行业通用具身基座模型训练提供关键语料和基础设施,助力具身智能迈向通用智能的新高峰。

它石WIYH数据集于今日起(12.26)可正式访问。该网站构建了从认知到实践的全方位支撑:用户既能通过结构化的数据集全景展示、基准测试结果与典型用例,快速完成对数据集性能与场景的初步了解,又能配合快速入门指南与自动化 SDK,直接进入深度的落地实践与开发部署。网站公布了标准化的 off-the-shelf (OTS) 开源可复现方案,也放出了 TARS商用级Human-centric数据解决方案TARS SenseHub的相关信息。 TARS SenseHub 是由它石自研的超轻量数据采集套件,包含 “眼睛” TARS-Vision 与 “双手” TARS-Glove 两大关键组件。其核心理念是让人类和机器共享同一套感知体系,即机器人通过数据“能看人之所看,感人之所感”。

未来,它石智航将继续坚持以人为中心的具身数据与模型新范式,持续挖掘真实世界的数据价值,让面向万物、赋能万业的具身智能真正从实验室走进千家万户。

 

标签:

猜你喜欢

解读零零享全新愿景:成为年轻人的首选租赁平台
搜索见义勇为 点赞时代英雄|孟凡荣:“儿子救人不后悔,他是我们的骄傲,他的精神将永远传承”
河南周口:二十二年,两代退役军人的同一个答案
鹏华科创100ETF(588220)获资金持续关注,鹏华打造硬科技中坚配置利器
双奖加冕!锐捷网络 RG-UNC 与 EDN 方案分别斩获创新产品+方案大奖
第二届《盛舞之夜》强势回归 顶尖阵容曝光 舞蹈界神仙齐聚香港
打造体育营销范式,东鹏补水啦战略布局羽球运动赛事
德邦快递以技术与责任并行,织密快递行业反诈安全网
2025雪球黑金之夜:共探财富逻辑,锚定2026投资新航向
开启你的"肠"归作息,养乐多带你探寻优质睡眠的活力密码
雪纤瘦美容集团21年深耕高端健康美业,荣膺福布斯中国双项殊荣
“完赛即落地”!东莞新材料行业构筑“创新力场”
千里擒凶洒热血 侠义之心显担当
YONEX 近日发布 VCORE新品
格尔软件参编金融业抗量子密码报告,以实战经验护航行业量子安全迁移
当财富管理转向“长期主义”,万通保险投资哲学有什么优势?
产业 AI 的价值样本:千匠 AI 智能化平台
烟火气里迎新年,广发卡联动5万商户点燃跨年消费热潮
小竹科技连下四城,银企合作开启数字化新篇章
科技引领多元配置,华夏基金年度对话|DeepAlpha解码AI赛道机遇
光荣浙商,誉归乐清!贝昂智能总经理胡加明当选“2025光荣浙商
全球智慧 材料为基 共筑长寿工程 国际健康长寿工程高峰论坛暨森立康功能性高分子材料发布会在东莞成功举办 ——跨界材料创新引领健康产业新未来
椭圆时空完成数亿元C1轮融资,加速“星池计划”布局太空具身智能服务
嘉兴南湖机场正式通航,东航开通首条客运航线
国金证券20位投资顾问荣膺金麒麟最佳投顾奖,打造“智能策略+人工陪伴”投资服务新生态
溢价率超100%!5.4亿元高价成交!深圳富尔达工业园区再掀阿里资产工业标的拍卖热潮
冲刺港股!SKG母公司未来健康携1501项专利,抢占千亿智能健康赛道
2025“雪球x易方达雪球之夜”人气用户共探投资新路径
引领数字新生态 赋能商业新未来|2025-2026中国企业数智化转型TOP100服务商评选正式启动
万亿风口下的抢滩战!上市公司密集布局脑机接口