在刚刚落幕的 AWE2026 上,它石智航不仅以全栈技术首秀成为展馆焦点,更迎来了新华网的专程探访与深度报道。

本次新华网报道深度聚焦它石智航发布全球首个「能干活」的通用具身大模型 AWE3.0、从数据采集到本体执行的全栈技术闭环、以及创造全新的吉尼斯世界纪录等诸多亮点,首席科学家丁文超博士现场详解机器人大脑如何赋能物理世界。

以下为新华网报道原文:

新华网北京 3 月 18 日电 2025 年 2 月,上海一间普通的办公室里,它石智航刚刚成立。

会议室里的白板写满了公式和架构图,它石几位联创围坐在一起讨论。窗外春寒料峭,屋内却热气腾腾——他们刚刚决定,要做一件"疯狂"的事:让机器人真正走出实验室,走进工厂,去干那些人类觉得枯燥、危险、却又至关重要的活儿。

一年后,2026 年 3 月的 AWE 展会现场,它石智航首席科学家丁文超博士站在它石的展台前,看着 A1 机器人在一小时内完成超百次亚毫米级线束的完整装配任务。接过吉尼斯世界纪录证书的那一刻,他想起了白板上的那些涂鸦。"我们做到了,"他对记者说,"不是炫技、不是表演,是真的能创造价值、能干活的机器人。"

今年的政府工作报告提出"因地制宜发展新质生产力"。在丁文超看来,具身智能正是 AI 与实体经济深度融合的下一个主战场,而它石要做的,就是打破"实验室样品"与"产线熟练工"之间那堵看不见的墙。

看见机器人大脑:从 VLA 到物理世界理解

过去几年,丁文超看过太多机器人的「表演」。在实验室里,在展台上,在精心布置的场景中,机器人可以打开水瓶、叠好衣服。但只要换个角度、换个环境,它们就「懵」了。

问题出在哪?当前具身智能的主流架构是 VLA(视觉语言动作模型),但丁文超认为这远远不够。「VLA 处理的本质是『视网膜级』信息——像素、颜色、轮廓。但它石追求的是对时间、空间、力及环境交互等物理量,以及世界本质信息的精准表达。比如线形变了手会调整角度,针刺进布里知道用力还是拉直——这些物理直觉,VLA 给不了。」

它石智航本次发布的全球首个能干活的通用具身大模型 AWE3.0,核心突破在于对物理世界的感知、理解和规划。该模型采用自研 AI world Engine 架构,进一步摆脱视角依赖,具备人类般的精细流畅操作能力、长程任务稳定执行能力,以及跨场景迁移与泛化能力,完美诠释了「走出温室、落地干活、通用泛化」的核心定位,更继承了对空间规律与物理法则「知其然,更要知其所以然」的理解、预测与推理能力。

这种能力的底层是「隐空间」技术——将人类动作精髓压缩为模型,机器人不需要记住每一个动作轨迹,而是理解动作生成的底层逻辑。「我们借助隐空间的丝滑动作生成技术,让机器人的操作行云流水、稳定可靠,更将长程任务执行能力提升至全新高度。」丁文超表示。

在它石 AWE 展台正前方的大脑演示区,机器人业内首次对外直观展示了这种能力。观众可在 PAD 上选择酒店、厨房、工厂、办公等任意场景,并选取拿取、整理、清洁等对应任务。机器人在学习人类真实数据并完成未来推理后,左屏实时呈现真实场景画面,右屏则同步展示点云、关键参数、运动轨迹等学习数据,直观揭示了机器人如何通过海量数据学习,实现对环境的深度理解与任务的精准执行。

「我们想让观众看到,机器人是怎么认识世界、怎么思考、怎么推理未来的。」丁文超说。

数据与触觉:让机器人「长出手感」的真实燃料

精细操作是具身智能最难啃的骨头。尤其是线束装配这类复杂、柔性要求高的工业场景。

它石的答案是 HTS(高密度触觉感知)技术,本质是将触觉反馈闭环引入控制。让机器人拥有堪比人类的触觉感知能力,能捕捉细微的数据变化,实现灵活应变。

传统机器人力控基于关节电流反馈,遇到阻力就停。但线束装配需要「连续触觉」:插接过程中阻力变化多样,机器人需实时感知并微调。HTS 让 AWE3.0 大幅提升了机器人对物理接触的局部感知和局部响应能力,由此机器人能够真正胜任精密装配、线束插接等接触密集和柔性操作场景,精细操作能力达到可落地、可泛化、可规模化的产业标准。 

「手上有感觉,干活才靠谱。」丁文超强调。

而数据是这一切的基础。具身智能行业长期困于数据瓶颈:仿真数据量大但物理真实性不足,与现实存在「仿真-现实鸿沟」;遥操作数据真实但效率低。它石选择了第三条路:以人为中心的数据采集(Human Centric)。

在这条数据采集路线背后,是它石始终贯穿的、对「有用」的顶层思考:为保障数据优质精细,它石智航未采用二指夹具、外骨骼等简化设备,而是自主研发高精度视 SenseHub 数据采集系统,采用可采集全量信息的五指手套,完整捕捉手部空间位姿、手指姿态及操作力度。该套件实现感知、计算与传输的深度融合,为大规模、高质量的自然真实人类行为数据采集,提供了完整的系统解决方案。

硬件只是基础,真正的创新在于采集范式:它石让真实的从业者——工厂老师傅、产线工人、保洁阿姨等,佩戴近乎无感的轻量采集设备在真实环境中工作,确保每一条数据都源于真实动作,从而获取海量、精准的多模态数据。手套记录的全量信息,形成了 WIYH 数据集,规模超百万小时,覆盖数万场景,精准满足具身智能对数据真实、有效、完整的诉求。

「机器人可用的数据,必须同时满足三个条件:务场景真实、任务有效完成、过程信息全量记录。」丁文超表示,「这绝非在真实与仿真数据中二选一就能实现。」

落地与实干:从吉尼斯纪录到产业赋能

在吉尼斯世界纪录的颁证现场,丁文超给全场观众讲了一个故事:它石团队去线束工厂调研时,正值盛夏,工人们额头上全是密密麻麻的汗水。他们在人员密集的车间,一天重复同一个动作成千上万次。那个瞬间,他记了很久。

「为什么要选择线束这个场景?一是只要有电就有线束——汽车、家电、3C,每个领域都有海量需求;二是这是一个技术门槛极高的场景,理线、插拔、装配对传统机器人难度极大,因为线是容易形变的,接口是亚毫米级的,环境是多变的;三是要把人从这种繁重、重复、单调的体力劳动中解放出来。」

吉尼斯纪录验证了 AWE3.0 的工业落地能力。据丁文超介绍,当前国内机器人产业大多仍处于基于预编程的自动化阶段,其核心是控制系统而非认知系统。具身大脑,正是连接数字智能与物理世界的关键桥梁。我国虽拥有成熟的机器人本体制造能力,但在具备自主感知、认知与决策能力的具身基础模型领域仍存在短板。攻克「具身大脑」,是机器人产业实现核心升级的必经之路。

从产业视角看,它石智航正具备补齐具身大脑短板的能力,让机器人在现实世界落地、成为能「上岗」的生产力成为可能。

工业和信息化部人形机器人标准化技术委员会副主任委员兼秘书长梁靓对此评价:「当前具身智能正从实验室验证向规模商业化跨越,迈入以落地应用为核心的新阶段。它石智航 AWE3.0 的发布,推动机器人从实验室走向真实场景,实现了从『会动』到『会想』的历史性跨越。期待以它石为代表的创新企业,加快成果转化,将技术优势转化为产业优势,为产业高质量发展贡献力量。」

从技术侧深耕底层创新,到落地侧攻克最难场景诉求,它石智航用实际行动,诠释了一家踏实的具身智能企业应有的模样。

AWE 落幕时,丁文超又去展台前站了一会儿。机器人已经关机,几个小时后,它们会被拆箱、装车、运回公司继续学习人类的真实数据,继续行走在用物理 AI 改变世界的道路上。

本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:alixiixcom@163.com