行业点评
动作捕捉或是当下人形机器人最主流的数据采集方式
数据采集方式分遥控操作、动作捕捉、大模型三类,动作捕捉能直接将人类动作迁移至人形机器人,具备精度高、数据采集全面等优势,或是当下人形机器人最合适的数据采集方式。动作捕捉系统主要为光学式、惯性式,光学式基于光学摄像头完成物体捕捉和定位,惯性式则利用惯性传感器测量物体的加速度、方向、倾角等,由于人形机器人在运动过程中涉及检测平衡、跌倒、抗扰需求,采用惯性动作捕捉更为合适。我们以特斯拉采用Movella动态捕捉训练为例,开发人员穿着动捕设备执行任务,惯性传感器捕捉记录数据,传输到平台分析,Movella积累的数据库也可供机器人开发使用,因而可以看出硬件设备、软件开发、大数据构成动捕企业的核心竞争力。目前,动作捕捉下游以电影制作、游戏开发等为主,2022年市场空间仅为58亿元,我们假设未来2-3年单个人形机器人本体企业使用1000台进行训练,1000台,则有望为动捕市场带来500亿增量空间。
动捕核心是由数据集、传感器(高精度IMU)、算法库构建的系统解决方案
我们认为三类企业有望充分受益:1、能提供整套系统解决方案;2、有大量案例和数据积累;3、核心是传感器(高精度IMU和力传感器)。相关上市公司梳理如下:(1)诺亦腾:奥飞娱乐投资的公司,与NVIDIA Isaac合作,实现了动作捕捉系统与NVIDIA Isaac Sim的数据联通,产品已用于智元机器人、千寻智能。(2)世优科技:捷成股份投资,惯导动捕已大量应用于数字人,具备丰富数据库积累,与北京大学共同成立“数字人训练联合实验室”。(3)凌云光:全资子公司元客视界推出AI动捕产品FZmotion,已经服务宇树科技、优必选、小米等客户。(4)利亚德:旗下公司虚拟动点拥有大量高品质动作数据和光学动作捕捉产品,与松延动力合作成立了“具身智能机器人联合实验室”。(5)天娱数科:通过投资银牛微电子、芯明智能布局动作捕捉硬件,构建了丰富动作库和表情库的多模态数据集,子公司智境云创与西安交通大学携手共建空间智能研究中心。
受益标的
(1)动捕系统:奥飞娱乐、捷成股份、凌云光、利亚德、天娱数科;(2)IMU:芯动联科、敏芯股份、苏州固锝。
风险提示
人形机器人数据采集发展不及预期;动作捕捉技术发展不及预期。
目录
正文
数据是人形机器人AI/具身智能与传统 AI的最大区别之一。AI三大支柱为算法、算力、数据。传统AI训练主要依靠图文,互联网为传统 AI算法训练提供了海量且廉价的图文数据。然而,具身智能需要深入地理解和交互物理世界。3D数据集能提供精确的空间信息,使机器人能够准确地感知和理解三维场景中的物体、空间关系以及动态变化。现成的3D数据有限,数据采集是机器人AI提升的关键。
数据量提升是人形机器人通用性提高的重要途径。人形机器人追求的是能够像人类一样思考、运动,精确地模仿人类动作是实现这一目标的重要路径。高质量的人类运动训练数据能提升机器人的灵活性和协调性。相比于工业机器人仅具备处理单一或有限范围问题的能力,通过精确编程实现。人形机器人面向更广泛、更多样的泛化任务。泛化能力提升需要海量的3D数据进行训练。
数据精度直接影响到机器人准确复制人类动作的能力。即使是运动数据中的微小错误,也可能导致机器人误操作或损坏,尤其是在需要精细运动技能的任务以及与人的互动过程中。
因此,大规模、高质量、低成本的数据采集是当前人形机器人发展的关键。
国内外机器人厂商争相布局数据采集:
(1)特斯拉构建动作捕捉数据采集训练场。在2023年股东大会上,特斯拉在视频中展示了通过使用动作捕捉技术“训练”机器人进一步了解真实世界中的各种场景。在数据采集过程中,穿着Xsens Link动作捕捉套装的“演员”会执行一系列任务,其全身运动数据被记录下来。
国内政策支持加快数据采集发展:
(1)国地共建具身智能机器人创新中心数据采集基地亮相。2024年12月27日,国家地方共建具身智能机器人创新中心与北京大学计算机学院联合推出大规模多构型智能机器人数据集,该数据集包含5.5万条机器人轨迹数据,涉及279项不同的任务,涵盖高达61种不同的物体,覆盖了家居、厨房、工厂、办公、零售等大部分生活服务场景。
(2)上海要求加快建设虚实融合超大型实训场。2024年12月28日,上海市人民政府办公厅印发了《关于人工智能“模塑申城”的实施方案》,明确要求“依托头部企业和科研机构,打造虚实融合的超大型实训场,建设支撑实训场的高性能计算集群、高精度三维建模和高质量训练数据集,创建与物理实体对应的高精度仿真环境和仿真训练系统,搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训。”
综上,我们认为随着人形机器人/具身智能场景增多,对低成本采集高质量数据需求逐步增多,国内政策支持,海内外巨头纷纷布局,人形机器人数据采集产业有望迎来快速发展机遇。
人形机器人数据采集方法包括遥控操作、动作捕捉和大模型三大类,而将动作捕捉与AI学习算法结合,正使得人形机器人越来越多地高精度模仿人类动作。
动作捕捉的基本原理是开发人员重复执行任务,对应他的每个动作将被动作捕捉技术仔细捕捉,远程操作过程中,人形机器人将将在开发人员旁边执行相同的操作,并通过记录的动作数据学习如何移动,因而动作捕捉采集的运动数据精度更高,才能能力更全面。
由于数据精度对人形机器人训练非常重要,它将直接影响机器人准确复制人类动作的能力,任何不准确的数据都会加剧学习的错误,导致低效或不准确的动作,因而AI利用动作捕捉创建的模型,可以使机器人可以非常准确地模仿人类的动作,并帮助机器人学习如何与周围环境互动。
动作捕捉按技术原理主要分为光学式、惯性式。(1)光学式基于光学原理完成物体捕捉和定位,通常借助整套光学摄像头完成动作捕捉。(2)惯性动作捕捉:利用惯性传感器测量被测物体的加速度、方向、倾斜角度等。人形机器人在运动过程中,更多涉及检测平衡、跌倒、抗扰的需求,因而采用惯性动作捕捉可实现更精准的数据采集。
我们以特斯拉采用Movella动态捕捉进行训练为例。开发人员穿着Movella的Xsens动作捕捉套装执行一系列任务,此时惯性传感器会实施捕捉并记录人体运动及数据,这些数据可以在Movella自主研发的软件中实时体现,并可以同步到其他平台,此时可获得全面的运动数据,包括角速度、重心关节角度以及各部位的运动速度和加速度,为进一步的开发和应用提供可能。此外,Movella积累的强大数据库也可以直接为特斯拉提供训练数据,供机器人开发使用。
因此,动态捕捉企业除拥有传感器、整套动捕装备研发生产能力外,在软件SDK开发,以及大数据的积累也是企业的核心能力。
动态捕捉目前的下游包括电影制作、游戏开发、医疗健康、教育培训等,中研网数据显示2022年动态捕捉市场规模为58亿元。
我们参考特斯拉计划在2025年实现千台级别的量产,并且将在2026年开始对外销售,智元机器人已下线超900台,假设2027年单个人形机器人本体企业量产1000台,每台进行1对1动作捕捉训练,则单家机器人头部企业将采购1000套动态捕捉设备,按照单台设备价值量50万元,采购企业数量100家计算,则人形机器人有望为动态捕捉市场带来500亿空间,较2022年实现近10倍空间扩容。
全球动作捕捉系统市场代表形成了以Movella为代表的国际知名厂商,其在技术研发、产品性能、数据整合的方面具备显著优势,占据市场主导地位。国内也逐步涌现以诺亦腾、世优科技、凌云光、利亚德、天娱数科等一批具备竞争力的3D动作捕捉系统企业,这些企业通过自主研发和技术创新,不断提升产品性能和市场竞争力,逐渐在国际市场上崭露头角。
(1)Movella
公司成立于2009年,是全球领先的硬件(传感器等)、软件和数据分析解决方案供应商,专注于通过感知、捕捉和分析运动数据,为娱乐、健康、工业、体育等行业提供服务,先后与Electronic Arts、Epic Games、Netflix、丰田、西门子等全球领先企业建立合作。旗下的Xsens为惯性动捕的“开山鼻祖”。
公司以MEMS硬件起家,通过收购软件算法公司Xsens(动作捕捉系统)和Kinduct (运动分析管理平台),打通运动监测、捕捉、数据分析全链条,系统性优势突出。
监测:惯性路线的动作捕捉方案能不受环境光线与空间距离的限制,精确捕捉人体的各种精细动作。该路线核心硬件包括MEMS传感器。公司的MEMS技术团队具有丰富的半导体研发经验、深入的机械物理属性理解、强大的软件开发能力,是稀缺的全能队伍。
捕捉: Xsens具备同步读取几百个MEMS传感器,整合数据并形成人类动作姿态的算法能力。强大算法有助于收集高质量的动作数据。其他多数企业即使能提供集成大量MEMS传感器、全面监测运动的动作捕捉方案,也难以协同处理MEMS传感器形成有效的人类姿态数据,只具备机械姿态算法(只能刻画局部的动作,数据质量低)。
数据分析:凭借精确的数据获取能力,公司能创建逼真的动作模拟视频,将运动数据转化为提升运动能力的方案。公司客户包括NBA球星、国际足联等。通过为运动员服务,公司已积累大量运动健将的身体和动作数据,其对人形机器人理解和学习人的行为有很大的好处。
特斯拉等众多人形机器人本体厂均为公司的客户。我们认为公司为特斯拉提供了动作捕捉服、SDK、数据及高效的训练方法,有望助特斯拉动作模型迅速突破。
(2)诺亦腾
奥飞娱乐是国内最具实力和发展潜力的动漫及娱乐文化产业集团公司之一,奥飞娱乐在动作捕捉领域的布局主要为其对诺亦腾公司的投资。诺亦腾构建了从开发平台到处置应用的一揽子解决方案能力。
硬件技术方面,公司开发了Perception Neuron系列动作捕捉产品,并推出VTS虚拟直播套装、Hi5 2.0 VR交互首套、VPS虚拟制作解决方案等。
数据整合与算法方面,诺亦腾与NVIDIA Isaac合作,实现了动作捕捉系统与NVIDIA Isaac Sim的数据联通,推动了动作捕捉技术在机器人领域的应用。同时,公司提供动作捕捉技术研发和专业动作捕捉系统定制,可在最大1000平米范围内有效捕捉各种大动态高难度运动以及精确的手指动作捕捉服务,公司产品已用于智元机器人、千寻智能。
(3)世优科技
世优科技是一家基于惯性动捕技术的实时动画制作公司,主要以技术输出的方式为内容生产商提供软硬一体的综合解决方案。
硬件技术层面,包括动捕服UCM-2 Pro、面捕头盔UC Face和数据手套UC Glove等,综合解决方案售价从200万到10万元不等。
此外,公司具备丰富数据库积累,可以训练模型,并在制作数字人时可直接调用。
2024年,世优科技与北京大学共同成立“数字人训练联合实验室”,为北京大学生物力学、人体工程学提供动作捕捉采集、系统算法、积累原始数据等,进一步提升公司在数字人领域的技术实力和竞争力。
(4)凌云光
凌云光全资子公司元客视界推出的AI动捕产品FZmotion,可对目标物体进行空间定位与空间计算,以精准捕捉目标物体的位置姿态与运动轨迹,并基于采集的数据进行模拟仿真,可广泛应用于机器人、无人机、无人车等具身智能产品的研发与训练,以优化任务策略和控制算法,实现具身智能的精密控制和任务执行。
该产品解决方案已经服务宇树科技、优必选、小米等重要客户具身智能产品的研发与训练等业务场景。
(5)利亚德
利亚德旗下公司虚拟动点在动作捕捉领域具有深厚积累,包括拥有大量高品质动作数据和光学动作捕捉产品。
硬件技术方面,公司光学动作捕捉已用于AI眼镜的定位、3D手势追踪等的精度验证及评测,并且已为国内外多家AR/VR眼镜厂商提供产品。
数据与算法层面,公司积累的大量高品质动作数据,持续推出包括OptiTrack光学定位算法、LydCap无标记点识别算法以及LYDIA动作大模型在内的先进技术。
2024年12月25日,利亚德全资子公司虚拟动点成功举办“当‘空间计算’遇上‘具身智能’”为主题的技术成果发布日活动,虚拟动点与松延动力合作成立了“具身智能机器人联合实验室”,旨在共同建造机器人工作数据库、优化FLAME算法以及探索机器人商业化应用场景。
(6)天娱数科
天娱数科是以电竞游戏和数据流量为主营业务的数字科技公司,其在动作捕捉领域的布局主要在以下层面:
硬件技术方面,天娱数科通过投资银牛微电子(3D双目立体视觉、多传感器融合视觉AI芯片)和芯明智能(空间计算芯片)布局动作捕捉领域,上述均在人形机器人、元宇宙、AMR/AGV等泛机器人领域有所应用
数据与算法层面,天娱数科构建了包含丰富动作库和表情库的多模态数据集,并掌握动态AI算法,能够一键生成虚拟形象独有的表情与肢体动作库。
2024年11月26日,天娱数科子公司智境云创与西安交通大学空间视觉联合实验室签署合作协议,携手共建空间智能研究中心。双方将利用自身技术和团队优势,合作开展空间智能、具身智能等相关领域关键技术研究。
低成本高质量数据采集是目前人形机器人需重点关注的问题,特斯拉、智元等国内外机器人厂商争相布局,国内政策支持下,人形机器人数据采集产业有望迎来快速发展机遇,其中动作捕捉方式技术成熟、精度高、定位精准,或是当下最合适的数据采集方式,动作捕捉行业有望迎来快速发展机遇。
受益标的
(1)动捕系统:奥飞娱乐、捷成股份、凌云光、利亚德、天娱数科;