开云体育官方网站-(Kaiyun Sports)

公司新闻
NEWS

新闻中心

全球公开可查最大规模实时多人动作捕捉挑战纪录诞生

浏览次数:

  

全球公开可查最大规模实时多人动作捕捉挑战纪录诞生(图1)

  动作捕捉技术像一座看不见的“桥梁”,一头连着真实人体的每一寸肌肉律动,另一头连着数字世界里的像素。其广泛运用于动画、电影、游戏、虚拟人、机器人训练等领域。

  上海青瞳视觉科技有限公司CHINGMU(以下简称青瞳视觉),是一家聚焦于红外光学动作捕捉系统研发的企业,自主研发的工业级红外光学动作捕捉系统已应用于具身智能、数字娱乐、工程科研、教育等领域。曾助力院线电影《哪吒之魔童闹海》《雄狮少年2》《热烈》的影视工业化制作。

  5月31日,以“100人,同时进入数字世界”为主题的百人实时动作捕捉挑战暨数字动作展演,在青瞳视觉MCP无界棚举行。这是2026上海信息消费节数字内容板块的活动之一,现场,100名动捕演员在1000㎡的动捕空间内完成群体动作展演。

  公开信息显示,此前国际公开认证的实时多人动作捕捉纪录为19人,国内同类公开挑战最高规模为40余人。本次挑战首次将实时多人动捕规模推向百人级,人数提升2.3倍,创下了全球公开可查最大规模实时多人动作捕捉挑战纪录,标志着全球动捕技术正式迈入工业化百人级应用新阶段。《IT时报》记者了解到,挑战所使用的光学动作捕捉系统由青瞳视觉自主研发部署,AMD则提供高性能计算平台支持。挑战全程由上海市新虹桥公证处进行现场证据保全公证,对系统部署、设备运行、百人动捕表演的过程,以及实时数据采集与输出等环节全程见证、证据保全,并出具公证书。

  “仍然感到十分紧张。”表演结束后,职业动捕演员曦曦鱼SAKANA如是说。她拥有舞蹈演员的专业背景,进入动捕行业至今已有6年时间,常年参与各类游戏、动画项目录制。

  “单人只需简单建角色、进场即可表演;百人动捕需逐一为演员建档、匹配模型,前期筹备耗时漫长,再加上集体节目排练配合难度高,整体流程复杂度远超单人录制。”曦曦鱼向《IT时报》记者介绍了单人动捕与百人集体动捕之间的差异。

  “此前40余人的动捕仅需300平方的场地,28台400万像素的动捕相机;现在的百人挑战将场地扩展至1000平方,动捕相机数量增至76台。”青瞳视觉创始人兼CEO张海威现场分析了背后的技术难点。一方面,数据处理压力呈指数级上升。

  在百人动捕中,每位参与者身上设置了53个Marker点(动作标记点),一百人总计达5300个点位。76台光学动捕相机每帧生成约60000个二维图像数据,每秒需处理720万个二维图像点,所有数据必须在8ms的单帧窗口内完成从采集到输出的全流程,且整体端到端延迟不超过12ms。任何环节超时都会导致丢帧或卡顿。

  另一个难点是遮挡与身份识别,在密集场景下,遮挡与身份识别难度剧增。百人同场的相互遮挡会导致标记点反复丢失重现,标记点串位、骨骼漂移等错误概率随人数呈几何级增长,且纠错需与实时窗口争夺算力资源。

  此外是稳定运行上的挑战,100人的动作数据必须严格时间对齐,系统还需在高负载下连续稳定运行超1小时,对线程调度与内存管理提出极限要求。

  张海威还打了一个形象的比喻,如同人眼双目成像才能形成立体视觉,动捕系统需依托多相机点位匹配还原三维动作。数十台相机就好比数十层“迷宫”,每层都有数千个点位的岔路,层层叠加下来,点位匹配的搜索空间变得极其庞大,技术难度也大幅提升。

  用青瞳视觉内部人士的话说,此次挑战的成功,是光学动作捕捉系统、实时算法、现场工程部署与高性能计算平台协同运行的成果。青瞳视觉负责动捕系统整体设计与核心算法研发,而AMD为高并发数据处理与实时可视化提供算力支撑。

  具体来看,青瞳视觉针对百人并发场景进行专项算法重构。在三维重建、人体姿态估计等核心环节,通过场景化裁剪与算法重新设计,将关键算法处理效率提升超过300%。同时,自研大规模高并发动捕专用算法,有效解决了密集遮挡、交叉运动导致的标记点丢失与误匹配问题。此外,创新采用差异化贴点方案,优化大规模Marker识别与身份稳定策略,提升系统准备效率与个体区分能力。

  AMD提供核心算力保障,CPU和GPU“各司其职”。前者采用了64核心AMD锐龙Threadripper PRO 9985WX处理器,承担高并发线程调度、动作解算、数据重建与多角色同步等关键任务;后者采用AMD Radeon RX 9070 XT显卡,承担动捕软件CMAvatar的实时渲染任务,实现计算与渲染分层隔离。

  双方团队还通过对BIOS配置、线程调度及数据通路的协同优化,在软件侧算法效率提升的基础上,实现了系统整体性能约20%的开云体育官网提升,并显著降低运行延迟。

  比如现场100位的舞者皆来自上海电影艺术职业学院,该校AI动作编创专业负责人栾健超接受《IT时报》记者采访时表示,之所以受到教学重视,主要有两个原因:其一,数字产业转型迭代速度快,倒逼行业技术升级。传统动画靠人工后期修图,很难还原人的呼吸、肢体韵律和情感表达,而动作捕捉可以精准采集真实人体动作与情感细节,真实度优势突出。其二人体姿态模型,早期动捕设备价格高昂,只能局限在高端产业,难以普及;以青瞳视觉为代表的国内企业坚持自主研发、自主专利创新,把设备成本降了下来,让大中小企业、各类高校都有条件引进落地,也推动动捕技术和行业从业者被大众熟知。

  在栾健超看来,百人动作数据能够沉淀为珍贵数字资产,这些资产既可以供给AI、人形机器人领域的企业做训练学习使用,也能进行商业化二次创作,打造成VR沉浸式舞剧、新型观影内容,还能直接复用在游戏中制作大型NPC群演舞蹈场景,应用空间十分广阔。

  欣慰的是,进步一直在路上。在具身智能加速爆发的时代,人类动作数据正成为驱动智能系统进化的核心生产资料,而课堂里的学习、赛场中的实践、产业里的应用环环相扣,终会让这项新兴技术一步步走进大众、走向成熟。返回搜狐,查看更多

电话:

0557-8103355

邮箱:

56987742032@qq.com

地址:

安徽省宿州市砀山县周寨镇

Copyright © 2026 开云体育股份发展有限公司 版权所有    备案号:皖ICP备2025075536号