细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

MultiGO团队 投稿

量子位 | 公众号 QbitAI

从人体单图变身高保真3D模型,不知道伤害了多少程序猿头发的行业难题,竟然被港科广团队一招破解了!

今日霍州(www.jrhz.info)©️

团队最新提出的MultiGO创新方案,借助分层建模思路——将人体分解为不同精度层级,从基础体型到衣物褶皱逐级细化。

今日霍州(www.jrhz.info)©️

这有点像在搭『乐高积木』:先大模块构建整体轮廓,再用小零件补充细节,最后再处理材质纹理。

今日霍州(www.jrhz.info)©️

相关研究成果目前已入选CVPR 2025,项目代码也在加紧开源的路上。

今日霍州(www.jrhz.info)©️

更多详情,让我们接着继续看~

技术改进路在何方?传统方法的瓶颈

基于单目图像的三维人体重建存在固有深度歧义性,现有方法通常依赖SMPL-X等人体轮廓的预训练模板提供几何先验,但依然难以捕捉细节特征和特定解剖学结构。

这些方法往往聚焦于人体整体几何建模,而忽视了多层次结构(如骨骼、关节,以及手指、面部等部位的细密皱纹)。这种过度简化的建模方式导致骨骼重建不准确、关节位置偏差,以及衣物皱纹等细节模糊不清。

MultiGO创新框架

该研究提出三级几何学习框架实现突破:

  1. 骨架增强模块:通过将3D傅里叶特征投影到2D空间,结合SMPL-X人体网格作为几何先验,增强人体骨架建模。傅里叶空间位置编码提升了3D模型与2D图像的语义对齐能力。

  2. 关节增强策略:在训练时对关节点位置施加扰动,提升模型对深度估计误差的鲁棒性。通过重点调整影响深度感知的参数,使模型能更好适应实际观测中的结构偏差。

  3. 皱纹优化模块:采用类似扩散模型去噪的方法,将表面皱纹视为可优化的噪声模式。从粗糙的人体网格中,恢复出更精细化的高频细节。

今日霍州(www.jrhz.info)©️

MultiGO技术解剖

MultiGO方法的核心在于通过多层次几何学习框架全面提升单目纹理3D人体重建的质量。该方法基于现有物体高斯重建预训练模型,针对人体几何的不同粒度层级(骨骼、关节、皱纹)设计了协同优化的三重机制:

  • 骨骼层级:骨架增强模块通过将3D傅里叶特征投影到输入图像一致的2D空间,使高斯重建模型能够充分融合先验的人体形态知识,从而精准捕捉人体姿态特征。这种特征投影机制有效解决了单目视角下3D结构信息缺失的问题。

今日霍州(www.jrhz.info)©️

  • 关节层级:关节增强策略在训练阶段对真实的SMPL(X)模型的关节参数进行扰动。通过模拟深度不确定性,增强模型对推理过程中关节深度误差的鲁棒性。这种数据增强方式使模型能够学习更稳定的关节空间关系,避免因深度歧义导致的肢体位置重建不准。

今日霍州(www.jrhz.info)©️

  • 微观几何细节层面:皱纹优化模块创新性地借鉴扩散理论思想。该模块将粗糙网格视为高斯噪声,而以重建的高质量高斯纹理作为条件输入,通过类似扩散模型去噪的过程逐步优化皱纹等细微几何特征。这种纹理引导的细化机制实现了亚毫米级表面细节的生成,弥补了传统方法在衣物褶皱等高频细节上的不足。

今日霍州(www.jrhz.info)©️

三个层级模块并非孤立运作,而是形成从宏观姿态到微观特征的递进式优化链条:骨架增强模块建立的准确骨骼框架为关节定位提供基础,关节增强策略稳定的关节预测又为皱纹细化创造了低噪声的几何环境。整个框架通过端到端训练实现多层次几何信号的联合优化,最终输出兼具准确拓扑结构和丰富表面细节的高保真3D人体模型。

效果show time

所提出的多层级几何学习框架在CustomHumanTHuman3.0两个测试集上实现了最先进的性能表现,在人体几何重建任务中显著优于其他现有技术:

在CustomHuman数据集上,倒角距离(CD)提升0.180/0.406,法向一致性(NC)提高0.034,f-score增加6.277;在THuman3.0数据集上,CD指标提升0.355/0.369,NC提高0.047,f-score大幅提升9.861。

这种性能突破源于我们提出的创新性解决方案——通过三级分层建模策略(而非传统单一层次建模)精细化处理人体几何特征,从多层次协同优化人体重建效果,从而实现了更精准的几何细节复原。

今日霍州(www.jrhz.info)©️

多场景应用

MultiGO的分层高斯建模技术通过将人体分解为不同精度层级(从基础体型到衣物褶皱和材质纹理逐级细化),并利用高斯溅射点作为3D基元实现高效、高保真的单图重建,使其在虚拟试衣与时尚电商(实时生成可动态调整的3D人体与服装模型)、游戏与元宇宙(快速创建个性化虚拟角色并支持细节编辑)以及影视特效(高精度动态人体重建与后期分层调整)等领域具有突出优势,尤其适合需要快速生成且对真实感和多尺度细节还原要求高的应用场景。

虚拟试衣与时尚电商

消费者上传一张全身照片即可生成高保真3D人体模型,系统能自动模拟不同服装的穿着效果(包括衣物褶皱和材质细节),支持360度查看,提升在线购物体验。结合分层建模能力,可区分用户体型(基础层)与服装细节(精细层),实现动态布料仿真。

游戏与元宇宙角色生成

通过单张照片快速创建个性化的3D虚拟形象,分层结构支持灵活调整(如更换发型、配饰等)。高斯溅射点的特性可保留皮肤纹理和光影细节,增强虚拟角色的真实感。适用于社交元宇宙、NPC批量生成等场景,显著降低美术资源生产成本。

影视特效与虚拟制作

在特效制作中,仅需演员的单视角照片即可重建高精度3D模型,用于动作捕捉或替身合成。分层设计允许后期单独编辑特定层级(如调整肌肉线条或添加伤痕特效)。结合动态高斯溅射点技术,可进一步实现毛发、湿润皮肤等细微效果的实时渲染。

论文链接:https://arxiv.org/pdf/2412.03103

项目链接:https://multigohuman.github.io/

特别声明:[细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

韩版2025冬季新款短款平湖羽绒服女士连帽宽松面包服大码90鸭绒,选它是否真抗寒?(韩版冬季搭配)

想知道2025年的冬季新款韩版平湖女士羽绒服,是否适合追求时尚又注重保暖的大码女性♀️?本篇文章为您揭开真相。我们将深度解析这款女士羽绒服的设计亮点,保暖性和舒适性,并探讨它在不同场景中的适用性,帮助您找到最适合自己的保暖装备。同时,还将分析市

韩版2025冬季新款短款平湖羽绒服女士连帽宽松面包服大码90鸭绒,选它是否真抗寒?(韩版冬季搭配)

零下二十度又怎样?倔强要出片的女孩,从来都不怕冷!(零下二十度以下什么意思)

毕竟为了这组雪地辣妹照,我提前一周就开始刷小红书找参考,还特意买了这套皮草抹胸 + 皮裙套装,主打一个 “美丽冻人”。 最搞笑的是,拍着拍着我鼻子开始流鼻涕,我赶紧用手套🧤擦,结果手套🧤上的毛粘了一脸鼻涕,摄影…

零下二十度又怎样?倔强要出片的女孩,从来都不怕冷!(零下二十度以下什么意思)

机械行业燃气轮机:全球产能趋紧,国产供应链抢占AIDC景气红利(燃气轮机做什么的)

在全球人工智能『数据中心』(AIDC)迅猛扩张的背景下,燃气轮机作为高效、灵活、可靠的中短期供电解决方案,正迎来新一轮高景气周期。随着国产替代加速及海外订单放量,相关企业有望在本轮全球燃机景气周期中显著受益,业绩…

机械行业燃气轮机:全球产能趋紧,国产供应链抢占AIDC景气红利(燃气轮机做什么的)

『谢娜』静音悼念魏文彬!网友:原来我们的童年快乐,都有这大佬撑腰(『谢娜』主持的唱歌节目音痴)

今天『娱乐圈』️最大的一次破防,不是流量塌房,也不是哪档综艺上新,而是咱们的快乐显眼包天花板『谢娜』,居然罕见地静音营业——她默默转发了魏文彬先生的讣告,用最朴素的方式悼念这位藏在我们童年笑声背后的快乐批发商。网友们的…

『谢娜』静音悼念魏文彬!网友:原来我们的童年快乐,都有这大佬撑腰(『谢娜』主持的唱歌节目音痴)

养子女无赡养义务?非法拘禁如何界定?追《人之初》解案件谜团(子女无赡养能力)

热播剧《人之初》以一桩深埋20年的迷案为开端,讲述了苦苦寻亲的高风与富家女吴飞飞联手解开穿越两个时空的惊人秘密的故事。此处的利害关系人,包括被申请宣告失踪或宣告死亡人的配偶、父母、子女、兄弟姐妹、祖父母、外…

养子女无赡养义务?非法拘禁如何界定?追《<strong>人之初</strong>》解案件谜团(子女无赡养能力)