昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题(升腾架构)

随着以 Sora 为代表的视频生成模型技术的演进,长视频生成领域在维持长时序内容一致性以及平衡生成质量与计算资源效率方面面临挑战。浙江大学 鲲鹏昇腾科教创新卓越中心计算机学院研究员朱霖潮团队基于此课题持续深耕并取得重要进展。依托昇腾AI基础软硬件平台,该团队提出的技术方案有效提升了长视频内容一致性,同时显著优化了视频生成过程中的计算效率。

针对长序列视觉指令生成的核心技术难题,项目团队成功研发首个无需训练的长序列视觉指令生成框架LIGER,实现了历史提示和视觉记忆机制,以及基于DDIM反演的记忆校准技术。依托昇腾的编码加速能力,通过对每个步骤的图像特征进行采样和存储,捕捉前序步骤中的关键视觉信息,并将其注入到自注意力机制中,确保步骤间的视觉连贯性。同时,通过自反思机制纠正图像中的属性错误、逻辑错误、对象冗余和身份不一致等问题,使用多种图像编辑工具进行精确修正。该系统在长序列任务中展现出优异的逻辑连贯性和对象属性准确性,显著提升了视觉指令的理解性和实用性。

在计算效率方面,项目团队提出了基于昇腾平台优化的引导式渐进蒸馏方法,通过在线教师引导、渐进式蒸馏和高频细节保护三项关键技术,成功加速了视频扩散模型的生成过程。该方法让教师模型实时优化学生模型的中间预测以创建自适应训练目标,通过多阶段训练逐步增加步长将复杂轨迹学习分解为可管理的任务,并引入频域损失函数保持视频精细细节。在保持视频高质量输出基础上,该方法实现8倍加速。

该项目创新性地将『大语言模型』推理能力与视频生成技术相结合,为多模态交互研究开辟了新方向。目前,研究成果已成功入选人工智能顶级会议ICLR 2025,获得国际学术界的高度认可。项目构建的包含569个任务的评估数据集,为后续研究提供了重要基准。

未来,浙江大学 鲲鹏昇腾科教创新卓越中心将依托昇腾AI基础软硬件平台,持续深化产学研协同创新,着力突破多模态生成技术的核心瓶颈,构建自主创新、技术领先的多模态生成技术生态体系,并为国家人工智能战略与数字经济发展储备核心创新力量。

今日霍州(www.jrhz.info)©️

特别声明:[昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题(升腾架构)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

“性商教母”被封,这年头总有群魔出来乱舞

其实关于黑白颠性商学院周媛的课程,早两年就在网络上传得沸沸扬扬了。 性商课程被众多女性♀️称为“撩汉术”,是在媚男,是在雌竞,这是不为那些雄竞者所忍的,就跟不能忍曲曲大女人的名媛培训课程一样,只不过名媛培训比性…

“性商教母”被封,这年头总有群魔出来乱舞

曾隐秘恋爱8年,宋智孝抛出猛料!刘在石都惊到:保密工作太好

向来以直爽、不拘小节的个性著称的韩国女星宋智孝,最近在综艺节目《RunningMan》中爆出了一个令人震惊的消息,让人们对她的感情状况有了全新的认知。即便在《Running Man》这类综艺节目中,尽管她曾…

曾隐秘恋爱8年,宋智孝抛出猛料!刘在石都惊到:保密工作太好

完成4.5亿元融资!甬产人形『机器人』️再次“出圈”(融资144亿)

浙江人形成立于2023年12月,以首席科学家、浙江大学教授熊蓉为核心的团队与多家知名产业伙伴共同创立,总部位于宁波市海曙区,正助力宁波打造以人形『机器人』️为引领的全国具身智能创新高地。 公司的人形『机器人』️,已在华…

完成4.5亿元融资!甬产人形『机器人』️再次“出圈”(融资144亿)

长河落日》最狠伏笔:武木的画像,从不是给叶碧莹的情书(《长河落日》多少集)

作为被唤醒的松特工,他比谁都明白, 在使命面前没有儿女情长,画像的存在,是他给自己人性的最后一点体面。武木的“舍”,不是什么深情,而是特工的职业本能,就像叶家满门忠烈, 从叶德公到叶碧莹,牺牲都是既定的命…

《<strong>长河落日</strong>》最狠伏笔:武木的画像,从不是给叶碧莹的情书(《<strong>长河落日</strong>》多少集)

自动发热护膝超薄男士,2026年冬天如何选更贴心?(自动发热护膝超标怎么办)

冬季保暖,超薄护膝已成为许多男士的新选择。自动发热护膝有哪些独特之处?如何挑选最适合自己的一款?本文详细分析了超薄男士自动发热护膝的关键选购要点,并给出专业建议。帮你找到适合的防护方式。

自动发热护膝超薄男士,2026年冬天如何选更贴心?(自动发热护膝超标怎么办)