腾讯开源人像照片生成视频模型V-Express

2024-06-07 12:02:05

导读站长之家（ChinaZ.com）6月7日消息:腾讯公司开源了一款创新的模型V-Express，它能够使用人像照片生成视频。这一技术通过一系列逐步丢弃的...

站长之家（ChinaZ.com）6月7日消息:腾讯公司开源了一款创新的模型V-Express，它能够使用人像照片生成视频。这一技术通过一系列逐步丢弃的操作来平衡不同控制信号，使得音频等较弱的信号得以有效利用，实现对姿态、输入图像和音频的综合控制。

作者团队表示，在会说话的人脸生成任务中，当目标视频与参考角色不是同一个人时，选择与参考人脸姿势更相似的目标视频将能获得更好的效果。目前，该模型在英语上的表现较为出色，但对其他语言的适应性和表现尚未经过详细测试。

V-Express模型的开源，为肖像视频生成领域带来了新的发展机遇。在这一领域，使用单个图像生成视频的方法正变得日益流行。这通常涉及到使用生成模型增强适配器来实现受控生成，其中控制信号可能包括文本、音频、图像参考、姿势、深度图等。V-Express通过渐进式的丢弃操作，解决了弱信号在强信号干扰下难以发挥作用的问题，尤其是在音频信号常常被姿势和原始图像等强信号掩盖的情况下。

实验结果显示，V-Express能够有效生成受音频控制的肖像视频，这在以往的研究中是一个难以实现的突破。V-Express方法的逐步丢弃操作，不仅有效实现了对弱条件的控制，而且为多条件生成提供了新的可能性和思路。

V-Express模型为肖像视频生成领域带来了创新的思路和方法，通过平衡不同强度的控制信号，成功实现了受音频控制的视频生成。这一成果不仅具有重要的理论和实践意义，而且为未来的多条件生成提供了新的路径。腾讯表示，将继续深入研究V-Express方法，并探索其在更广泛领域的应用，以促进肖像视频生成领域的进一步发展。

项目地址:https://top.aibase.com/tool/v-express

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:30年期超长期特别国债第一次续发行，发行总额450亿元

下一篇:最后一页

综合头条

腾讯开源人像照片生成视频模型V-Express

本周【综合头条】阅读排行

本周热门推荐阅读

心得安是什么药?有副作用...

民警:985211清华北大的家...

雷神3插曲花了多少钱雷...

小白菜奇案演员表介绍全...

直击北京高考试卷押运过...

马子墨这个名字怎么样马子

民警:985211清华北大的家...

天下黄河九十九道湾石占...

银行卡分类一类二类三类...

车辆离合器片多久更换 ...

三生三世夜华是谁扮演的...

30年期超长期特别国债第...

孕妇梦见从高处掉下来 ...

pm2.5标准限值（pm2 5标准值）

九阳电磁炉e4最简单的处...

综合头条

腾讯开源人像照片生成视频模型V-Express

猜你喜欢

最新文章

本周【综合头条】阅读排行

本周热门推荐阅读