谷歌新技术可用AI模型为无声视频配音
2024-06-19 09:20:04
导读 谷歌DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的video-to-audio技术。当前 DeepMind 这款 AI 模型依然存在局限性,需...
谷歌DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的“video-to-audio”技术。
当前 DeepMind 这款 AI 模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。
据悉,该模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。
DeepMind 同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。
免责声明:本文由用户上传,如有侵权请联系删除!
标签:
猜你喜欢
- 首笔科技创新再贷款已发放,32万家企业参与第二批遴选
- 券商板块迎政策催化;工信部推动智能网联汽车高质量发展丨明日主题前瞻
- 每天四五百万份订单从中国发货,直播跨境购物在越南爆发
- 成人积食的迅速缓解方法:如何快速消除积食不适
- 上海莱士易主,海尔集团125亿元并购完成交割
- 华侨城一季度累计接待游客3300万人次,北京玛雅海滩水公园开业
- 江苏张家港一企业厂房发生火情 致2名员工死亡
- 提前还贷又现升温迹象,存量房贷利率能否下调引关注
- “债牛”行情下锁定盈利,年内超千款理财提前终止
- 5天4板杰美特:公司未布局AI手机的研发与生产
- 宏图计划前两篇章还没实现,马斯克又要画新“大饼”了?
- 台积电:南京公司已获美国商务部核发“经认证终端用户”授权
最新文章
- 谷歌新技术可用AI模型为无声视频配音
- 三相五线制 三相五线
- 思归的意思 思归
- 亲子鉴定原理是什么 亲子鉴定原理
- 湛江师范学院是一本吗(湛江师范学院)
- 春季高考有什么弊端吗 春季高考有前途吗
- 风向标英语八下答案(风向标英语)
- 财联社6月19日电,国内商品期市开盘多数上涨,LPG、锰硅、燃油、沪铅涨超2%。跌幅方面,纯碱、沪镍跌超1%。
- exeed是什品牌车怎么样 exeed是什品牌车
- 上海动物园地铁几号线最近 上海动物园坐地铁几号线
- 财联社6月19日电,富时中国A50指数期货在上一交易日夜盘收涨0.16%的基础上低开,现涨0.15%。
- 苏泊尔电磁炉e7是什么故障 电磁炉e7是什么故障
- 国铁南宁局对部分路段启动防洪Ⅲ级应急响应
- 福特麦柯斯空调滤芯在什么地方(福特麦柯斯)
- ps油漆桶快捷键上色 ps油漆桶快捷键
- 福建上杭山体滑坡一寺庙倒塌 村民:一家6口为躲雨被埋失联 正在搜救中
- 天源环保副总裁汤正云:环保实践助力美丽中国建设
- 内蒙古歌手乌云嘎 内蒙古歌手
- 参观长城的英文 参观的英文
- 大V吐槽外卖不给送上楼 外卖小哥:别人都允许放楼下 偏偏你要求送上去