媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

2024-06-07 09:54:03

导读 6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项...

6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频，支持多种宽高比，还能模拟物理世界的特性，精准建模复杂运动。

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成，分辨率高达1080p。

支持多种宽高比，包括竖版视频，非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动，如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性，如重力、液体流动和光学反射等，生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育，可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动，如公路上高速奔跑的老虎，画面连贯，动作协调，甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性，比如倒牛奶时的重力规律和液面上升，以及光学上的反射规律。此外，「可灵」还能真实反映与真实物理世界的交互，如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词：

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑，低角度镜头展现了月球的广阔背景，动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构，用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩，提高重建质量和训练性能。

3D Attention机制用于时空建模，提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系，对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述，提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量，后期高分辨率阶段侧重质量，确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测，当前版本支持生成720P视频，竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照，生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速，与多个高校或科研机构合作发布了多项关键技术，为「可灵」大模型积累了深厚的技术沉淀。现在，快手的文生视频功能已正式亮相，期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户，可以在快影APP中体验「可灵」大模型的功能。

官网地址：https://top.aibase.com/tool/kelingdamoxing

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:公募大力布局增强指数型基金

下一篇:最后一页

猜你喜欢

摩根士丹利财富管理CIO：美股下半年将进一步上涨

OpenAI开源GPT-4 SAE，提供1600万个解释模式

沙特阿美股票发售计划吸引强劲海外需求，西方、亚洲投资者兴趣皆浓

抖音发布高考期间户外直播规范禁止户外直播干扰考场秩序

马斯克祝贺！星舰第四飞没让人失望为何说这次创造奇迹：官方给答案

美国第二大非上市公司科氏工业改名，以反映业务多元化

汽车产业链公司扎堆赴港上市

餐厅倒闭老板留下6只企鹅跑路：最终安全回到海洋馆

高考期间最累的人其实是张韶涵网友：有太多励志歌曲

实探白酒市场：端午临近中高端白酒动销良好

德国第一季度约60%的电力来自可再生能源

协会：5月销售各类挖掘机17824台，同比增长6.04%

最新文章

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

穹窿山多少米高穹窿山

高老头读后感500字左右高老头

上海迪士尼年卡调整：星光宝石卡将停售，上新更低价奇梦翡翠卡

自什么自什么的词语有什么四字词语自什么自什么的词语

圆中画正方形怎么求正方形的面积怎么求正方形的面积

非诚勿扰李盟盟牵手完整版非诚勿扰李盟盟牵手是哪一期

爽肤水和化妆水一样吗爽肤水是干什么用的

三位数除以两位数的方法技巧两位数相乘的简便方法

word文档不能编辑怎么办不知道密码（word文档不能编辑怎么办）

手机如何拍照识字手机拍照识别文字的方法

再游桃花源停顿划分再游桃花源

枣子一般蒸多久（枣子蒸熟需要多少时间）

比如县人口比如县

八卦阵中八卦棍八卦棍是谁创造的

大学生义工旅行公众号是真的假的大学生义工旅行靠谱吗

abcc式的词语一年级 abcc式的词

大连少儿图书馆电话号码（大连少儿图书馆）

关于“高考加油”的惊艳祝福金榜题名，梦想成真

财政收入是什么意思财政收入

综合头条

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

本周【综合头条】阅读排行

本周热门推荐阅读

该隐 gain 该隐在哪

腰伤了针灸有效果吗腰伤

核心期刊发表需要多久（...

浙江发现一例稀有“恐龙...

记者：不想过多指责国足...

星期三用英语怎么说wedne...

2021政法干警考试条件 ...

郑州市商务局地址（郑州...

八月初八结婚好不好八...

茴香菜的功效与作用图片...

幽州烽火台（幽幽烽火）

杠铃窄距卧推（窄距卧推）

广东小吃有哪些? 广东小...

404notfound什么意思 no...

刮阴毛

综合头条

媲美Sora？快手文生视频模型可灵开放测试 更懂物理，最长可生成2分钟视频

猜你喜欢

最新文章

本周【综合头条】阅读排行

本周热门推荐阅读

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频