AI落地在快手正在加速——快手二季报读后感
快手昨天发布了2024年第二季报:营业收入同比增长11.7%,调整后净利润同比增长73.7%;二者均大幅超过了市场一致预期。快手的MAU(月活用户)、DAU(日活用户)和用户时长仍在增长,无论是用户数据还是营收利润数据——相信这都是一份让资本市场无可指摘的财报。。
不过,相比单纯的财务数字,我最关心的是生成式AI的表现,它将决定包括快手在内的一切互联网内容平台的未来。我加入了好几个AIGC交流群,其成员基本全是AIGC技术或产品方向的从业者,要么就职于互联网大厂,要么在自己创业。自从今年6月以来,“可灵”就成为了这几个群里最热门的关键词之一。试按照时间顺序摘录一下:
6月7日:“快手可灵开放测试了!”“这么牛?”“牛!”(这样的队形大约保持了十几楼)“唯一的缺憾是不能图生视频。”(这个遗憾很快被补上了)
6月27日:“求认识可灵的同学,有没有商用API?我们这边有大量需求。”(可惜当时没有,提问的人还很失望)
7月14日:“我全程使用可灵做了一个动画故事,感觉把概念动画全部交给可灵,是很可行的。”(发言者为国内某头部游戏美术)“大佬威武!”(群友的回复)
8月6日:“可灵不仅是国内目前效果最好的文生/图生视频大模型,而且是唯一真正成熟的,其他都是半成品,没法比较。”(请注意,此时离可灵发布已经过去两个月了)
时至今日,可灵仍然是全球范围内少有的效果领先且真正具备实用价值的视频生成大模型。作为一个还算成功的视频创作者,我虽然还没有全面拥抱AIGC,但一直在关注其进展。就在昨天下午,我还用可灵生成了一段猫咪在纸箱里玩耍的视频,并与自家猫咪的真实视频进行了对比。对我而言,目前可灵最大的缺憾是单次只能生成10秒视频,当然,对于分镜拆分已经非常专业的那部分作者来说,单次10S长度已经可以满足需求;但对现阶段的我来说,如果可灵未来的升级可以支持单次生成更长的视频,想必届时我会非常乐意依赖AI进行日常视频创作。
任何稍有视频创作经验的人,应该都能意识到可灵这样的AIGC工具的革命性意义。视频创作的两大基础是文案和素材,基本创作流程就是先撰写文案,再在此基础上实拍或寻找素材。要把素材和文案天衣无缝地结合起来,真是一个高难度任务!各大视频平台都会向创作者提供庞大的素材库,但那是远远不够的。那些“机构化”创作者(例如MCN)固然可以砸钱拍摄或采购更高质量、更贴合文案的素材,可是广大PUGC创作者怎么办呢?他们才是短视频平台的创作主力军,离开了他们,任何平台的内容生态都会变成无源之水、无本之木。
从这个角度看,可灵这个AI工具与快手这个平台还真是绝配:快手一贯以用户和内容的“全覆盖”著称,其slogan是“拥抱每一种生活”。数以百万计、身份背景各异的老铁们的奇思妙想,是快手内容生态的灵魂。过去多年,一批又一批的全网热梗都是起源于快手老铁UGC的灵光一闪,然后才被其他平台拼命仿效,从而“出圈”。作为国内最早的短视频平台之一,快手曾经把视频创作的渠道或曰发言权“下放”到了千千万万的创作者手中;现在,它又通过可灵,把高效的视频创作工具“下放”到了千千万万的普通人手中。
我相信,对于那些不以快手为主要发布平台的视频创作者而言,过去两个月的一个常规操作就是:下载快影(快手官方的视频创作工具),申请可灵测试资格,然后体验与可灵深度融合的快影创作工具。当然,现在可灵推出了Web版,可以直接使用了,但与快影结合使用的效果还是更好一些。经过一段时间的体验,他们当中肯定会有人严肃考虑,要不要把快手作为自己的创作主阵地之一。就拿我自己来说,虽然在快手进行创作至今已有三年,可是在试用可灵之前,它只是我发布内容的众多平台之一;而在试用可灵之后,它在我心目中的地位日益重要,或许会成为最重要的发布平台。这就是AIGC对快手内容生态的扩充作用的一个缩影!这种扩充是全面的、持续的,其影响才刚刚体现出来。
上面说的都是内容创作层面。其实,AIGC的革命性影响,更多地体现在商业化层面。这一点,在AIGC风潮的发源地——硅谷,已经得到了充分体现。例如,在刚刚发布的二季报当中,谷歌骄傲地宣称:Verizon(北美最大的电信运营商)与YouTube创作者的“AI共创视频”,可以针对不同观众显示不同长度、不同侧重的广告视频;在这一系列视频中,Verizon的成本(CPA)比平时降低了15%,转化率提升了38%。谷歌和Meta (Facebook)的管理层都乐观地认为,在生成式AI彻底成熟之后,广告主可能只需要向平台提供宣传目标和预算,由AI去完成从创意到执行的整个过程。这一天离我们应该不会太遥远!
快手的二季报也对“AI助推商业化”这个主题进行了浓墨重彩的描述:“我们的AI矩阵已经无缝嵌入多个业务场景,支持内容创作、内容推荐与理解和用户互动。在2024年6月,来自营销客户的AIGC营销素材日均消耗达2000万元人民币。”而在财报电话会议上,快手CEO程一笑进一步指出,“我们更加关注大模型在商业化场景的应用。基于快意大模型构建的视频和直播脚本生成、广告线索客服,叠加数字人技术,助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。”
程一笑已经描述的很清楚了:快意(基础大语言模型)、可图(图片生成模型)、可灵(视频生成模型),共同构成了覆盖整个广告创作流程的一体化AIGC解决方案。商家可以用快意生成文案,在此基础上用可图生成图片,再用可灵完成图生视频的任务——这种一体化的生成路径,会让最后产生的内容具备更强的延续性、更符合预期。这还不算完,在内容分发环节,无论是普通内容还是广告这样的商业化内容,都可以得到推荐大模型的赋能,让推荐结果更符合用户的口味;对于商家而言,这就意味着更高的广告转化率!
看到了吗?谷歌和Meta提出的“广告主只需要提供目标和预算,由AI去完成整个过程”,这个理念在快手已经初具规模、开始落地了。如果广告主发现快手的“AI一体化解决方案”能够带来更低的成本和更高的效率,他们必然会更倾向于在快手投放,乃至将整体业务向快手平台靠拢。迄今为止,当我们讨论快手对品牌和商家有何独特价值时,提到最多的往往是“公私域结合”的流量分配机制,对各层级用户(尤其是下沉市场)的全覆盖,以及内容调性的多元化,等等。从今往后,AI可能会成为一个同样举足轻重的理由,甚至成为快手对广告主的核心优势。当然,这个过程不会是一蹴而就的,现在还仅仅是一个开始。
在本文的最后,我还想提出一个耐人寻味的问题。自从可灵发布之日起,我周围的很多人(包括我自己)就一直在提出这个问题:为什么是快手首先拿出了这样一个大模型?
在技术路线、算力资源和训练数据均不存在代差的情况下,关键的区别可能在于工程层面。说到底,生成式AI研发99%的问题是工程问题,尤其是如何妥善地组建和管理团队从而完成任务的问题。不要小看这个问题,谷歌的Gemini大模型就是在工程管理上出现了严重漏洞,才导致不断延期,成品发布之后还因为奖励模型(负责与人类价值观对齐)的问题而闹出丑闻。我的个人猜测是,快手高效地、富有技巧地完成了训练层面的工程任务,相对于竞争对手取得了至少几个月的先发优势。
更进一步地说,大模型技术毕竟还在迅速演进之中,尊重技术是很重要的。我们不能抱着做传统互联网产品的心态去做大模型,而需要在技术和产品两端之间找到平衡;上面提到的工程问题,本质上也是技术问题的一个分支。按照我的一位朋友的说法,“快手对顶尖技术人才非常慷慨。与竞争对手相比,目前快手反而成为了比较精干灵活的一个,这一点在生成式AI研发上体现得尤其明显。”附带说一句,这位朋友并不就职于快手,纯粹是站在旁观者的角度有上述感叹。
总而言之,包括可灵在内的快手生成式AI工具的成功,既证明了管理层的战略眼光,也是快手组织执行力的一个极好的体现。至于这个组织执行力的优势到底有多大?不好说,但我想指出的是:只有竞争对手还无法推出能够与可灵相匹敌的工具,快手的优势就会维持并扩大,从而逐渐形成量变到质变的效果。我们正在目睹这个过程!