综合动态

当前位置/ 首页/ 综合动态/ 正文

百度李彦宏:没有应用的大模型一文不值

导读 百度董事长兼CEO李彦宏还记得自己第一次来参加世界人工智能大会(WAIC)是在2022年,那一次大会的主题和元宇宙相关,主办方传话给他,希望...

百度董事长兼CEO李彦宏还记得自己第一次来参加世界人工智能大会(WAIC)是在2022年,那一次大会的主题和元宇宙相关,主办方传话给他,希望他讲一讲元宇宙。他回:“我说我还是讲AI吧,我讲不了元宇宙”。当时,他在演讲中提到自己对AI走势的判断:AI的技术发展路线发生了方向性改变,从过去的辨别式人工智能转向了未来生成式人工智能。

上述预判发生在2022年的夏天,5个月之后 ,GhatGPT发布,紧接着人工智能的又一波浪潮以前所未有的速度席卷全球。

“两年的时间恍若隔世,整个世界都变了,人工智能可以说颠覆了绝大多数人的认知。”李彦宏在今日的WAIC演讲中感慨。

他认为,2023年国内出现百模大战,造成社会资源的巨大浪费尤其是算力浪费,但是也使得我们追赶世界上最先进的技术模型能力得到建立。

他说,去年10月百度宣布文心4.0发布的时候,提到文心4.0毫不逊色GhatGPT,大家不以为然,但现在国内很多闭源模型声称已经追平超越了GhatGPT。

他提到,还有一些外行混淆模型开源和代码开源两个概念。“模型开源拿到一大堆参数,还是要做安全对齐,你不知道这些参数怎么来的,你是无法做到众人拾柴火焰高,即便拿到对应源代码也不知道用了多少数据,用了多少比例数据训练这些参数。所以拿到这些东西,并不能够让你站在巨人肩膀上去迭代和开发。”

今日的演讲中他再次提到大模型领域开源与闭源的路线之争。他认为,在同样参数规模之下,闭源模型能力比开源模型要更好。而如果开源想要能力追平闭源,那就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。

“很多人拿开源模型来改款,以为这样更好服务个性化应用。殊不知这样创作孤本模型无法在基本模型获益,也没有办法跟别人共享算力。”李彦宏说。

但与此同时,他也承认开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。“当你处在一个激烈竞争市场环境当中的时候,你需要让自己业务的效率比你的同行更高,成本比你的同行更低。这个时候商业化的闭源模型是最能打的。”

比起开源闭源路线,他认为更重要的还是应用的落地。他提到,现在业界的关注点都放在了基础模型身上,“一天到晚到处跑分刷榜,谁是谁又超越GhatGPT4,Open AI又出来Sora……”但事实上,没有应用,光有一个基础模型不管是开源还是闭源,一文不值。

他呼吁行业不要卷模型了,要去卷应用。 应用其实离大家并不遥远,基于基准模型应用在各个领域,各行各业已经开始逐步渗透。他援引文心一言的调用量数据,两个月前还在2亿,现在已经到了5亿,说明大模型背后是代表了真实的需求,有人真的从大模型当中获益了 。

他举个例子,在快递领域,让大模型帮助处理订单,做到了一张纸一句话寄快递而不再需要其他繁琐流程,时间从3分钟缩短19秒,而且90%以上的问题都是由大模型解决,效率提升非常明显。在小说创作领域,网文作者有了AI的助力“如虎添翼”。而类似于代码生成的软件,在各个领域也在逐步渗透。李彦宏透露,百度内部我们有30%左右的代码已经是用AI生成了,代码采用率超过44%。

因此,李彦宏提出业界要避免掉入“超级应用陷阱”,认为一定要出现一个10亿DAU的APP才叫成功,这是移动时代的思维逻辑。AI时代,规律可能不是这样的,“超级能干”的应用比只看DAU的“超级应用”更重要,只要对产业、对应用场景能产生大的增益,整体价值就比移动互联网要大多了。

智能体是他最看好的AI发展方向。他判断,未来在医疗、金融、教育、制造、交通、农业等等领域都会依照自己场景,自己特有经验规则数据等等做出各种各样智能体将来有数以百万量级智能体出现,形成庞大的智能体生态。

AI正在以前所未有的速度向各行各业渗透。很多人担心,人类是不是就没有工作机会了?李彦宏说自己听到的抱怨很多,建设性意见很少,很少有人去致力于发掘生成式AI带来的新的工作机会。

李彦宏说,已经看到有一些全新的工作冒出来,比如说提示词工程师。这个职业未来不用编程,但需要用很强的逻辑性把工作流说清楚,要用提示词对模型进行调教,随着智能体大量涌现,这种工作需求也会飙升。“这些工作机会通常门槛并不高,你做的一般也能够养家糊口,做得好上限可以年薪百万。”