OpenAI发布GPT-4o mini,奥尔特曼称两年时间模型成本下降了99%
虽然OpenAI迟迟未发布下一代模型GPT-5,但在现有能力基础上,仍在更新模型,继续推动大模型成本下降。
当地时间7月18日,OpenAI发布了新款轻量级的大模型GPT-4o mini。据介绍,GPT-4o mini即日起将在问答机器人ChatGPT中取代GPT-3.5 Turbo,企业用户则能从下周起访问GPT-4o mini。
“我们预计GPT-4o mini将扩大人工智能的应用,让人工智能变得更实惠。”OpenAI官网文章称,GPT-4o mini的输入价格为15美分(0.15美元)/百万tokens(词元),输出价格为60美分(0.6美元)/百万tokens(约等于一本2500页的书),比GPT-3.5 Turbo便宜60%。
从模型能力看,OpenAI称,GPT-4o mini在行业基准测试MMLU(评估大规模多任务语言理解)中获得82%的分数,低于GPT-4o的88.7%,高于77.9%的Genmini Flash、73.8%的Claude 3 Haiku和69.8%的GPT-3.5 Turbo。GPT-4o mini在MGSM测试(评估数学推理)和MMMU测试(评估多模态推理)中,分别得分87%和59.4%,均超过Gemini Flash和Claude 3 Haiku,但低于GPT-4o。
此外,GPT-4o mini上下文窗口为128K tokens,支持输出16K tokens,知识更新至2023年10月。OpenAI介绍,GPT-4o mini还改进了处理非英语文本时的成本效益。GPT-4o mini能以较低成本和延迟执行广泛任务,如链接或并行多个模型调用(调用API接口)、将大量上下文输入给模型、通过快速的实时文本响应与人交互。
目前,GPT-4o mini可以生成文字和图像,未来将支持视频和音频。OpenAI计划还在未来几天推出GPT-4o的微调。
目前来看,GPT-4o mini的主要作用可能是取代GPT-3.5 Turbo,并通过降低价格吸引用户。
OpenAI称,公司还将在提高模型性能的同时继续降低成本。相比2022年的text-davinci-003型号,GPT-4o mini的成本下降了99%。
“2022年全世界最先进的模型还是text-davinci-003,这个模型比现在的新模型差了很多,却贵了100倍。”OpenAI CEO萨姆·奥尔特曼(Sam Altman)在社交平台上表示。
其他大模型厂商今年也在推动模型轻量化,追求“小而美”。此前有大模型业内人士告诉记者,参数较小的大模型今年来展现了颇高的潜力,通过加大数据量而不是加大参数量的方式训练,模型性能还有很大提升空间,好处则在于轻量大模型的使用成本低,可以扩大使用。
谷歌今年5月也发布了轻量级模型Gemini 1.5 Flash。Anthropic 3月发布的Claude 3系列中,则包括轻量级的Claude 3 Haiku,在多项基准测试中Claude 3 Haiku的得分高于GPT-3.5、低于GPT-4。微软今年也在推动部署轻量级AI模型系列Phi。微软此前称,今年4月推出的Phi-3系列是市面上性能最强、最具性价比的“小语言模型”,最小版本的Phi-3-mini性能可超过参数规模高出一倍多的模型,成本可能只有类似功能的模型的十分之一。
从价格上看,Gemini 1.5 Flash每百万tokens起始价格为0.35美元,输出为1.05美元,Claude3 Haiku每百万tokens价格0.25美元,输出为1.25美元。GPT-4o mini的价格相对更便宜。