563支AI队伍和姜萍答了同一份试卷：最高34分，无一入围决赛 —— AI挑战人类智慧边界

2024-06-16 18:30:07

导读在最近结束的第六届阿里巴巴全球数学竞赛中，17岁的江苏涟水中学学生姜萍脱颖而出，她在全球数万名参赛者中排名12，不仅成为了决赛圈的焦点...

在最近结束的第六届阿里巴巴全球数学竞赛中，17岁的江苏涟水中学学生姜萍脱颖而出，她在全球数万名参赛者中排名12，不仅成为了决赛圈的焦点，也是30强中唯一的女性选手。此次竞赛的一大亮点是首次引入了AI大模型挑战赛，吸引了563支由全球顶尖学术机构和企业组建的AI团队与人类选手同台竞技，共解同一套试题。

4月13日，随着竞赛的钟声响起，数以万计的数学爱好者在全球范围内开始了他们的智力征程，试题涵盖选择题、解答题及证明题等多种类型。然而，尽管AI队伍展现了一定的实力，其平均分达到了18分，与人类选手持平，最高分却只有34分，远不及人类选手的113分高峰，无一支AI队伍进入最终的801人决赛名单。

值得关注的是，上海建平中学的涂津豪凭借独创的AI策略获得了AI队伍中的最高分，该策略灵感来源于自辩论思想，通过大模型之间的多轮问答验证来逼近问题的最佳解答。而来自西南交通大学和中国人民大学的两支AI队伍，则分别凭借独特的Multi-Agent系统设计荣获亚军和季军，展现了不同的解题思路与技术路径。

浙江大学计算机系统结构实验室的研究员陈天楚指出，当前大语言模型（LLM）在处理数学竞赛这类需要反复试错与深度思考的任务时，仍面临逻辑推理和严谨思考的局限性，尽管已有通过Prompt工程提升模型表现的尝试，但效果有限，尚不能与人类专家相提并论。

赛事组委会在点评中也强调了AI在逻辑推理和证明题方面的不足。一位互联网企业的技术总监认为，这次AI挑战赛不仅是对“百模大战”后AI模型能力的检验，更是凸显了在复杂逻辑推理和创新思维领域，人类选手依然保持明显优势。

尽管AI在本次数学竞赛中的表现未能超越人类，但这场较量被视作推动人工智能与数学理论发展的重要契机。今年，各支AI队伍通过多种技术创新探索提升AI数学能力的新途径，预示着未来人工智能与数学领域的互动将更加深入。

阿里巴巴全球数学竞赛自2018年创办以来，以其开放的参赛门槛和广泛的参与度，吸引了全球超过25万人次参与，成为全球最大的在线数学竞赛平台之一，持续激发着全球数学爱好者的热情与创造力。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:河南降温降雨高温缓解，局地迎中到大雨

下一篇:最后一页

综合资讯

563支AI队伍和姜萍答了同一份试卷：最高34分，无一入围决赛 —— AI挑战人类智慧边界

本周【综合资讯】阅读排行

本周热门推荐阅读

锋范和哥瑞哪个保值（锋...

新不了情电视剧心不了情

hgh是什么激素 crh是什么激素

pdf怎么编辑页码顺序 pd...

王星越定风波出妆疑与...

蜗轮蜗杆设计步骤蜗轮...

3缸发动机优点和缺点（3...

eachother同义词 eachother

张艺谋将拍电影版《三体...

高速路应急车道的作用 ...

教师因救人上课迟到该不...

Win11新Bug致CPU占用率过...

衣柜定制哪个品牌好一点...

真正的玫瑰花长什么样子...

深圳大学发布本科招生计...

综合资讯

563支AI队伍和姜萍答了同一份试卷：最高34分，无一入围决赛 —— AI挑战人类智慧边界

猜你喜欢

最新文章

本周【综合资讯】阅读排行

本周热门推荐阅读