首页 >> 每日动态 >
复旦大学高考数学大模型评测:阿里千问、讯飞星火力压GPT-4o
快科技6月12日消息,近日,复旦大学NLP(自然语言处理)实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。
在这次评测中,阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第二名,以及高考数学新II卷的第二名和第一名,两份考卷的评测中,GPT-4o均列第三名。
复旦NLP团队认为,全新出炉的高考试题具备高度的独创性和保密性,是用来评测大模型的绝好评测集合。在新Ⅰ卷中,阿里千问和讯飞星火对14道数学客观题的准确率达到70%以上,大幅领先GPT-4o的57%,字节豆包、智谱清言、百川等大模型紧随其后,准确率超过50%,百度文心一言、腾讯元宝、Kimi等大模型准确率较低。
而在在新Ⅱ卷的评测中,讯飞星火、阿里千问、GPT-4o准确率均超过60%,其他大模型的差距较小,除百川、DeepSeek和海螺之外,准确率均在50%以上。
数学能力是GPT-4o一直以来引以为傲的能力模块,OpenAI在5月14日的发布会上推出大语言模型GPT-4o时,曾重点演示其数学能力。
在现场演示中,GPT-4o利用其实时的图像识别和语音能力进行在线教学。从评测结果可以看出,阿里千问和讯飞星火对数学问题的深入理解和分析能力已经超过GPT-4o,使其在高考数学试题的解答上具有更高的准确率。有网友表示,做数学题毕竟还是咱中国人的特长。
以阿里千问和讯飞星火为代表,国产人工智能大模型在数学领域的出色能力,为未来人工智能技术在教育领域的应用提供了有力支持。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
分享:
相关阅读
- 又一波贷款入市“吃亏者”出现 已有投资者被银行提前收回资金
- 财联社10月15日电,玻璃期货主力合约大涨6%,报1285元/吨。纯碱主力合约涨超2%,现报1575元/吨。
- 面临困境的瑞典电池制造商Northvolt按期缴纳税款 通过“关键考验”
- 远洋集团:未就10月26日到期的380万美元票据利息作出预先资金的支付
- 财联社10月15日电,富时中国A50指数期货开盘跌0.13%。
- 调高惠低作用明显 2023年度个税汇算清缴数据发布
- 财联社10月15日电,上期所原油期货跌超4%,现报550.4元/桶。
- 财联社10月15日电,央行公开市场开展683亿元7天期逆回购操作,操作利率1.50%,与此前持平。今日417亿元逆回购到期。
最新文章
-
【奥迪tt敞篷多少钱】奥迪TT作为一款经典跑车,凭借其动感的外观、出色的操控性能和独特的设计语言,一直受到...浏览全文>>
-
【奥迪s5敞篷试驾评测如何】在众多豪华轿跑车型中,奥迪S5敞篷凭借其优雅的设计、出色的操控性能以及强大的动...浏览全文>>
-
【奥迪rs6为什么叫神车】奥迪RS6之所以被称为“神车”,不仅因为它拥有强大的性能,还因为它在豪华、操控、实...浏览全文>>
-
【奥迪R8敞篷版跑车的价格是多少】奥迪R8作为一款高性能超级跑车,凭借其出色的性能、优雅的设计和强大的品牌...浏览全文>>
-
【奥迪q7车报价2021款官方指导价】作为豪华SUV市场中的热门车型,奥迪Q7凭借其出色的性能、科技配置以及品牌影...浏览全文>>
-
【奥迪Q77座落地需要多少钱奥迪Q7价格】奥迪Q7作为一款豪华中大型SUV,凭借其出色的性能、宽敞的空间以及品牌...浏览全文>>
-
【奥迪q5加满油多少升】在日常用车过程中,很多车主都会关心自己车辆的油箱容量,以便合理规划加油次数和预算...浏览全文>>
-
【奥迪q5机油要加几升】在日常的汽车保养中,机油更换是必不可少的一项操作。对于奥迪Q5车主来说,了解正确的...浏览全文>>
-
【奥迪q2的参数是怎样的】奥迪Q2是一款定位紧凑型豪华SUV的车型,凭借其精致的设计、出色的操控性和较高的品牌...浏览全文>>
-
【奥迪asl报价是多少】在汽车市场中,消费者对车型的了解往往从价格开始。奥迪作为豪华品牌之一,其产品线丰富...浏览全文>>
大家爱看
频道推荐