当前位置:当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
文章出处:网络 人气:发表时间:2025-06-18 23:30:11
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
同类文章排行
- 松下、三星等动力电池巨头,为什么输给了中国人?_企业_特斯拉_新能源
- AI 攻占 MWC_手机_机器人_智能
- 年赚600亿!中国小游戏,未来更“传奇”?_程序_DataEye_市场
- 100亿,人形机器人砸钱上桌_融资_企业_宇树
- 微信把超级Agent之战一把拉进了自己的舒适圈_程序_App_用户
- “成人网站”上的女生,到底是怎样被***的?女生一定要小心了!_隐私_生活_心理
- 携程的“黄金时代”_营业_机票_利润
- AI领域被清华学霸包圆了?_融资_智谱_汪玉
- 2026中国高端手机最新销量:苹果17断崖领先 华为Mate 80国产第一_系列_Ultra_Find
- 做到了为阿里好!林俊旸发文真诚告别_集团_技术_科技
最新资讯文章
- 免费B站看大片***直播:一场影视与社交的狂欢盛宴_用户_内容_正版
- 周鸿祎回应“龙虾安全”争议:它是好东西绝非病毒,不发展才是最大安全隐患_智能_OpenClaw_能力
- 除了游戏,网易还剩下什么?_丁磊_服务收入_公司
- 6G争夺战提前打响:华为造路,英伟达造脑_网络_国际电信联盟_通信
- 李建要给荣耀撕掉“华为”标签?_市场_品牌_Magic
- 千元机性价比排行:一加Ace5竞速版第二名,红米直接霸榜_Turbo_配置_手机
- 大厂“养虾”,各怀心事_OpenClaw_产品_龙虾
- 魅族洗牌,雷鸟扩军_赛道_眼镜_StarV
- 梁文锋推迟V4,是为了根治龙虾的健忘症?_OpenClaw_记忆_模型
- 90%任务是“养虾” 大模型Token通胀 谁在收割红利?_OpenClaw_龙虾_智能
- 存储涨价成「最后一刀」,魅族手机死于2026_品牌_产品_问题
- “养龙虾”爆火,有人称靠上门安装赚26万!官方提示→_OpenClaw_服务_部署
- AI开始倒反天罡了_人类_平台_ai
- 超 2 亿用户的大厂,深夜爆大瓜,这真给我看笑了!_豆瓣_网友_薅羊毛
- 冲上热搜!人脸认证时千万记得穿衣服,复旦教授提醒:不要在洗澡的时候去做人脸认证_张军平_网友_智能






关注公众微信号
移动端,扫扫更精彩