GPT4o 大战高考数学, 惨败

以 2024 高考数学 新课标1卷为例,我们来测测 GPT4o 的多模态推理能力。

一、概率图推理

这个题非常考验学生利用图形来推理出概率的大概范围,注重对思维逻辑的考察,而不是计算过程。GPT4o 无法自己画图来进行推理,因此也只能猜一个答案,如下图所示。

我们发现他在查表,然而并没有表供他可查,产生了幻觉。

无法作图,欠缺复杂图形推理能力仍是GPT4o的缺陷。

正确答案如下:

二、函数图推理

再来看一道函数图推理,如下图。

GPT4o仍然是无法作图来进行推理分析的。

我们看他的解题过程。

不难看出,GPT4o前三个步骤的分析都是没有问题的,但是第四步验证选项都是通过带入一些选项来进行分析,不仅慢,正确率也不能保证,我们看下根据图分析的正确求解过程。

画完函数图像后,可以直接过渡到第四步,既快又准哈。

三、曲线方程

这个回答仍是有问题的,第五步的分析是通过代入x=0去求解,虽然答案是对的,但过程是错的,正确解题过程如下图所示绿字的推理,我们从导数的角度分析,斜率不等于0,未取到极值点,因此纵坐标的最大值不是1。

第六步的分析也存在问题,把 y0 单独提出来是正确的,但后面出现了幻觉,产生了无法推出结论的过程。

正确的分析过程位于下图右下角。

总结

从这几个案例可以看出,我们的高考的重心从 计算 移向了 图形综合推理,对思维能力的要求非常高,弱化了计算,而这恰好是大模型的弱点,短期内无法补齐。

因此教育行业要重点发力在对学生的思维能力的培养,提升他们思维能力、探究和解决问题能力。

原文链接:https://blog.csdn.net/NVG_Haru/article/details/139568023?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171949575216800197091535%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=171949575216800197091535&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-26-139568023-null-null.nonecase&utm_term=2024%E9%AB%98%E8%80%83

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享