AI大模型参加今年高考·成绩单来了!

图片

2024高考落幕,各家AI纷纷交卷,今天聊聊高考中的AI。

毫无悬念,今年的高考,成了各家大模型的竞技场。几乎所有的国产大模型,都把高考题目当成了跑分工具。那么,这些AI表现怎么样呢?前两天,搜狐科技和量子位等几家媒体做了个统计。

在数学上,得分前三名是百度的文心一言、字节的豆包,还有科大讯飞的星火。这三个大模型并列第一,答案正确率都是63%。而剩下的几家大模型,答题正确率都没有超过51%。
😝有需要的小伙伴,可以V扫描下方二维码免费领取🆓

AI大模型参加今年高考·成绩单来了!插图1

在物理上,阿里的通义千问和讯飞的星火并列第一,正确率都是71.4%。排在后面的是Kimi、海螺和腾讯元宝。

今年的作文题,估计很多人都看过了,大部分人群最关心的还是AI作文考试。

新课标1卷的题目是,随着互联网的普及以及人工智能的应用,越来越多的问题能更快获得答案。那么,我们的问题是否会越来越少?

新课标2卷的题目是,随着嫦娥四号探月和天问一号出发,人类的脚步正在不断抵达未知之境。这引发了你怎样的思考?

那么,在这些题目上,AI完成得怎么样呢?按照满分60分算的话,AI的分数普遍在50分上下,各家大模型的差距并不大。这些AI作文也请专业的语文老师看了,按照他的说法,这些作文给人的感觉,就像在吃各式各样的、形状不同的馒头。没错,尽管形状不同,但你懂的,大概就是那个差不多的味道。你挑不出什么毛病,也找不出太大的亮点。去年我们曾经让AI写过2023年的高考作文,现在一年过去,AI的进步确实有。只不过,这个进步的点在于,馒头比去年更精致了,但馒头还是馒头。

有人认为这是大模型进展不够快,也有人觉得是高考题目难度大。关于今年的作文题,我特地请教了北京十一学校语文教研组的组长,史建筑老师。史老师有很多年的语文教学经验,在作文方面更是专家。从他那获得了一个很特别的角度。

其实今年的高考作文是不好用难易来评判的。今年的变化,不是难度上的变化,而是命题思路上的变化。今年的作文题,在整体的思辨,以及逻辑思维的考察上,要比往年有强化。这是个很有价值的转变。正在慢慢纠正那些只讲气势,堆大词,不讲逻辑的文风。

按照个人理解,这背后本质的转变,其实是作文考试正在从资源导向,转变成能力导向。

所谓资源导向,就是不停地往上堆资源。就像炒菜做饭,追求的只是把珍贵的食材凑齐。而体现在作文上,就是不停地堆要素。比如,情感充沛、成语丰富、引经据典。既然这些都属于加分要素,我就把这些要素堆上去,就能拿到一个不低的基础分。

据说在网上,还流传着一个万能作文模板,叫做我的爷爷。

比如,前年的作文题之一是,围棋中的本手、妙手、俗手引发了你怎样的思考,请写一篇文章。那么按照我的爷爷模板,写出来就是看到围棋中的本手、妙手、俗手,我想到了我那爱下围棋的爷爷。爷爷这一生怎样怎样。

再比如,去年的作文题,其中有一个是,故事的力量。按照爷爷模板,写出来就是,看到故事,我就想起了我那特别喜欢讲故事的爷爷。爷爷这一生是怎样怎样的。

当然,这个万能模板只是个玩笑,但它其实也展示了一个可能性。这就是,假如一件事是纯粹的资源导向,那么它就有可能走到这个高度同质化的死胡同。

怎么办?这就是高考作文这几年正在做的转变,从资源导向,转向能力导向。也就是考察的重点,不是学生堆大词、背成语,发表感叹的能力,而是学生的辩证思考能力。

你之所以觉得这两年AI写的作文一般,就是因为AI的写作方式,还停留在堆资源的阶段。但实际的作文题,已经越来越多地把重点放在学生的思辨能力上。

在早前发布的消息中,也强调了这个变化。比如,在高考最卷的省份之一山东,今年的高考命题,按照教学专家的说法,是强调四个无,分别是,无价值,不入题。无思维,不命题。无综合,不命题。无情境,不成题。这些说的都是高考命题将越来越看重学生的辩证思考能力,以及解决真实挑战的能力。

比如今年的作文题,AI能回答越来越多的问题,那么人类的问题是否会越来越少?你看,这个题目要想拿高分,靠堆大词肯定不行,而是要有特别的思考。

其实,跳出高考这个话题之外,你会发现,很多领域的变化,都遵循着相似的过程,从资源导向,转向能力导向。

比如,新闻传播学。去年张雪峰说新闻学是天坑专业,在网上引起了不小的争论。为什么会产生这个争论?本质原因之一,是传播领域发生了一个关键变化。它正在从一个资源导向的行业,逐渐变成能力导向的行业。

为什么说传播领域以前是资源导向?因为早些年,传播资源非常稀缺。电视上的频道就那么几个,市面上也没有互联网。而当年只要上一回电视,没准就能改变一个普通人一生的命运。你看,在传播资源这么稀缺,这么珍贵,这么威力十足的情况下,假如你要培养这个行业的从业者,你觉得最重要的是什么?没错,最重要的课题之一,就是培养他们深刻认识、小心驾驭、谨慎对待这些资源的能力。包括,怎么建立一套严谨的流程,怎么做好极其细致的前期策划,以及了解这个行业的过往历史,等等。

但是最近十几年,自媒体和移动互联网快速普及,传播资源变得不再稀缺。这时,传媒行业的价值也发生了转变,而部分学校的传播学专业还没来得及完全调整,因此争论就发生了。

原来传播行业的本质是,比原来广,它的主要价值在于,让一个信息比原来传播得更广被更多的人知道。

而现在传播行业的本质是,比原来好。也就是,一个信息大家都知道,但我能让它变得比原来更有价值。要么是变得更简单易懂,更好吸收。要么是变得角度独特,更有深度。

这时,考验的就不是从业者守护资源的能力,而是创造性地使用资源的能力。

换句话说,能力和资源的关系,也许跟我们想象得不太一样。过去很多人觉得,这两个因素的关系是此消彼长,只要资源充足,能力差点没事。反过来,只有资源不足,才会倒逼能力成长。但事实上,这两个因素很多时候是正相关的。资源越充足,越需要强大的能力驾驭。就像高考作文一样,当大家都掌握充沛的成语、典故和写作套路时,要想拉开差距,就要看谁更能用强大的思考能力,来驾驭这些资源。

总结:

从AI高考作文得分情况可以看出,高考作文正在发生转变,**最核心的变化之一,是从资源导向,转向能力导向。**过去有考生习惯堆资源,堆大词,但未来,考试的重点将转向学生的辩证思考能力,AI的进化也要跟上脚步。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

AI大模型参加今年高考·成绩单来了!插图5

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

AI大模型参加今年高考·成绩单来了!插图5

原文链接:https://blog.csdn.net/2401_85324918/article/details/139777309?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171949603416800184194664%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=171949603416800184194664&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-5-139777309-null-null.nonecase&utm_term=2024%E9%AB%98%E8%80%83%E5%88%86%E6%95%B0%E7%BA%BF

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享