GPT4、文心一言等中外AI大模型写上海中考作文 这次结果有些出人意料! 环球要闻

科创板日报   2023-06-18 10:53:25

《科创板日报》6月17日(记者 黄心怡 实习记者 朱凌)今日(6月17日),2023年中考正式开考。继高考中文之后,《科创板日报》再次使用微软Bing GPT-4、百度文心一言、阿里通义千问、讯飞星火认知以及360智脑五种人工智能语言模型,分别撰写上海中考作文,看看大模型的语言能力究竟如何?

《科创板日报》记者同样邀请了财联社行业主编、原中学语文一级教师田野对每个大模型的答案进行了评分,满分为60分。


(相关资料图)

下面《科创板日报》此次的点评和得分如下。

上海中考作文题为“会心之乐”:

会心,意思是从学习、生活中领会道理,或是对别人没有明说的意思心领神会,也可以指彼此之间的情意相合。

请以“会心之乐”为题,写一篇 600 字左右的文章。

▍微软Bing GPT-4

评分:45分

点评:第一段的点题非常到位,文中关于“会心之乐”的实例穿插叙述,很好的契合了题意。但是文章却有一个巨大的BUG:文中用于阐明会心之乐的生活例子,是发生在数学竞赛中,“我”和“小明”的之间的会心,有作弊之嫌。文中出现价值观上的问题,是作文的大忌。如果不是这一点,此文应该为55分。

▍文心一言:

评分:40分

点评:行文看似华丽广博,但一开始就出现了对题意的理解偏差。“我”在学习中,母亲送来热腾腾咖啡,这并非会心之乐。作者写了好多场景,但都不是完全的契合会心之乐题意。这种作文属于掉书袋式的写作。

▍通义千问:

评分:42分

点评:文章开始以相互理解、默契来点题会心,比较到位。全文中规中矩,无特别亮点,但也无明显瑕疵。

▍讯飞星火:

评分:41分

点评:第一段以“心领神会”点题比较好。叙述中对题意的展开也是不错的。但是却出现了低级错误:诗句“夜阑卧听风吹雨,铁马冰河入梦来”的作者是陆游,但作者却写成了白居易。另外这句古诗的诗意,与文章主题“会心之乐”相去甚远。

▍360智脑:

评分:39分

点评:全文没有能真正将“会心之乐”点题到位,行文泛而不聚焦。

田野老师总点评:

“在此次作文中,GPT4表现出了极高智能,从对作文题意理解和行文看,都是表现最好的,但却出现上了价值观的问题。文心一言则有华而不实之感,也许是作文语料被喂得太多,还不能做到将庞大的语料库真正“智能”地变成紧扣题意的文章。讯飞星火犯下诗人张冠李戴的错误。360智脑只是形式上会写作文,但实际的写作能力还处于低级状态。这说明,AI训练的精确性待提高,同时,AI伦理与AI智能同等重要。

另外,AI大模型在未来的发展过程中,是否能真正做到人类作家的真情实感与灵感创意,这是一个大大存疑的问题。”

需要强调的的是,每一个大模型不同时间的测试,写出的文章内容会有所不同,而田野老师的评分及点评也只是一家之言。看完了上面五个大模型的上海中文作文答卷,您更喜欢谁的中文作文呢?欢迎读者评论留言!

猜你喜欢