据日经新闻报道,中美两国的新型生成式AI在模拟东京大学理科3类入学考试中表现不俗。美国OpenAI的“o1”与中国的DeepSeek“R1”分别获得374分和369分(满分550分),均超过合格最低分数线368.7分。测试由日本经济新闻联合民间企业和大型补习班完成,答案由河合塾讲师评分。
在科目表现上,两款AI在英语科目中表现出色,得分率超75%,几乎无单词和语法错误。然而,在数学领域,尽管最终答案正确率较高,但在图形和论证问题上存在明显不足,o1和R1分别仅得38分和49分。对此,国立信息学研究所的新井纪子教授表示,这是AI发展的重要里程碑,但也提醒需警惕其输出内容的质量问题,强调培养能够有效判断和使用AI的人才至关重要。