据 36 氪 7 月 24 日报道,C-Eval 全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的 ChatGLM2、OpenAI 的 GPT-4、商汤的 SenseChat,APUS 的 AiLMe-100 Bv1。 C-Eval 是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含 13948 道多项选择题,涵盖 52 个不同学科和四个难度级别。
相关文章