據 36 氪 7 月 24 日報道,C-Eval 全球大模型綜合性考試評測榜公佈,全球排名前四的分別爲清華智譜的 ChatGLM2、OpenAI 的 GPT-4、商湯的 SenseChat,APUS 的 AiLMe-100 Bv1。 C-Eval 是由清華大學、上海交通大學和愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集,包含 13948 道多項選擇題,涵蓋 52 個不同學科和四個難度級別。
相關文章