世界要闻：中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一

业界 | 2023-05-10 15:48:39

时间：2023-05-10 15:48:39 / 来源：时代财经 / 点击数：()

(资料图片仅供参考)

5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？

该模型可通过多个层面，考验市面上主流的中文 GPT 大模型的能力：

基础能力: 包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。

专业能力: 包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等 50 多项能力。

中文特性能力: 针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等 10 项多种能力。

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于CLUEbenchmarks 官方网站进行公示。

标签:

最近更新

最新文章

世界要闻：中文通用大模型基准测试 SuperCLUE 发布，讯飞星火认知大模型国内第一 2023-05-10 15:48:39

淘宝天猫集团架构调整完成戴姗宣布三个变革方向|天天讯息 2023-05-10 15:48:39

天天微资讯！马斯克：推特很快将支持通话、加密私信等功能 2023-05-10 15:48:39

AI前哨｜出门问问将赴港上市：最高融资3亿美元已选择投行_天天亮点 2023-05-10 15:48:39

ChatGPT访问量4月再创新高达到17.6亿次-天天头条 2023-05-10 15:48:39

全球资讯：年轻人不买新手机，是因为质量越来越好吗？ 2023-05-10 15:48:39

又崩了？苹果回应 2023-05-10 15:48:39

腾讯校招生接替CEO！程武辞别阅文集团，曾出品《人世间》《庆余年》等爆款 2023-05-10 15:48:39

iPhone 16 Pro系列有望配备更大屏幕预计分别为6.2英寸、6.8英寸 2023-05-10 15:48:39

300余家生态伙伴参与内测，“第一个吃螃蟹”的文心一言怎么样了？ 2023-05-10 15:48:39

一周热门

淘宝天猫集团架构调整完成戴姗宣布三个变革方向|天天讯息 2023-05-10 15:48:39

京东苏宁“隔空喊话” 京东坚称末位淘汰不动摇 2023-05-10 15:48:39

一不小心微信转错账如何挽回损失呢？ 2023-05-10 15:48:39

网络监管成难题：隐私泄露安全漏洞太多 2023-05-10 15:48:39

外媒报道：作为纸币的发明国中国或将首先停用现金 2023-05-10 15:48:39

爱钱帮宣布完成5亿元B轮融资 A股公司董事长入局 2023-05-10 15:48:39

手机地下“解锁”调查：费用达千元，黑客及“内鬼”提供 2023-05-10 15:48:39

丰田欲在华量产电动车型最早2019年落地 2023-05-10 15:48:39

手机充电两分钟 “偷偷”被装软件四五个 2023-05-10 15:48:39

欧盟27亿美元罚款将重创谷歌二季度业绩利润或腰斩 2023-05-10 15:48:39

关于智能派网站地图寻求报道寻求合作
联络QQ： 31554 1185

© 智能派版权所有复制必究粤ICP备18025786号