(资料图片)
加拿大科学家在16日出版的《放射学》杂志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。
为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性,多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题,这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像,分为低阶(知识回忆、基本理解)和高阶(应用、分析、综合)思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。
研究人员发现,基于GPT-3.5的ChatGPT的正确率为69%,接近70%的及格线。该模型在低阶思维问题上表现相对较好,正确率为84%,但回答高级思维问题时表现不佳,正确率仅为60%。而性能更优异的GPT-4的正确率为81%,且在高阶思维问题上的正确率为81%,远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%,答错了12道题,而GPT-3.5全部答对了这些题目,这引发了研究团队对GPT-4收集信息的可靠性的担忧。
这两项研究都表明,ChatGPT会有提供不正确答案的倾向,如果仅仅依靠它获取信息,非常危险,因为人们可能意识不到其给出的答案是不准确的,这是它目前面临的最大的问题。
标签:最近更新
- ChatGPT通过美放射学委员会考试2023-05-18
- 全国就指委持续助力促进高校毕业生就业2023-05-18
- 石家庄旅游景点大全大佛寺_石家庄旅游景点大全-环球新动态2023-05-18
- 面向Web3.0的区块链SIM卡问世|信息2023-05-18
- 环球动态:全球首个5G异网漫游试商用启动2023-05-18
- 提升企业信用监管数据质量 破除“信息孤岛” 天天实时2023-05-18
- 直播带的不仅是货,还有就业岗位 天天快资讯2023-05-18
- “电博会”上带您看“数聚未来”2023-05-18
- 世界视讯!债务上限谈判有进展!美国三大股指均涨超1%2023-05-18
- 【西街观察】ChatGPT:要魔法棒,也要指挥棒-全球微资讯2023-05-18
- 基金调研再度聚焦AI 主题投资渐成共识|今日热闻2023-05-18
- 欧盟率先进入加密资产“法治时代”2023-05-18
- 洞察中产家庭需求,全新一代别克君越正式上市2023-05-18
- 抢抓大模型机遇 多方布局通用人工智能发展2023-05-18
- 女娲补天指的是什么生肖(女娲补天是什么生肖)2023-05-18
- 环球观焦点:工信部:深化“5G+工业互联网” 融合创新和规模应用2023-05-18
- 焦点精选!转账支票有效期6个月_转账支票有效期几天2023-05-18
- 最新:人过了50岁,想要不讨人嫌,就不要轻易把这4件事说出口!2023-05-18
- 中国诗歌网登录 中国诗词网 世界新要闻2023-05-18
- Beats Studio Buds+发布:36小时续航 支持iOS空间音频 售1349元_环球热消息2023-05-18
- 全球热点!郭守义改进了简仪和圭表主持全国范围的天文测量_郭守敬改进了简仪和圭表 主持修订了2023-05-18
- 【U家同款亲子防晒衣】59.9元一件!冷感网眼面料,穿上巨透气舒爽!_环球今亮点2023-05-18
- 吴江区青云实验中学官网报名时间_吴江区青云实验中学官网2023-05-18
- 怀柔区庙城镇王史山村青年志愿者服务队|全球观天下2023-05-18
- 【新要闻】第32届东南亚运动会落幕 东道主柬埔寨成绩斐然2023-05-17
- 上海信息消费节启动 拟发亿元补贴助力5000家企业数字化转型|全球播资讯2023-05-17
- 热推荐:明天热意来袭,后天重庆这些地方有阵雨或雷雨出没2023-05-17
- 【世界快播报】在数字能源新时代:创新技术使能者与产业生态赋能者合体2023-05-17
- 环球短讯!“5·17”世界电信日 安全为何仍是重要议题2023-05-17
- 腾讯高管谈友商云服务降价:有一些影响 但并不大|世界球精选2023-05-17