多项测试超越90%的人类，GPT-4会引发新一轮风暴吗环球观速讯

业界 | 2023-03-16 05:46:16

时间：2023-03-16 05:46:16 / 来源：北京商报网 / 点击数：()

3月15日，美东时间3月14日，OpenAI宣布推出大型语言模型的最新版本——GPT-4，该版本比以前的版本“更大”，称它可以接收图像和文本输入，输出文本，“比以往任何更具创造性和协作性”，并且“由于它有更广泛的常识和解决问题的能力，可以更准确地解决难题”。在内部评估中，它产生正确回应的可能性比GPT-3.5高40%。它将用于付费版ChatGPT Plus。

ChatGPT是最近科技界最火爆的话题，GPT-3是世界上最大的大语言模型之一，其惊人的表现也让外界猜测下一代的GPT-4到底有多强大。

OpenAI官方发布的宣传片中GPT的最新一代版本ChatGPT-4，相比上一代，其AI能力再度提升，同时支持输入的内容不再仅限于文字，还支持图像内容的输入，成为一个能够理解照片的人工智能。虽然ChatGPT-4未能实现音频解析，但新功能让人兴奋不已。

(相关资料图)

同时根据OpenAI介绍，GPT-4是一个多模态大型语言模型，即支持图像和文本输入，以文本形式输出；扩写能力增强，能处理超过25000个单词的文本。

OpenAI表示，新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。例如，GPT-4模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。

虽然GPT-4更具创造力，并且能够处理更细微的指令，但官方也警告说，这些系统保留了许多与早期语言模型相同的问题，包括编造信息的倾向以及生成暴力和有害文本的能力，尽管如此，用户们还是为之振奋。

北京商报记者向GPT-4和GPT-3.5中输入“帮我出一个北京一日游的攻略”的问题。

由输入结果可知，在北京一日游的攻略中GPT-4明显时间安排与提醒更加细致贴心，内容上更丰富清晰，而同时GPT-3.5出现了序号错误。

再向二者输入第二个问题“解释一下幂函数”。

从答案可以看出，在幂函数的介绍上，GPT-4与GPT-3.5相比清晰地将定义、举例、应用表达出来，更具有逻辑性。

接着再同时输入“哈利波特是怎样的魔法师”。

在对哈利波特的介绍中，将“父母在他很小时被黑巫师伏地魔杀害”的内容表述成“年幼失去双亲”，显然GPT-4在语言上更加精炼。

GPT-4在不断学习之下，ChatGPT也变得更为聪明、准确。GPT-4相较于GPT-3.5更加具备规范和精确的语言能力，同时也具备更精确的知识。

据报道，GPT-4多项测试超越90%的人类，这不免成为人们关注的焦点。

北京光大银行(601818)一位计算机程序员向北京商报记者表示，目前对于银行这种要求严谨精确的系统来讲，短期内程序员是不会被机器替代的，机器还是存在更多的不确定性。在银行一直使用的是较为“老”而稳定的程序。

GPT-4的更新让大众受益，同样ChatGPT的开发者OpenAI在GPT-4的研发上已经取得了不少进展，各种猜测纷纭，有说其训练参数高达100万亿的，有说微软已经把GPT-4纳入最新版本的必应中。

本周，AI行业或将迎来“疯狂星期四”。百度此前宣布，将于3月16日（周四）发布旗下首款类ChatGPT产品“文心一言”。微软也透露，本周内将推出拥有更高性能的GPT-4。虽然目前尚未透露具体发布时间，不过考虑到3月16日也是微软的AI活动日，活动主题为“用人工智能重塑生产力”，而公司CEO将上台演讲，外界普遍认为当天这款产品将正式亮相。

北京商报记者陶凤实习记者李想

标签: