九卦| 全面进化的GPT-4来了！考试能力强过90%的人类！（卦象用九什么意思）

新鲜事 admin 2023-04-28 03:06 76 0

原标题：九卦| 全面进化的GPT-4来了！考试能力强过90%的人类！

北京时间3月15日凌晨，OpenAI发布了最新版本的GPT-4，瞬间引发全球市场的关注从目前官方解读以及大量机构的评测来看，“超出预期”依然是这一版GPT给人带来的最大体验GPT-4有多强？据介绍，GRE考试接近满分，律考比肩顶级律师，随手画个草图就能做出同款网页，被网友称为“王炸”产品。

多模态“更上一层楼”目前，ChatGPT的Plus订阅用户已经可以使用GPT-4，其他用户需要排队申请内测在应用方面，微软表示，新必应搜索引擎正在运行GPT-4OpenAI还在官网展示了给摩根士丹利、多邻国、By My Eyes等应用GPT-4的案例。

美东时间3月14日，OpenAI宣布推出大型的多模态模型GPT-4“GPT-4比以往任何版本更具创造性和协作性”，并且“有更广泛的常识和解决问题的能力，可以更准确地解决难题”OpenAI的CEO Sam Altman说：“这是我们迄今为止功能最强大的模型。

”“我们创建了GPT-4，这是OpenAI努力扩展深度学习的最新里程碑GPT-4是一个大型多模态模型（接受图像和文本输入，提供文本输出），虽然在许多现实世界场景中的能力不如人类，但在各种专业和学术基准上表现出人类水平。

”OpenAI介绍道GPT-4比上一个版本强在哪？OpenAI称，虽然这两个版本在随意的谈话中看起来很相似，但“当任务的复杂性达到足够的阈值时，差异就会出现”，GPT-4更可靠、更有创意，并且能够处理更细微的指令。

多模态的引入，让此次发布的GPT相较上一代综合体感明显“更上一层楼”新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题虽然在许多现实场景中不如人类聪明，但在各种专业和学术基准测试中表现出人类水平的性能。

例如GPT-4在模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右OpenAI称，GPT-4比以往任何时候都更具创造性和协作性它可以

业内人士分析，GPT-4较以往版本主要有三大突破，本质上都是更接近“真人”的通用智能：第一，像人一样更具备创造协作输出能力GPT-4具备更有创造性的写作能力，包括编歌曲、写剧本、学习用户写作风格等第二，像人一样具备视觉输入处理分析能力。

可以图文等多模态同时综合分析，给出答案第三，像人一样具备超长文本的处理分析能力可以处理超过25000字长文本英伟达AI科学家Jim Fan点评称，GPT-4最强的其实就是推理能力它在GRE、SAT、法学院考试上的得分，几乎和人类考生没有区别。

也就是说，GPT-4可以全靠自己考进斯坦福了能处理复杂图像信息除了普通图片，GPT-4还能处理更复杂的图像信息，包括表格、考试题目截图、论文截图、漫画等，例如根据专业论文直接给出论文摘要和要点OpenAl表示，在内部评估中，。

GPT-4产生正确回应的可能性要比GPT-3.5高出40%。

据Open AI演示，用户提问：解释下图的笑点是什么，并对图片中的每部分进行描述。GPT-4的回答如下图所示：

GPT-4可接受图像作为输入，并生成字幕、分类和分析以上图为例，输入牛奶、鸡蛋、面粉等食材的图片，GPT-4可以识别图片元素并输出食材用途参考此外，在文本内容长度上，GPT-4能够处理超过25000个单词的文本，支持长篇内容创作、延续对话以及文档搜索和分析等应用场景。

另一个颇引人瞩目的升级，便是此次GPT-4所展现出的强大推理能力在此次发布会上，OpenAI总裁Greg Brockman在现场演示了GPT-4在这方面的能力他直接在纸上画了一个潦草的示意图，拍照发给GPT，并要求其按照这个布局写网页代码。

几乎只需要数秒钟的时间，相应的代码就完成了生成此外，发布会还展示了一个GPT-4的使用场景，那就是把程序运行出错的信息甚至错误信息截图提交给GPT-4，仅凭这部分图片信息，GPT-4都能自动查出错误“这对于整个编程行业来说是具有颠覆性意义的。

”前述互联网人士表示，未来大量基础性的编程都将由人工智能接手据他透露，目前国内许多的互联网公司已经引入GPT，辅助编写程序，“以后这种替代的比例会进一步提高”也正因如此，此次发布会上，OpenAI也明确表示，将在ChatGPT Plus上提供GPT-4，并将其作为API提供给开发人员构建应用程序和服务。

推理能力显著提升已经火遍全球的ChatGPT最显著的局限性之一就是“一本正经地胡说八道”也就是说，ChatGPT回答语言连贯自然、逻辑通顺，但它的回答内容不基于事实，而是基于语言模型这使得人们惊艳于其对话水平的同时，无法信赖其提供的内容。

在此次发布上，OpenAI称，他们花了6个月的时间使用对抗性测试程序和ChatGPT的经验教训对GPT-4进行迭代调整，从而在真实性、可控性等方面取得了有史以来最好的结果在OpenAI的内部评估中，与上一代GPT相比，GPT-4响应不允许的内容的可能性降低了82%，生成事实回复的可能性提高了40%。

并且OpenAI加入了更多人类反馈，包括Azure AI超级计算机上训练的。

Azure的AI优化基础设施也使OpenAI能够将GPT-4交付给全球用户OpenAI也坦承，GPT-4仍然有许多已知的局限性，OpenAI正在努力解决这些问题，例如社会偏见等在GPT-4发布之后，“ChatGPT之父”Sam Altman表示：“它仍然是有缺陷的，仍然是有限的，在你花了更多的时间第一次使用它时，它似乎比实际情况更令人印象深刻。

”百度“文心一言”明将正式发布值得关注的是，明日百度的生成式AI产品“文心一言”也将正式发布；科大讯飞的类ChatGPT技术产品发布将于5月6日进行从目前披露的信息来看，科大讯飞AI学习机、讯飞听见等产品将成为类ChatGPT技术率先落地的产品。

据一财不完全统计，截至今年3月初，A股已有近20家上市公司宣布相关业务已经接入类似ChatGPT技术，或正在研究相关技术与数字人结合的应用场景。

天风证券指出，GPT-4可能成为生成式AI时代的“报晓鸟”，人类思维的“副手”全要素生产率在PC时代飞速增长，在互联网普及后的增长速度略有放缓，而在生成式AI时代，全要素生产率可能会再次加速上升民生证券表示，能够将GPT-4三大新的能力突破集中于一身的应用主要在两个领域：1.视频会议AI助理，同时需要视频图文多模态分析+超长文本理解+创造性总结输出能力；2.机器人为代表的AIoT终端，视觉听觉等多模态感知理解+长文本对话理解+创造性输出。

上海新金融研究院学术委员、中国证监会科技监管局局长姚前表示，ChatGPT的主要魅力在于，它利用从互联网获取的海量训练数据开展深度学习和强化学习有研究预测，按照目前的发展速度，到2026年ChatGPT类大模型的训练将耗尽互联网上的可用文本数据，届时将没有新的训练数据可供使用。