电话:13485538018
关闭
您当前的位置:首页 > 职场资讯 > HR资讯

GPT-5有多强大?在编程、创意写作、健康领域优势尽显

来源:网络整理 时间:2025-08-10 作者:佚名 浏览量:

GPT-5拥有编程、创意写作、健康领域三大优势

依据OpenAI的介绍,GPT-5被誉为OpenAI的“最强大模型”,在三个关键领域取得了显著的进步。

首先,我们得提到编程能力。GPT-5作为OpenAI目前最强大的编码模型,其在前端复杂内容的生成以及大型代码库的调试上有着卓越的表现。它甚至可以凭借一个简单的提示,轻松打造出既美观又响应式的网站、应用程序App以及游戏。在早期的测试中,测试者们已经注意到了它在设计选择上的诸多改进,比如间距、排版和留白等方面。

在GitHub上获取的针对现实世界编码任务的基准测试SWE-bench Verified中,GPT-5经过深思熟虑后,首次尝试的准确率达到了74.9%,这一成绩超过了OpenAI的推理模型o3的69.1%,以及GPT-4o的30.8%。

评论表明,这一结果暗示GPT-5的表现在某些方面略优于Anthropic于周二发布的Claude Opus 4.1以及谷歌DeepMind的Gemini 2.5 Pro。在SWE-bench Verified测试中,Claude Opus 4.1的得分为74.5%,而Gemini 2.5 Pro的得分为59.6%。

然而,在针对数学、人文学科以及自然科学领域模型性能进行评估的专家级测试Humanity’s Last Exam中,具备拓展推理能力的GPT-5 pro增强型版本在借助工具辅助的情况下,取得了42%的得分。这一成绩略逊于得分为44.4%的xAI模型Grok 4 Heavy。

奥尔特曼指出,GPT-5在启动整个软件App方面表现尤为出色,这便是所谓的“氛围编码”,即通过AI依据自然语言提示来生成功能代码,进而显著提升开发效率。

以实例来说,OpenAI的研究团队向GPT-5提出了一个任务,即设计一款针对英语学习者的法语学习网页应用程序,该应用需具备吸引人的主题设计,并包括记忆卡片、测试题、经典的贪吃蛇游戏,以及记录每日学习进展的功能。

研究人员将一致的提示输入至两个GPT-5界面中,经过数分钟的处理,分别生成了两款各异的App。OpenAI的管理者指出,这些应用存在某些不足,然而用户可以依据自己的偏好对AI所创造的软件进行个性化修改,比如调整界面背景或是增加额外的标签页。

在创意写作领域,GPT-5具备应对复杂写作任务的能力,无论是创作韵律独特的五音步诗,还是撰写流畅自如的自由诗,其表现都堪比诗人。OpenAI公司GPT业务的高级副总裁Nick Turley评价称,GPT-5在创意性任务上的表现更胜一筹,其品味更为卓越,且对自然语言的响应更加流畅自然。

健康咨询是第三个重要提升领域。

GPT-5在识别可能的健康隐患方面表现得更为主动,并协助用户解读医疗报告,尽管OpenAI明确指出,GPT无法取代医疗专家。

在HealthBench Hard Hallucinations这项测试里,具备思考功能的GPT-5模型产生的幻觉错误信息比率仅为1.6%。这一比率显著低于GPT-4o和GPT-03模型,它们的错误信息比率分别达到了15.8%和12.9%。

幻觉可能性显著降低 新的安全训练模式

重磅!OpenAI正式发布GPT-5:一键生成网页、写作像诗人、更懂健康问题!微软抢先接入,免费体验__重磅!OpenAI正式发布GPT-5:一键生成网页、写作像诗人、更懂健康问题!微软抢先接入,免费体验

OpenAI表示,GPT-5在可靠性及实用性方面相较于以往模型有了显著提升,其对于现实世界问题的解答更为精准,且产生幻觉的概率大幅减少。

在对GPT生产流量的匿名提示词实施网络搜索之后,GPT-5生成的回答中事实性错误的概率较GPT-4o降低了大约45%;经过深思熟虑,GPT-5的回答中事实性错误的概率又比o3减少了大约80%。从下图中可以观察到,GPT-5的错误信息率仅为4.8%,而GPT-4o为20.6%,o3则为22%。

OpenAI透露,他们为GPT-5引入了一种创新的安全训练方法,这种方法被称作安全补全。该方法旨在指导模型在确保安全的前提下,尽可能地提供最有价值的回答。在某些情况下,这可能表现为仅对用户的问题进行部分解答,亦或是仅提供概括性的高阶回答。

若用户选择拒绝,经过专业训练的GPT-5将以清晰的方式向用户解释拒绝的缘由,并给出可靠的安全替代选项。

在经过严格控制的实验以及OpenAI开发的生产模型中,OpenAI观察到这种安全补全技术展现出了更为精准的特点,它能够更有效地指导双重用途问题,提升对含糊意图的适应性,同时还能降低不必要的过度拒绝情况。

OpenAI的培训主管Michelle Pokrass指出,GPT-5已经完成训练,具备识别任务何时无法完成的智能,能够避免盲目猜测,并且能够更明确地阐述其局限性,与之前的模型相比,这显著降低了无根据的推测。

推出四种可选的GPT聊天预设性格

OpenAI表示,GPT-5在执行指令的技能上有所增强,同时其处理个性化指令的能力也有所进步。为此,OpenAI计划向所有GPT用户推出包含四种预设性格的全新研究预览版本。

四种性格设定——愤世嫉俗者、机器人、倾听者和书呆子——均为用户所可选,且可在个人设置中进行自由切换,以便与GPT的交流模式相契合。

这四种性格特性最初是在文本交流场景中使用的,随后计划推广至语音交流领域,使用户能够不依赖自定义提示词就能调整GPT的交流模式——无论是追求简洁与专业的,还是注重细致关怀的,亦或是带有一定幽默讽刺意味的。

另外,微软在GPT-5正式发布的当天,便宣布将其融入其众多产品之中。在企业应用层面,Microsoft 365 Copilot将借助GPT-5的强大能力,更高效地解决复杂问题,并在长篇对话中保持高度专注,同时准确把握用户的具体情境。企业用户将能够利用这一推理功能,更便捷地处理电子邮件、文档以及各类文件。

消费者将享受到Microsoft Copilot新智能模式带来的便利,该模式借助GPT-5技术助力用户探寻最合适的解决方案。用户可以登录copilot.microsoft.com,或通过安装在Windows、Mac、Android和iOS设备上的Copilot应用程序,免费体验GPT-5的功能。

开发者将借助GitHub Copilot与Visual Studio Code享受GPT-5的辅助,以实现代码的编写、测试与部署。Azure AI Foundry平台将全面提供GPT-5的各类模型,并配备智能模型路由器,该路由器能够根据任务的复杂程度、性能要求以及成本效益等因素,自动选择最适宜的模型。

每日经济新闻综合OpenAI官网、公开资料

每日经济新闻

微信扫一扫分享资讯
客服服务热线
13485538018
24小时服务
微信公众号
手机浏览

CopyrightC 2009-2025 All Rights Reserved 版权所有 芜湖人才网 本站内容仅供参考,不承担因使用信息、外部链接或服务中断导致的任何直接或间接责任,风险自担。如有侵权,请联系删除,联系邮箱:ysznh@foxmail.com 鄂ICP备2025097818号-15

地址: EMAIL:qlwl@foxmail.com

Powered by PHPYun.

用微信扫一扫