GPT-5有多强大？在编程、创意写作、健康领域优势尽显

来源：网络整理 时间：2025-08-10 作者：佚名 浏览量：

GPT-5拥有编程、创意写作、健康领域三大优势

依据OpenAI的介绍，GPT-5被誉为OpenAI的“最强大模型”，在三个关键领域取得了显著的进步。

首先，我们得提到编程能力。GPT-5作为OpenAI目前最强大的编码模型，其在前端复杂内容的生成以及大型代码库的调试上有着卓越的表现。它甚至可以凭借一个简单的提示，轻松打造出既美观又响应式的网站、应用程序App以及游戏。在早期的测试中，测试者们已经注意到了它在设计选择上的诸多改进，比如间距、排版和留白等方面。

在GitHub上获取的针对现实世界编码任务的基准测试SWE-bench Verified中，GPT-5经过深思熟虑后，首次尝试的准确率达到了74.9%，这一成绩超过了OpenAI的推理模型o3的69.1%，以及GPT-4o的30.8%。

评论表明，这一结果暗示GPT-5的表现在某些方面略优于Anthropic于周二发布的Claude Opus 4.1以及谷歌DeepMind的Gemini 2.5 Pro。在SWE-bench Verified测试中，Claude Opus 4.1的得分为74.5%，而Gemini 2.5 Pro的得分为59.6%。

然而，在针对数学、人文学科以及自然科学领域模型性能进行评估的专家级测试Humanity’s Last Exam中，具备拓展推理能力的GPT-5 pro增强型版本在借助工具辅助的情况下，取得了42%的得分。这一成绩略逊于得分为44.4%的xAI模型Grok 4 Heavy。

奥尔特曼指出，GPT-5在启动整个软件App方面表现尤为出色，这便是所谓的“氛围编码”，即通过AI依据自然语言提示来生成功能代码，进而显著提升开发效率。

以实例来说，OpenAI的研究团队向GPT-5提出了一个任务，即设计一款针对英语学习者的法语学习网页应用程序，该应用需具备吸引人的主题设计，并包括记忆卡片、测试题、经典的贪吃蛇游戏，以及记录每日学习进展的功能。

研究人员将一致的提示输入至两个GPT-5界面中，经过数分钟的处理，分别生成了两款各异的App。OpenAI的管理者指出，这些应用存在某些不足，然而用户可以依据自己的偏好对AI所创造的软件进行个性化修改，比如调整界面背景或是增加额外的标签页。

在创意写作领域，GPT-5具备应对复杂写作任务的能力，无论是创作韵律独特的五音步诗，还是撰写流畅自如的自由诗，其表现都堪比诗人。OpenAI公司GPT业务的高级副总裁Nick Turley评价称，GPT-5在创意性任务上的表现更胜一筹，其品味更为卓越，且对自然语言的响应更加流畅自然。

健康咨询是第三个重要提升领域。

GPT-5在识别可能的健康隐患方面表现得更为主动，并协助用户解读医疗报告，尽管OpenAI明确指出，GPT无法取代医疗专家。

在HealthBench Hard Hallucinations这项测试里，具备思考功能的GPT-5模型产生的幻觉错误信息比率仅为1.6%。这一比率显著低于GPT-4o和GPT-03模型，它们的错误信息比率分别达到了15.8%和12.9%。

幻觉可能性显著降低新的安全训练模式

重磅！OpenAI正式发布GPT-5：一键生成网页、写作像诗人、更懂健康问题！微软抢先接入，免费体验__重磅！OpenAI正式发布GPT-5：一键生成网页、写作像诗人、更懂健康问题！微软抢先接入，免费体验

OpenAI表示，GPT-5在可靠性及实用性方面相较于以往模型有了显著提升，其对于现实世界问题的解答更为精准，且产生幻觉的概率大幅减少。

在对GPT生产流量的匿名提示词实施网络搜索之后，GPT-5生成的回答中事实性错误的概率较GPT-4o降低了大约45%；经过深思熟虑，GPT-5的回答中事实性错误的概率又比o3减少了大约80%。从下图中可以观察到，GPT-5的错误信息率仅为4.8%，而GPT-4o为20.6%，o3则为22%。

OpenAI透露，他们为GPT-5引入了一种创新的安全训练方法，这种方法被称作安全补全。该方法旨在指导模型在确保安全的前提下，尽可能地提供最有价值的回答。在某些情况下，这可能表现为仅对用户的问题进行部分解答，亦或是仅提供概括性的高阶回答。

若用户选择拒绝，经过专业训练的GPT-5将以清晰的方式向用户解释拒绝的缘由，并给出可靠的安全替代选项。

在经过严格控制的实验以及OpenAI开发的生产模型中，OpenAI观察到这种安全补全技术展现出了更为精准的特点，它能够更有效地指导双重用途问题，提升对含糊意图的适应性，同时还能降低不必要的过度拒绝情况。

OpenAI的培训主管Michelle Pokrass指出，GPT-5已经完成训练，具备识别任务何时无法完成的智能，能够避免盲目猜测，并且能够更明确地阐述其局限性，与之前的模型相比，这显著降低了无根据的推测。

推出四种可选的GPT聊天预设性格

OpenAI表示，GPT-5在执行指令的技能上有所增强，同时其处理个性化指令的能力也有所进步。为此，OpenAI计划向所有GPT用户推出包含四种预设性格的全新研究预览版本。

四种性格设定——愤世嫉俗者、机器人、倾听者和书呆子——均为用户所可选，且可在个人设置中进行自由切换，以便与GPT的交流模式相契合。

这四种性格特性最初是在文本交流场景中使用的，随后计划推广至语音交流领域，使用户能够不依赖自定义提示词就能调整GPT的交流模式——无论是追求简洁与专业的，还是注重细致关怀的，亦或是带有一定幽默讽刺意味的。

另外，微软在GPT-5正式发布的当天，便宣布将其融入其众多产品之中。在企业应用层面，Microsoft 365 Copilot将借助GPT-5的强大能力，更高效地解决复杂问题，并在长篇对话中保持高度专注，同时准确把握用户的具体情境。企业用户将能够利用这一推理功能，更便捷地处理电子邮件、文档以及各类文件。

消费者将享受到Microsoft Copilot新智能模式带来的便利，该模式借助GPT-5技术助力用户探寻最合适的解决方案。用户可以登录copilot.microsoft.com，或通过安装在Windows、Mac、Android和iOS设备上的Copilot应用程序，免费体验GPT-5的功能。

开发者将借助GitHub Copilot与Visual Studio Code享受GPT-5的辅助，以实现代码的编写、测试与部署。Azure AI Foundry平台将全面提供GPT-5的各类模型，并配备智能模型路由器，该路由器能够根据任务的复杂程度、性能要求以及成本效益等因素，自动选择最适宜的模型。

每日经济新闻综合OpenAI官网、公开资料

每日经济新闻

微信扫一扫分享资讯

上一篇：警惕！日本治安恶化犯罪率激增，中国使下一篇：印度因购俄能源被美国盯上，关税升至5

GPT-5有多强大？在编程、创意写作、健康领域优势尽显

用微信扫一扫