OpenAI 发布 ChatGPT Agent，智能体技术迈新阶

2025-07-18 232 来源：电子工程专辑

OpenAI 于7月7日正式推出了 ChatGPT Agent。这款整合了 Operator 网页交互能力、Deep Research 信息整合技术及 ChatGPT 对话优势的智能体系统，被该公司首席执行官山姆・奥特曼（Sam Altman）定义为 “AI 系统能力的新高度”。

据悉，ChatGPT Agent 的核心竞争力在于构建了 “自主思考 - 工具选择 - 行动执行 - 动态优化” 的完整闭环。用户通过自然语言下达指令后，系统可独立完成任务拆解、工具调用、过程调整等全流程操作，覆盖浏览网站、运行代码、生成演示文稿、预订服务等多元场景。

在直播演示中，该系统展现了两类典型应用：个人场景中，能为婚礼策划自动完成服装挑选、酒店预订及礼物筛选；工作场景中，可分析竞争对手数据并生成带可视化图表的幻灯片。值得注意的是，任务执行过程支持用户随时中断、修改指令，系统会保留上下文信息并从中断处继续推进，确保协作灵活性。

目前，ChatGPT Agent 面向 ChatGPT Pro、Plus 和 Team 用户开放。使用权限方面，Pro 用户每月可调用 400 次，Plus 与 Team 用户每月可调用 40 次，额外使用量可通过付费扩展。部署计划显示，Pro 版预计本月底完成上线，Plus 和 Team 版将紧随其后，企业版与教育版也将在未来几周内逐步推出。

功能设计上，系统支持重复性任务自动化设置，例如配置每周一自动生成周度业务报告，进一步释放用户在常规事务中的时间成本。

OpenAI 在强调 ChatGPT Agent 功能优势的同时，也明确提示了潜在风险，尤其是 prompt injection（提示注入）攻击可能导致的指令篡改或隐私泄露。为此，系统构建了多层安全防护体系：

操作授权机制：执行敏感操作（如提交订单、访问个人数据、进行支付）前，需获得用户明确确认；

风险任务拦截：主动拒绝金融交易、敏感法律互动等高风险任务；

动态安全监测：通过强化训练识别恶意指令，建立指令优先级体系，优先执行可信指令并忽略潜在风险指令；

隐私控制功能：用户可一键删除浏览数据并退出所有活跃会话，远程浏览器操作数据不存储于 OpenAI 服务器。

Sam Altman在直播中表示，我们认为，从实际应用中学习至关重要，同时人们也应在我们更好地量化和缓解潜在风险的过程中，谨慎、逐步地采用这些工具。与其他新的能力层级一样，社会、技术以及风险缓解策略需要协同发展。

据OpenAI公布的测试数据显示，ChatGPT Agent 在多项权威评估中达到行业领先水平（SOTA）：在 “人类终极考试” 中，单次尝试通过率达 41.6%，采用并行策略时提升至 44.4%；“前沿数学” 基准测试准确率达 27.4%，显著超越前代模型。

在实用场景测试中，其表现同样突出：DSBench 数据科学任务测试中超越人类水平；SpreadsheetBench 电子表格处理测试得分 45.5%，远超 Excel Copilot 的 20.0%；在投资银行分析师建模任务评估中，性能显著优于 Deep Research 及 o3 模型。

行业反响方面，部分用户认为其整合了此前工具的优势，解决了单一功能局限，有望推动生产力变革；也有观点关注其稳定性与风险控制，期待通过实际应用进一步验证其成熟度。

OpenAI 表示，此次发布仅是智能体功能集成的第一步，未来将以定期节奏迭代升级，逐步提升效率与多功能性，让 ChatGPT Agent 覆盖更广泛用户与场景。

随着这一系统的落地，AI 智能体的实用化进程加速，但其安全边界与社会影响仍待实践检验。