当前所在位置:首页    行业资讯    OpenAI 发布 ChatGPT Agent,智能体技术迈新阶

OpenAI 发布 ChatGPT Agent,智能体技术迈新阶

  2025-07-18   42  来源:电子工程专辑

OpenAI 于7月7日正式推出了 ChatGPT Agent。这款整合了 Operator 网页交互能力、Deep Research 信息整合技术及 ChatGPT 对话优势的智能体系统,被该公司首席执行官山姆・奥特曼(Sam Altman)定义为 “AI 系统能力的新高度”。

据悉,ChatGPT Agent 的核心竞争力在于构建了 “自主思考 - 工具选择 - 行动执行 - 动态优化” 的完整闭环。用户通过自然语言下达指令后,系统可独立完成任务拆解、工具调用、过程调整等全流程操作,覆盖浏览网站、运行代码、生成演示文稿、预订服务等多元场景。

在直播演示中,该系统展现了两类典型应用:个人场景中,能为婚礼策划自动完成服装挑选、酒店预订及礼物筛选;工作场景中,可分析竞争对手数据并生成带可视化图表的幻灯片。值得注意的是,任务执行过程支持用户随时中断、修改指令,系统会保留上下文信息并从中断处继续推进,确保协作灵活性。

目前,ChatGPT Agent 面向 ChatGPT Pro、Plus 和 Team 用户开放。使用权限方面,Pro 用户每月可调用 400 次,Plus 与 Team 用户每月可调用 40 次,额外使用量可通过付费扩展。部署计划显示,Pro 版预计本月底完成上线,Plus 和 Team 版将紧随其后,企业版与教育版也将在未来几周内逐步推出。

功能设计上,系统支持重复性任务自动化设置,例如配置每周一自动生成周度业务报告,进一步释放用户在常规事务中的时间成本。

OpenAI 在强调 ChatGPT Agent 功能优势的同时,也明确提示了潜在风险,尤其是 prompt injection(提示注入)攻击可能导致的指令篡改或隐私泄露。为此,系统构建了多层安全防护体系:

操作授权机制:执行敏感操作(如提交订单、访问个人数据、进行支付)前,需获得用户明确确认;

风险任务拦截:主动拒绝金融交易、敏感法律互动等高风险任务;

动态安全监测:通过强化训练识别恶意指令,建立指令优先级体系,优先执行可信指令并忽略潜在风险指令;

隐私控制功能:用户可一键删除浏览数据并退出所有活跃会话,远程浏览器操作数据不存储于 OpenAI 服务器。

Sam Altman在直播中表示,我们认为,从实际应用中学习至关重要,同时人们也应在我们更好地量化和缓解潜在风险的过程中,谨慎、逐步地采用这些工具。与其他新的能力层级一样,社会、技术以及风险缓解策略需要协同发展。

据OpenAI公布的测试数据显示,ChatGPT Agent 在多项权威评估中达到行业领先水平(SOTA):在 “人类终极考试” 中,单次尝试通过率达 41.6%,采用并行策略时提升至 44.4%;“前沿数学” 基准测试准确率达 27.4%,显著超越前代模型。

在实用场景测试中,其表现同样突出:DSBench 数据科学任务测试中超越人类水平;SpreadsheetBench 电子表格处理测试得分 45.5%,远超 Excel Copilot 的 20.0%;在投资银行分析师建模任务评估中,性能显著优于 Deep Research 及 o3 模型。

行业反响方面,部分用户认为其整合了此前工具的优势,解决了单一功能局限,有望推动生产力变革;也有观点关注其稳定性与风险控制,期待通过实际应用进一步验证其成熟度。

OpenAI 表示,此次发布仅是智能体功能集成的第一步,未来将以定期节奏迭代升级,逐步提升效率与多功能性,让 ChatGPT Agent 覆盖更广泛用户与场景。

随着这一系统的落地,AI 智能体的实用化进程加速,但其安全边界与社会影响仍待实践检验。