Openai于2025年3月11日发布了Agent SDK和Responses API,OpenAI 推出的 Agent SDK 和 Responses API 是为了解决传统智能体开发中的痛点,比如复杂的提示工程(Prompt Engineering)、协调逻辑复杂等问题。这两个工具可以让开发者和企业能够轻松构建实用且可靠的AI智能体。
Responses API 是一个强大的 API,结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力。它允许开发者通过单次 API 调用,集成多种工具和功能,从而简化复杂任务的处理。
Responses API主要功能:
多工具集成:支持网络搜索、文件搜索、计算机操作等功能,开发者可以在单次调用中完成多种操作。
实时数据交互:通过网络搜索工具,AI 可以获取最新信息并提供引用,适用于需要实时数据的场景。
多轮对话支持:通过响应链将多个交互串联起来,保持对话的连贯性。
企业级数据隐私:基于 Azure 的安全和合规标准,确保数据保护。
Responses API应用
网页搜索:基于 ChatGPT 同款搜索引擎,准确率高达 90%,支持信息溯源和引用标注。
文件搜索:支持多种文件格式,快速检索海量文档,适合企业知识库管理。
电脑控制:允许智能体直接操作电脑,完成网页自动化和数据录入等任务。
Responses API使用代码
//网页搜索示例constresponse=awaitopenai.responses.create({model:"gpt-4o",tools:[{type:"web_search_preview"}],input:"今天发生了什么积极的新闻?"});console.log(response.output_text);//文件搜索示例constproductDocs=awaitopenai.vectorStores.create({name:"产品文档",file_ids:[file1.id,file2.id,file3.id],});constresponse=awaitopenai.responses.create({model:"gpt-4o-mini",tools:[{type:"file_search",vector_store_ids:[productDocs.id],}],input:"OpenAI的深度研究是什么?"});console.log(response.output_text);//电脑控制示例constresponse=awaitopenai.responses.create({model:"computer-use-preview",tools:[{type:"computer_use_preview",display_width:1024,display_height:768,environment:"browser",}],truncation:"auto",input:"我想买个新相机,帮我找到最好的。",});console.log(response.output);Agents SDK 是一个开源框架,用于管理和协调多个 AI 智能体的工作流程。它基于 Swarm 框架升级,支持多智能体协作和复杂任务的编排。
Agents SDK主要功能:
配置化 Agent:轻松定义 Agent 的角色和工具。
智能交接(Handoff):Agent 之间可以无缝交接任务,协作更高效。
安全检查(Guardrails):确保 Agent 的行为符合预期。
追踪与可观测性(Tracing & Observability):实时监控 Agent 的运行状态,便于调试和优化。
Agents SDK使用代码
fromopenai_agentimportAgent,function_tool@function_tooldefsubmit_refund_request(refund_amount:float,reason:str):"""提交退款申请"""print(f"提交退款申请,金额:{refund_amount},原因:{reason}")return{"success":True}#定义Agentshopping_agent=Agent(name="ShoppingAssistant",instructions="你是一个购物助手,可以搜索网络商品信息。",tools=[WebSearchTool()],)triage_agent=Agent(name="TriageAgent",instructions="引导用户到正确的客服Agent。",)support_agent=Agent(name="SupportAgent",instructions="你是一个客服Agent,可以提交退款。",tools=[submit_refund_request],)企业自动化:通过 Responses API 和 Agents SDK,企业可以构建自动化的 AI 工作流,例如处理订单、客户服务、数据处理等。
复杂任务处理:在需要多步骤操作的场景中,如电商购物助手、法律研究或金融建模,这些工具可以显著提高效率。
多模态交互:支持智能体通过计算机操作工具执行任务,例如在浏览器中自动完成搜索或填写表单。
GitHub代码库:https://github.com/openai/openai-agents-python
OpenAI Agents SDK 是一个轻量级但功能强大的框架,用于构建多智能体工作流。它支持任务交接、安全检查、工具调用和内置跟踪功能,非常适合需要复杂智能体协作的企业自动化场景。
tortoise-tts学习资料汇总 - 高质量多声音TTS系统
2024-12-31
PaddleSpeech入门学习资料汇总 - 开源语音AI工具包
2025-01-02
pot-desktop使用指南 - 跨平台划词翻译和OCR软件
2025-01-02
understand-prompt学习资料汇总 - AI助手的探索与应用
2025-01-02
GPT4All学习资源汇总 - 在本地设备上运行大型语言模型
2025-01-02
2025-01-02
wechat-bot入门指南 - 基于ChatGPT的微信聊天机器人
2025-01-02
Cheetah - AI助手学习资料汇总 - Mac应用助力远程技术面试
2025-01-02
AI代码翻译器学习资料汇总 - 使用AI将代码从一种语言翻译成另一种语言
2025-01-02