一、基础概念界定
1. 人工智能(AI)
- 定义:接受训练可模拟人类智能的计算系统,具备学习功能,能依据经验与新数据提升性能,通过多种输入解决问题、实现目标。
- 关键分支:生成式 AI 可独立决策并采取行动,应用于自动驾驶汽车、媒体推荐引擎、DALL-E 和 Midjourney 等图像生成工具;企业 AI 是将生成式 AI 及相关技术应用于业务工作负载,利用企业数据增强系统,如客户服务、个性化营销、HR 和财务助手。
2. AI Agent
- 核心定义:软件实体,可接收任务、感知环境、按角色执行操作并从经验中调整,能依据设定目标,结合训练内容、所属应用及运行环境制定计划、完成任务,还具备学习迭代、扮演特定角色、连接数据源和自主决策的能力。
- 关联概念:Agentic AI 指专注于积极追求目标,而非仅执行简单任务或响应查询的系统,自主生成式系统可主动启动操作,如客户服务 AI 主动向承运商查询运输延迟情况;与检索增强生成(RAG)结合,能让大语言模型利用企业或特定角色的外部数据源,生成更丰富、准确且贴合受众的回复,例如 IT 支持服务 Agent 可结合客户互动历史解决问题,并提供文档链接或创建服务单。
二、AI Agent 核心解析
1. 工作原理
AI Agent 融合多种技术实现目标,以推荐 Agent 和客户服务 Agent 为例:
- 推荐 Agent:运用机器学习分析大量数据集识别模式,借助自然语言处理理解用户请求并沟通,通过与企业工具(如 ERP 系统、数据库、物联网传感器)或外部数据源(如互联网)的接口收集信息。
- 客户服务 Agent(查询货物位置):首先访问含特定订单信息(发运 ID、交货方法、下单日期)的数据库;接着用这些数据通过 Web 服务界面查询承运商数据库,获取实时跟踪信息和预计交货日期;同时查看货物当前位置及过往运输时长,若遇特殊情况(如飓风影响运输),可推断物流延时并告知客户。
2. 优势
| 优势类别 | 具体说明 |
|---|---|
| 全天候可用 | 可持续运行无停机时间,通过云端部署,能在客户、员工等目标用户所在的任何地点操作 |
| 准确性 | 执行重复性任务时减少人为错误,依托大量数据做更准确决策(需确保数据源准确、及时更新且完整),还能判断自身是否有足够信息做高质量决策,必要时主动获取更多数据 |
| 一致性 | 遵循规范性流程和程序,保证每个任务执行方式一致,大幅减少因人类疲劳或员工操作差异导致的结果不同 |
| 节约成本 | 自动执行重复性任务降低运营成本,发现并提出流程优化建议,减少因错误造成的金钱损失 |
| 数据分析能力 | 处理和解释大量数据集,用于长期计划、欺诈检测、预测性维护(避免设备故障)等分析活动,自身无法分析时可调用其他工具 |
| 高效性 | 自动执行任务和流程,让人类员工专注于更复杂、具战略性的工作,且全年无休无需放假 |
| 个性化 | 助力企业开展 AI 驱动的营销活动,精准触达特定客户群,提高转化率并降低营销成本,满足消费者对企业记住其购买历史、偏好等信息的需求 |
| 可扩展性 | 相较于招聘新员工,部署和拓展 AI Agent 更简单、成本更低,但需慎重为其安排新角色,评估新任务工作质量,确保数据和资源充足,同时培训员工充分利用 Agent |
3. 挑战
- 适应性问题:虽能随时间学习改进,但面对快速变化的环境、意外请求或结果时会遇挑战,易出现过拟合(模型过度适应训练数据,难以处理新数据),且能力范围有限,无法胜任超出自身定位的任务。
- 复杂性难题:专注于特定、机械化任务的 AI Agent 较易使用,但若任务复杂度提升、涉及功能变广,设计、实施和维护难度会显著增加,需从小范围尝试逐步推进。
- 数据依赖风险:高质量数据是 AI Agent 良好表现的关键,与人力资本管理、ERP 等系统集成的 Agent 虽有数据优势,但需优化以处理交互和数据交换,企业需确保数据源准确、及时且可用。
- 解释性局限:初代生成式 AI 系统是 “黑匣子”,输出难解析;Agent 虽能更好解释决策过程和参考数据,从简单任务逐步过渡到复杂工作以帮助企业专业人士理解,但仍存在一定解释门槛。
- 资源密集需求:与其他 AI 一样,需大量计算能力和存储资源,云技术应用的 Agent 依赖提供商配置合适资源,本地部署的 Agent 则需 IT 部门保障资源充足。
- 安全隐患:需访问企业专有信息且可能记录交易结果,存在敏感数据泄露风险;可能成为不良行为者的新攻击途径,要求企业安全团队掌握新技能,持续评估数据丢失风险,并建立完善的安全控制机制。
4. 组成部分
- 行动:通过执行器或接口与环境交互,包括物理行动(转动旋钮、操作自动驾驶汽车、控制机械臂)、认知行动(在多个选项中决策、列出实现目标的方法)、沟通行动(撰写电子邮件、转录音频、问答互动)。
- 目标 / 效用:目标定义期望结果,如人力资源数字助手根据招聘人员和经理意见制定职位描述;效用衡量目标实现程度,以数值表示,如游戏 Agent 效用可通过获胜次数衡量,自动驾驶汽车效用基于安全记录和骑手得分评估。
- 学习:从完成的任务中吸取经验改善结果,虽 LLM 停止训练后不再学习,但 Agent 可通过观察专有数据与问题的组合效果提升任务表现,还能通过有监督学习、无监督学习、强化学习等额外训练获取新知识,如招聘人员对 Agent 生成的职位描述打分,可指导 Agent 未来优化。
- 记忆力:存储过去经验信息,检索并用于决策以适应变化情况,是 Agent 长期提升性能的关键。
- 感知:借助传感器或其他机制收集环境信息,如摄像头识别物体和检测模式,麦克风捕捉处理语音提问,传感器还可辅助操纵物体或在物理世界导航。
- 推理:基于数据、规则、概率和学习模式做逻辑决策,识别多种选择并依据可用信息和结果标准确定理想行动方案,是 Agent 决策的基础。
5. 类型
| 类型 | 核心特点 | 示例 |
|---|---|---|
| 简单反射 Agent | 依据一组条件 / 动作规则行动,仅根据输入响应,不考虑广泛上下文或历史 | 仅能响应预定义关键字或短语的简单聊天机器人 |
| 基于模型的反射 Agent | 拥有与功能相关的环境内部模型,决策前会考虑当前情况和操作影响 | 自动驾驶汽车,需追踪周围道路事物运动,决定行驶速度及应对障碍物的措施 |
| 基于目标的 Agent | 在反射 Agent 基础上构建,根据长期目标规划行动,决策过程更复杂 | 国际象棋、围棋 Agent,需提前预测多步棋路,制定获胜策略(可能短期牺牲) |
| 基于效用的 Agent | 按所需效用决策,效用即一段时间内目标实现的成功程度,选择更具战略性、能提升积极结果或减少消极结果的行动,可平衡竞争目标 | 致力于减少能源使用或增加高利润产品销量的 Agent |
| 学习 Agent | 摄取新数据,根据与用户的交互调整响应,持续提高性能 | 电影、音乐、商品推荐引擎,推荐准确性随时间提升 |
三、AI Agent 实践应用
1. 使用场景
| 领域 | 具体应用 | 说明 |
|---|---|---|
| 交通 | 自动驾驶汽车 | 根据周围环境导航并做出决策 |
| 媒体娱乐 | 内容推荐 | Netflix、YouTube 等平台通过个性化内容提高用户参与度 |
| 客户服务 | 自动聊天机器人 | 回答超出预制答案的客户查询,提升客户满意度 |
| 金融 | 自动交易系统、欺诈检测 | 辅助金融服务公司开展交易和风险防控工作 |
| 游戏 | NPC(非玩家角色) | 通过自适应行为让游戏开发人员专注于主线开发 |
| 医疗卫生 | 疾病诊断、患者护理管理 | 基于匿名患者记录和医学图像训练,识别模式以预测结果、风险因素并提出方案 |
| 个人辅助 | 虚拟助手(Siri、Google Assistant) | 通过与客户交互学习,提供日常服务 |
| 零售 | 个性化沟通与推荐 | 如 Neostar 二手车平台的 Agent,通过电子邮件向客户发送产品推荐和选车建议,吸引客户访问网站 |
| 制造业 | 机器人控制 | AI 驱动的机器人在制造和装配线中执行拣货、打包、质量控制等任务 |
| 智能家居 | 家庭自动化管理、安全防护 | 管理家庭自动化系统、回答口头问题,借助 AI 检测和应对安全摄像头、门铃、警报器的潜在威胁 |
| 供应链 | 库存与物流优化 | 分析库存数据识别滞销商品、检测需求模式变化,调整库存水平以降低持有成本 |
2. 6 个优秀实践
- 设定明确目标:定义可实现、可衡量、可量化的目标,避免模糊表述,确保目标在 Agent 能力和资源范围内;制定 KPI 衡量成功率,利用数据优化模型。
- 持续学习:虽微调 Agent 核心 LLM 不实际,但可改善决策和任务所需数据;嵌入应用的 Agent 由供应商决定 LLM 训练完善时机及交互记录存储调用方式;定制 Agent 需更频繁优化记忆技术和数据输入频率;企业自建 Agent 需提前制定相关流程并灵活调整。
- 文档管理:技术文档需包含 Agent 组件、数据流、决策过程图表,新代码、算法模型及操作数据记录;运营文档需有用户交互手册、IT 维护指南(含故障排除)、数据源集成说明;同时跟踪共享 Agent 性能 KPI,生成结果图表。
- 人工监督:像培养新员工一样,逐步向 Agent 分配任务并监督成果;提供全面监督直至团队信任其自主工作,分配监督角色并纳入治理结构,确保人员可干预且 Agent 能接收人工反馈。
- 鲁棒性测试:部署前后在不同场景全面审核 Agent,开展验证性测试以基准或实际流程结果衡量性能;单独测试各组件并观察交互情况,确保 Agent 从外部系统(ERP、数据库)提取数据无瓶颈,同时进行用户体验测试。
- 安全措施:对 Agent 使用的数据加密并在适当时匿名化,建立强大访问控制;将网络、基础设施安全,安全编码,监视与事件响应及保障实践扩展到 AI 系统;AI 卓越中心需在 Agent 上线监督管理中发挥关键作用,无该中心则需及时构建。
3. 实施步骤
以零售商上线需求预测 Agent(为开学季规划)为例:
- 定义任务与目标:明确 Agent 任务为预测背包、笔记本、儿童服装等产品需求,列出具体目标。
- 确定关键要素:梳理功能流程、所需访问数据(历史销售数据、市场趋势、经济指标、客户人口统计与购买历史、季节性趋势数据、促销活动历史)、相关业务专家及可访问的工具和其他 Agent。
- 系统集成与专家协作:将 Agent 与库存管理、ERP、供应链计划工具等集成,邀请产品线人类专家提供见解,提升预测准确性。
- 反馈与优化:定期评估 Agent 表现,收集客户和专家反馈,确定改进领域,必要时与软件提供商合作调整;同时确保具备足够计算资源,避免性能问题影响项目推进。
4. 示例
| 类别 | 具体示例 | 说明 |
|---|---|---|
| 对话式 Agent | 工业环境中的交互 Agent | 可与制造设备、物联网设备交互,也能与人类或其他软件程序交互 |
| 功能性 Agent(用户代理 Agent) | 招聘经理 Agent | 执行记录候选人技能和经验等需求,协助撰写并发布招聘启事的任务 |
| 现场服务 Agent | 为技术人员提供信息,自动安排日程,辅助诊断,助力高效现场服务工作流 | |
| 应收账款文员 Agent | 简化付款处理,启动催款程序改善现金流,生成应收账款绩效报告 | |
| 客户支持 Agent | 为人工客服或客户提供信息,增强客户支持职能 | |
| 体检场景相关 Agent | 接待员 Agent 办理体检手续,护士 Agent 测量体重、血压等生命体征,汇总访问信息的 Agent 协助医生 | |
| 监督 Agent | 用户代理监督型 Agent | 像乐团领导者一样带领其他 Agent,推动目标实现所需的计划和推理,可决定替人类行动或联系他人获取人机反馈 |
| 效用 Agent(基于任务的 Agent) | 编程 Agent | 使用 HTML、Java、Python 等语言执行特定任务 |
| 对话式 Agent | 接收人类任务,按发起方需求沟通工作流任务结果 | |
| 文本生成 Agent | 汇总正文、生成文本范例,为长篇稿件提供思路 | |
| 数据库查询 Agent | 执行 SQL 查询等数据检索相关任务 | |
| RAG Agent | 协调检索 LLM 所需的特定新数据,辅助其响应提示词或执行任务 | |
| 调度程序 Agent | 安排与利益相关者的会议以推进项目 | |
| 搜索 Agent | 确定 Web 搜索、文档搜索等理想搜索类型,调用适当工具执行任务 | |
| 技能提升 Agent | 依据文档推荐完成任务(如创建招聘信息、员工创建概要信息)所需技能 |
四、OCI Generative AI Agents 介绍
- 核心能力:结合 LLM 和 RAG 功能,支持员工、合作伙伴、客户直接查询经企业数据扩充的知识库;可快速创建个性化 AI Agent,并嵌入企业商业应用和流程;通过自然语言界面提供信息更新,允许用户直接执行操作。
- 产品动态:OCI Generative AI RAG Agent 已作为首批 Oracle AI Agent 正式上市,旨在解决传统聊天机器人回复无法解决问题的痛点,为用户提供情境化、准确的信息,同时助力企业提升服务质量。
五、常见问题解答(FAQ)
1. AI Agent 有哪些类型?
包括简单反射 Agent、基于模型的反射 Agent、基于目标的 Agent、基于效用的 Agent、学习 Agent:
- 简单反射 Agent:按条件 / 动作规则行动,仅响应输入,不考虑上下文。
- 基于模型的反射 Agent:有环境内部模型,决策前考虑当前情况和操作影响。
- 基于目标的 Agent:在反射 Agent 基础上,按长期目标规划行动。
- 基于效用的 Agent:具备特定功能,可被其他 Agent 调用执行任务(如查询数据库、发邮件)。
- 学习 Agent:摄取新数据,根据用户交互调整响应,提升性能。
2. AI Agent 有哪些真实例子?
企业层面:Oracle Digital Assistant 会话式 AI 平台,企业可借助其创建客户服务等应用的聊天机器人和虚拟助手,构建专属 AI Agent。
个人层面:Alexa、Google Assistant、Siri 等虚拟助手,可设置闹钟、发送消息、搜索信息。