大模型应用开发第六讲:目标:从被动响应到主动决策与执行

大模型应用开发第六讲:目标:从被动响应到主动决策与执行

资料取自《大模型应用开发:动手做AI Agent 》
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


AI Agent进化论:从「问答机」到「执行官」

咖啡店服务员 vs 智能管家 对比,解析如何让AI从机械应答转变为主动服务


一、能力对比表(全局认知)

被动响应模式 主动决策模式
交互方式 用户问什么答什么(类似电话客服) 预判用户需求并执行(类似管家)
决策深度 单轮对话,无后续行动 多步骤规划+跨系统操作
核心价值 信息传递(知道≠做到) 结果交付(说到就能做到)
技术实现 基础Prompt工程 工具链+记忆系统+自我优化机制
经典案例 查天气/翻译文本 健康异常自动挂号+买药送到家

二、被动响应的局限性(咖啡店员模式)

1. 致命短板

  • 知识依赖度高:答案质量取决于训练数据(回答不了训练时不存在的问题)[2]
  • 无行动能力:只能动嘴不能动手(知道机票价格但不会买)[5]
  • 健忘症患者:多轮对话需反复确认信息(用户说"按上次地址寄"→必须追问具体地址)[5]

2. 生活翻车案例

场景:用户说“明天飞北京的航班最早几点?”

  • 被动响应结果 → 展示起飞时间(但用户实际想订票)
  • 用户不得不追问 → “帮我订这张票” → 系统再次索要个人信息 → 体验割裂5
flowchart TD
    A[用户提问] --> B(返回航班时间清单)
    B --> C{用户是否继续提问?}
    C -->|是| D[进入新会话循环]
    C -->|否| E[任务终止]

▲ 被动模式断点式交互(第2章对话管理缺陷)


三、主动决策的三重进化(智能管家模式)

1. 第一层:听懂弦外之音 → 需求预判

技术突破

  • 上下文理解:分析对话历史(用户上月频繁查婴儿奶粉 → 推测刚有孩子)2
  • 意图识别:从“帮我查航班”推断用户实际需要完成订票[6]

实战案例

用户说:“这周哪几天上海不下雨?”
→ 被动响应:列出晴雨日期表
主动决策
① 结合用户日历(周三有空)→ 推荐周三出游
② 自动预定迪士尼门票(已存储用户年卡信息)5

2. 第二层:长短期记忆结合 → 持续服务

关键技术

  • 工作记忆:记住当前任务状态(正在比价三款手机)[5]
  • 长期记忆:存储用户偏好(讨厌安卓系统/常用收货地址)2

购物助手进化对比

用户行为 被动模式 主动模式
“我想买手机” 推荐热门机型列表 ①调取历史记录(上次放弃购买的机型) ②排除安卓机型 ③询问预算[5]
“预算5000左右” 再次过滤结果 ①筛选达标机型 ②比价京东/天猫 ③提示“您所在小区周三有京东闪送活动”[6]

3. 第三层:闭环执行 → 真正的「做到」

行动工具箱

  • API调用:支付系统/物流系统直连(不需要人工中转)2
  • 异常熔断机制:信用卡支付失败 → 自动切换备选支付方式[6]

医疗场景全流程演示

flowchart LR
    A["用户说“胃痛三天”"] --> B["症状初步分析"]
    B --> C["工具1:预约消化科门诊"]
    B --> D["工具2:药店比价奥美拉唑"]
    C --> E{"号源是否充足?"}
    D --> F{"药品是否有库存?"}
    E & F --> G["生成方案:周四9点就诊+应急药1小时后送达"]
    G --> H["自动垫付药费+短信通知用户"]

▲ 闭环服务流程(第6章ReAct框架应用案例)


四、技术跃迁的四大支柱

1. 工具调用:赋予AI「手」的能力

  • 接口扩展:订票系统/智能家居控制API接入(第5章Function Calling)[6]
  • 权限托管:预设支付授权(单次限额500元内自动操作)[6]

2. 记忆系统:打造AI「大脑皮层」

  • 工作记忆区:临时存储比价过程中的候选商品(第2章对话状态管理)[5]
  • 知识沉淀池:记录用户每次拒绝推荐的原因(优化后续策略)[5]

3. 验证机制:防止AI「乱来」

  • 临界值检查:购物车总价超过3000元需用户二次确认[6]
  • 事实核查:生成法律文书时自动比对最新法规(第5章RAG技术)[5]

4. 自我优化:AI的「复盘会」

  • 失败分析:酒店预订被取消 → 学习避免选择超售率高的供应商[4]
  • 模式总结:发现用户总在周五晚买电影票 → 提前推荐热门影片[4]

五、行业级应用演示:家庭健康管家

▶ 被动模式 vs 主动模式效果对比

场景 被动式响应 主动式决策
血糖监测报警 播报“当前血糖值为9.2mmol/L” ①自动联系家庭医生 ②启动胰岛素泵微调 ③订无糖餐食[6]
老人未按时吃药 提示“请及时服药” ①药盒闪光提醒 ②15分钟未响应则通知子女 ③同步异常信息至社区医院[6]
运动手环检测心率异常 显示“心率120次/分钟” ①拨打急救电话 ②打开电子病历 ③解锁家门等待医护人员[4]

关键技术与章节索引

  • 需求预判技术:对话状态跟踪(第2章2.1节)[1]
  • 工具链设计:OpenAI Functions规范(第5章)[6]
  • 闭环验证:ReAct框架中的思考-行动循环(第6章案例)[6]
  • 长期记忆:向量数据库应用(第5章RAG技术)[5]

技术全景图

flowchart TB
    A[用户输入] --> B(意图识别引擎)
    B --> C{是否需要行动?}
    C -->|是| D[规划工具调用顺序]
    C -->|否| E[生成自然语言响应]
    D --> F[执行API调用]
    F --> G{结果是否达标?}
    G -->|是| H[返回执行结果]
    G -->|否| I[启动备选方案]
    H & I --> J[更新记忆库]

▲ 主动决策系统架构(第2章2.2节、第6章6.3节综合)


行动号召:从今天开始升级你的AI

1️⃣ 检查现有系统:是否还在做"问答复读机"?
2️⃣ 装备基础工具:接入1个外部API(如天气查询)
3️⃣ 添加记忆体:记录用户最近3次偏好
4️⃣ 设计最小闭环:从查天气→推荐穿搭→一键购买雨伞

书中实操指引


目录:总目录
上篇文章:大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)
下篇文章:大模型应用开发第七讲:OpenAI API入门 注册与API密钥获取


你可能感兴趣的:(大模型应用开发第六讲:目标:从被动响应到主动决策与执行)