Python测试之道

测试工程师实战：用 LangChain+deepseek构建多轮对话测试辅助聊天机器人

随着 AIGC 技术的飞速发展，越来越多的测试工程师希望借助大模型提升日常测试效率，例如辅助设计用例、答疑解惑、自动化生成测试建议等。LangChain 作为主流 LLM 应用开发框架，为多轮对话智能助手的研发提供了极大便利。本文不仅带你上手 LangChain 构建多轮对话测试机器人，还通过两个实际问答案例，深入展示其在测试用例设计场景下的实用价值和专业性。

一、构建多轮对话测试机器人

1. 环境与依赖

推荐使用 Jupyter Notebook，便于交互演示与调试。
安装依赖：

pip install langchain-core langgraph>0.2.27
pip install -qU "langchain[openai]"

2. 初始化 LLM 聊天模型

from langchain_core.messages import HumanMessage
import os
os.environ["LANGSMITH_TRACING"] = "true"
os.environ["LANGSMITH_PROJECT"] = "pr-warmhearted-bassoon-71"
os.environ["LANGSMITH_API_KEY"] = "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"
os.environ["LANGSMITH_ENDPOINT"] = "https://api.smith.langchain.com"

from langchain_openai import ChatOpenAI


llm = ChatOpenAI(
    model="deepseek-chat",
    api_key="sk-e3f022d1746f415c9b0f4bc9a52a43xx",  # todo 替换deepseek API Key  https://platform.deepseek.com/api_keys
    temperature=0.7,
    max_tokens=512,
    timeout=30,
    max_retries=3,
    base_url="https://api.deepseek.com"
)

3. 多轮对话持久化——LangGraph 接入

from langgraph.checkpoint.memory import MemorySaver
from langgraph.graph import START, MessagesState, StateGraph

# 定义一个graph
workflow = StateGraph(state_schema=MessagesState)

def call_model(state: MessagesState):
    response = llm.invoke(state["messages"])
    return {"messages": response}

workflow.add_edge(START, "model")
workflow.add_node("model", call_model)
# 记忆保存在内存中
memory = MemorySaver()
app = workflow.compile(checkpointer=memory)

4. 支持多用户多会话

4.1 比对

第一轮对话

config = {"configurable": {"thread_id": "test_case123"}}
query = "Hi, I`m Bob."
input_messages = [HumanMessage(query)]
output = app.invoke({"messages": input_messages}, config)
output["messages"][-1].pretty_print()

================================== Ai Message ==================================

Hi Bob!  How can I help you today?

第二轮对话

query = "What`s my name?"
input_messages = [HumanMessage(query)]
output = app.invoke({"messages": input_messages}, config)
output["messages"][-1].pretty_print()

================================== Ai Message ==================================

Your name is **Bob**—you introduced yourself at the start!  What’s up, Bob? Anything fun or interesting on your mind?

若更改config，则会开启一轮新的对话：

config = {"configurable": {"thread_id": "abc234"}}  # config改变
input_messages = [HumanMessage(query)]  # query不变
output = app.invoke({"messages": input_messages}, config)
output["messages"][-1].pretty_print()

================================== Ai Message ==================================

I don’t have access to personal information about you unless you share it with me. If you’d like, you can tell me your name, and I’ll happily use it in our conversation!

当然可以！下面用通俗易懂的方式讲解一下 langgraph 关联对话的 config 原理，确保每一位测试工程师都能明白它的“道理”：

4.2 config讲解

什么是 config？它有什么用？

在用 langgraph 做多轮对话时，你会发现每次和机器人聊天时，都需要传一个类似这样的参数：

config = {"configurable": {"thread_id": "test_case123"}}

你也许会疑惑：

这个 config 到底是干什么的？
这个 thread_id 又是什么？

打个比方：config 就像“对话房间号”

想象一下，你和几个同事在公司用微信群聊，每个群都有自己的聊天记录。你在“测试用例设计群”里聊过的话题，不会跑到“自动化脚本群”里去。同理：

每个 thread_id 就像一个“微信群号”或“聊天室编号”。
你每和机器人开启一个新 thread_id，就相当于新开了一个“独立的聊天群”。
机器人会自动记住和你在这个群里的所有历史对话！

为什么这样设计？

多用户/多会话隔离
- 不同测试工程师用同一个机器人，不会互相看到对方的聊天内容。
- 你可以为每个测试项目、每个测试会话分配一个独立 thread_id，历史上下文不会串。
随时切换话题
- 你可以随时“回到”之前的 thread_id，机器人还能接着上次的话题继续聊。
- 就像你进出多个微信群，每个群的历史消息都在，不会丢。
方便管理和追踪
- 方便后续查找、管理、分析每个会话的内容。

config 的用法举例

# 第一次和机器人聊“玻璃杯测试用例”
config1 = {"configurable": {"thread_id": "glass_case"}}
app.invoke({"messages": ...}, config1)

# 另一个同事聊“自动化脚本优化”
config2 = {"configurable": {"thread_id": "script_case"}}
app.invoke({"messages": ...}, config2)

# 你回到第一次的话题，只要 thread_id 一样，历史都还在
app.invoke({"messages": ...}, config1)

总结一句话

config 里的 thread_id，就是用来给“每一段独立对话”分配一个唯一编号。

只要 thread_id 一样，机器人就能记住你们之前聊过什么，真正实现多轮对话和上下文记忆。

这样一来，无论你是测试用例复盘、BUG 跟踪，还是知识问答，都能随时“断点续聊”，不会乱套！

希望这样你能一下子明白 langgraph 关联对话的 config 原理啦！

二、对话案例一：结构化设计玻璃杯测试用例

在实际面试和工作中，**“如何为玻璃杯设计测试用例”**是经典问题。让我们看看多轮对话机器人如何应答并帮助测试工程师形成结构化思路：

用户：

config = {"configurable": {"thread_id": "test_case123"}}
input_messages = [HumanMessage("测试工程师面试时，会被提问如何针对一个玻璃杯进行测试用例设计，帮我生成一个合理的回答？")]
output = app.invoke({"messages": input_messages}, config)
output["messages"][-1].pretty_print()

AI 聊天机器人答复：

================================== Ai Message ==================================

在面试中针对玻璃杯的测试用例设计问题，主要考察测试工程师的系统思维、场景覆盖能力和质量意识。以下是一个结构化的回答框架，既体现专业性又符合实际场景：

---

**回答示例：**

"我会从功能、性能、安全性、兼容性、用户体验和异常场景六个维度设计测试用例，同时考虑不同用户场景的需求：

**1. 功能测试**
- 基本功能：验证杯子能否正常盛装冷水/热水（不同容量）、液体是否泄漏
- 特殊功能：若为保温杯，测试保温时长是否符合标准（如100℃水6小时后≥68℃）
- 接口测试：杯盖与杯身的旋合密封性（可量化：旋转90°后倒置不漏水）

**2. 性能测试**
- 容量精度：标称300ml时，实测误差应≤±5%
- 耐温性：-20℃~120℃环境交替循环测试后无开裂
- 结构强度：1.5m高度自由落体到硬质地面的破损率（统计20次测试）

**3. 安全性测试**
- 材质检测：通过FDA认证的食品级材料验证
- 高温毒性：装入沸水后检测重金属析出量
- 边缘处理：杯口是否通过毛刺检测（如用丝绸摩擦测试）

**4. 兼容性测试**
- 液体兼容性：盛装酸性（柠檬汁）、碱性（苏打水）、油性液体的反应
- 设备兼容性：能否放入车载杯架/洗碗机等标准容器

**5. 用户体验测试**
- 人机工程：直径65mm的杯身是否适合亚洲人平均握距（70-90mm）
- 防滑设计：表面纹路在潮湿环境下的摩擦系数（≥0.4为合格）
- 视觉设计：印刷图案经过100次洗碗机循环后褪色率

**6. 异常场景测试**
- 极端填充：超过标称容量50%时的结构变形量
- 错误操作：空杯直接微波加热的后果
- 老化测试：UV加速老化500小时后材质黄变指数

**补充说明：**
- 会优先执行P0级用例（如盛装功能、基本安全性）
- 对保温杯等特殊类型会增加专项测试（如真空度检测）
- 建议建立标准测试环境（如23±2℃, RH50%）

---

**面试官考察点及应对技巧：**
1. **需求分析能力**：主动询问杯子类型（普通/保温/刻度杯）和用户群体（儿童/户外）
2. **测试思维完整性**：展示多维度覆盖（STAR法则：场景-方法-预期-结果）
3. **量化意识**：尽量给出可测量的标准（如"装100℃水"比"装热水"更专业）
4. **风险意识**：强调会优先测试高频使用场景和安全隐患

建议准备时结合具体案例，如："在我之前的厨具测试项目中，就曾通过温度循环测试发现某玻璃杯在快速温差变化下存在5%的破裂率，推动供应商改进了退火工艺"

三、对话案例二：精简版测试用例设计

实际工作中，测试资源有限，常需优先级和用例精简。机器人支持多轮追问，自动根据历史上下文生成更合适的答复：