流程四部曲:把文字变成数学冰淇淋
1️⃣ 第一步:文字切块 → 像剁肉馅
举个栗子:
"宫保鸡丁的做法:先切丁...最后撒花生。鲁菜特点是..."
↓ 切成 →
["宫保鸡丁做法详情", "鲁菜特点概述"]
2️⃣ 第二步:洗菜环节 → 给文字搓澡
3️⃣ 第三步:文字变向量 → 魔法厨房
就像把变成条形码:
"火锅最好吃" → [0.12, 0.45, -0.23, ..., 0.89]
4️⃣ 第四步:入库摆盘 → 智能冰箱
入库代码示意(伪代码):
VectorDB.insert(
vector: [0.12, 0.45, ...], // 向量值
metadata: {
source: "《川菜宝典》第三章",
page: 42,
keywords: ["火锅", "蘸料"]
}
)
终极奥义:整个过程就像准备火锅食材!切肉(分块)→ 洗菜(清洗)→ 调蘸料(向量化)→ 摆盘(入库),最后检索时就能快速涮到最匹配的食材啦!
冷知识:为什么需要向量?就像用GPS坐标找火锅店,"海底捞"和"小龙坎"的向量距离,比"海底捞"和"图书馆"近多啦!