19、RAG的原理及代码实战(2)pipeline介绍

1、整体流程

根据前文介绍,整体的RAG流程如下

19、RAG的原理及代码实战(2)pipeline介绍_第1张图片

2、embedding

embedding是指使用嵌入模型将切分后的文本块转换为向量表示。这些向量能够在高维空间中表示文本的语义信息。

2.1 openai embedding

目前最好的embedding模型是openai的text-embedding-3-large,使用前需要先注册openai账号,申请一个API key。主要的词向量有以下三个:

模型名称 每美元处理的页数 MTEB评估的性能 最大输入标记数
text-embedding-3-small 约62,500页 62.3% 8191
text-embedding-3-large 约9,615页 64.6%

你可能感兴趣的:(大模型学习,embedding,RAG,graphRAG)