AI产品经理必须知道的技术 之 【RAG】

AI产品经理或者准备从事这个职业的朋友,一定都听说过RAG。RAG全称是Retrieval Augmented Generation,中文意思是检索增强生成,是一种构建AI应用的方法。

今天我就跟大家唠一唠RAG,什么是RAG、RAG的实现方式,以及RAG的典型产品应用分享。

01—RAG介绍

RAG是目前AIGC文本生成最普遍、最成熟的应用方法

通俗地理解就是:把知识库提供给大模型,让大模型根据知识库的内容进行回答。

这和用户直接上传一个文档,让大模型根据文档回答问题有一些小的区别。

RAG有一个前置流程,即先检索知识库,把检索出来的知识片段提供给大模型,再让大模型根据知识片段回答问题。

这么做的好处是什么呢?

总结来说,RAG对AIGC应用的价值有三个方面:

  1. RAG可以引导大模型回答内容的范围、提升回答质量。

  2. RAG可以补充大模型在专业领域的知识上的不足,可以让大模型变为行业专家,以及让大模型可以获取最新的知识。

  3. RAG弥补了大模型处理token长度的限制,对于非常大的知识库,也可以进行检索生成。

举个应用场景的案例:

【场景】你公司有一款产品,你希望将该产品的知识文档,都提供给大模型,给用户提供一个基于大模型的智能问答客服,帮助用户快速解决问题。

RAG可以帮助你实现以下效果:

1、智能客服可以基于产品知识回答问题

回答结果可以引用的文档内容,以及大模型根据它的理解推理给出的答案。

它可以是基于知识内容的总结、解释。

也可以是基于知识内容,进行相关的工具调用,计算推理,得出答案。

也有更高级的用法,例如用思维链的方法,将问题拆分为多个任务,进行下一步的推理。当然思维链的方法已经不是RAG本身了,但我们可以将RAG方法应用在思维链推理模式中,用来构建复杂的任务。

2、知识库是可以实时更新完善的

你可以将最新的知识库内容提供给大模型,让在每次大模型回答问题前,都实时检索最新的内容。你不需要重新设置大模型。只要更新知识库即可。

这里有个小tips,知识库不仅仅是产品文档、用户手册。你也可以将过去大模型回答问题的记录,将其中常见的问题,优秀的回答,差的回答,经过审核筛选后,也作为知识的一部份。这可以很好地提升回答质量。

3、避免大模型上下文Token长度限制

由于大

你可能感兴趣的:(AI专栏,人工智能,产品经理)