langChain 文档检索

文档检索

  1. LangChain 提取文档

提取是从一段文本中解析数据的过程。这通常与输出解析一起使用,以构建我们的数据。

深入研究-使用 LLM 从文本中提取数据(专家级文本提取,OpenAI 的结构化输出(清理脏数据)
从原始 LLM 生成中获取结构化输出是很困难的。
您需要使用特定架构格式化的模型输出

  • 提取结构化行以插入到数据库中
  • 提取 API 参数
  • 提取用户查询的不同部分(例如,用于语义搜索与关键字搜索)
    Kor是个支持LangChain的文本抽取库 可以把文本抽取成json格式。

你可能感兴趣的:(langchain)