在 LangChain 中,四种文档处理预制链(stuff、refine、map reduce、map re-rank)是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是:将长文档切分为块,分步处理,再整合结果,极大提升大模型处理长文档的能力。
这四种链极大丰富了 LangChain 在文档问答、摘要等场景下的处理能力,让大模型能高效应对长文档和复杂信息整合任务。
stuff chain 是 LangChain 处理文档问答和摘要最简单直接的一种链。它的核心思想是:把所有文档内容直接拼接到 prompt 里,一次性交给大模型处理,让模型在完整上下文下直接生成答案。
# stuff chain 示例
# 最常见的文档链,将文档直接塞进prompt中,为LLM回答问题提供上下文资料,适合小文档场景。
from langchain.chains.combine_documents.stuff import StuffDocumentsChain # 导入StuffDocumentsChain
from langchain.chains import LLMChain # 导入LLMChain
from langchain.prompts import PromptTemplate # 导入PromptTemplate
from langchain.document_loaders import PyPDFLoader # 导入PDF文档加载器
from langchain_openai import ChatOpenAI # 导入腾讯混元模型的ChatOpenAI接口
from pydantic import SecretStr
import os
from dotenv import load_dotenv
load_dotenv() # 加载环境变量
loader = PyPDFLoader("example.pdf") # 加载PDF文档
# print(loader.load()) # 可选:打印文档内容
# 定义总结用的prompt模板
prompt_template = """对下面的内容进行简短总结:
{text}
简洁的总结:"""
prompt = PromptTemplate.from_template(prompt_template) # 创建PromptTemplate对象
# 实例化腾讯混元模型
llm = ChatOpenAI(
api_key=SecretStr(os.environ.get("HUNYUAN_API_KEY", "")), # 腾讯混元API KEY
base_url="https://api.hunyuan.cloud.tencent.com/v1", # 腾讯混元API地址
model="hunyuan-lite", # 模型名称
temperature=0, # 采样温度
)
# 构建LLMChain
llm_chain = LLMChain(
llm=llm,
prompt=prompt
)
# 构建StuffDocumentsChain,将文档内容塞进prompt
stuff_chain = StuffDocumentsChain(
llm_chain=llm_chain,
document_variable_name="text" # prompt模板中的变量名
)
docs = loader.load() # 加载文档内容
print(stuff_chain.run(docs)) # 输出总结结果
结果:
中国美食文化历史悠久,地域广阔,风味多样,注重色香味形与营养均衡。八大菜系各具特色,小吃丰富多样。中国人重视饮食,它不仅是果腹,更是生活享受和情感寄托。中国美食走向世界,融合创新,展现文化传承与创新。
优点:实现简单,效果直观,适合小文档。
缺点:文档过长时容易超出模型 token 限制,无法处理大文档。
本质:就是“拼接所有内容→大模型一次性处理”。
stuff chain 适合“小而全”的文档场景,是最直接的文档问答/摘要方案。
# 使用预先封装好的load_summarize_chain进行文档总结
from langchain.chains.summarize import load_summarize_chain # 导入总结链加载器
from langchain.document_loaders import PyPDFLoader # 导入PDF加载器
from langchain_openai import ChatOpenAI # 导入腾讯混元模型接口
from pydantic import SecretStr
import os
from dotenv import load_dotenv
load_dotenv() # 加载环境变量
loader = PyPDFLoader("example.pdf") # 加载PDF文档
docs = loader.load() # 读取文档内容
# 实例化腾讯混元大模型
llm = ChatOpenAI(
api_key=SecretStr(os.environ.get("HUNYUAN_API_KEY", "")), # 腾讯混元API KEY
base_url="https://api.hunyuan.cloud.tencent.com/v1", # 腾讯混元API地址
model="hunyuan-lite", # 模型名称
temperature=0, # 采样温度
)
# 加载总结链,chain_type="stuff"表示直接将所有文档内容塞入模型
chain = load_summarize_chain(llm, chain_type="stuff", verbose=True)
print(chain.run(docs)) # 输出总结结果
结果:
> Entering new StuffDocumentsChain chain...
> Entering new LLMChain chain...
Prompt after formatting:
Write a concise summary of the following:
"中国美食文化源远流长,博大精深,是中华民族几千年历史积淀下来的宝贵财富。中国地域辽阔
,南北气候差异显著,物产丰富,因此形成了丰富多样的饮食风格和独特的烹饪技艺。中国美食
不仅讲究色、香、味、形的和谐统一,更注重食材的搭配与营养的均衡。无论是宫廷盛宴,还是
市井小吃,都展现出中国人对美食的热爱与追求。
中国八大菜系各具特色。川菜以麻辣著称,讲究“麻、辣、鲜、香”,代表菜品有麻婆豆腐、宫
保鸡丁、水煮鱼等。粤菜则以清淡、鲜美、注重原汁原味为主,代表菜品有白切鸡、烧鹅、虾饺
等。鲁菜历史悠久,擅长爆炒、扒、炸,代表菜品有糖醋鲤鱼、九转大肠。苏菜以精致、清鲜、
讲究刀工见长,代表菜品有松鼠鳜鱼、清炖狮子头。闽菜、浙菜、湘菜、徽菜也各有千秋,形成
了中国美食的多元格局。
除了八大菜系,中国各地的小吃同样令人垂涎。北京的烤鸭、天津的狗不理包子、山西的刀削面
、陕西的肉夹馍、四川的担担面、重庆的小面、广东的肠粉、广西的螺蛳粉、云南的过桥米线、
福建的沙县小吃等,都是地方饮食文化的代表。每一道小吃背后,都有一段动人的故事和独特的
制作工艺。
中国人讲究“民以食为天”,饮食不仅仅是果腹,更是一种生活的享受和情感的寄托。家人团聚
时的一桌饭菜,朋友聚会时的推杯换盏,节日里的饺子、粽子、月饼,无不承载着亲情、友情和
对美好生活的向往。中国美食还讲究时令和养生,春吃芽、夏吃瓜、秋吃果、冬吃根,顺应自然
变化,注重食疗养生。
近年来,随着社会的发展和中外交流的加深,中国美食走向世界,成为全球美食爱好者追捧的对
象。无论是在纽约、巴黎、伦敦,还是在东京、悉尼、迪拜,都能看到中餐馆的身影。川菜的麻
辣、粤菜的清鲜、北方的面食、南方的米饭,都让世界各地的人们领略到中国美食的独特魅力。
中国美食不仅仅是一种味觉的享受,更是一种文化的传承和创新。无数厨师和美食家在继承传统
的基础上,不断创新,推出融合菜、创意菜,让中国美食焕发出新的活力。无论是高档餐厅的精
致菜肴,还是街头巷尾的平民美食,都体现了中国人对生活的热爱和对美好味道的不懈追求。
"
CONCISE SUMMARY:
> Finished chain.
> Finished chain.
中国美食文化历史悠久,地域广阔,形成了丰富多样的风格和烹饪技艺。八大菜系各具特色,如川菜的麻辣、粤菜的清淡、鲁菜的历史悠久等。此外,还有众多地方小吃代表各地饮食文化。中国人重视饮食,它不仅是果腹的方式,更是情感的寄托。中国美食讲究时令和养生,近年来更是走向世界,受到全球美食爱好者的喜爱。
load_summarize_chain 是 LangChain 提供的文档自动摘要高阶工具,可以根据不同的链类型(如 stuff、refine、map_reduce、map_rerank)快速构建适合长文档的摘要流程。它会自动帮你把文档切块、分步处理、整合结果,极大简化了多文档/长文档摘要的实现。
refine chain 是 LangChain 文档处理的四大预制链之一,适合长文档递进式摘要。其核心思想是:
# refine链示例
# 通过循环引用LLM,将文档分块逐步总结并不断完善摘要,适合有上下文递进关系的文档,不适合交叉引用较多的文档。
from langchain.chains.summarize import load_summarize_chain # 导入总结链加载器
from langchain.prompts import PromptTemplate # 导入Prompt模板
from langchain.document_loaders import PyPDFLoader # 导入PDF加载器
from langchain.chains import LLMChain # 导入LLM链
from langchain_openai import ChatOpenAI # 导入腾讯混元模型接口
from langchain.text_splitter import CharacterTextSplitter # 导入文本分割器
from pydantic import SecretStr
import os
from dotenv import load_dotenv
load_dotenv() # 加载环境变量
# 实例化腾讯混元大模型
llm = ChatOpenAI(
api_key=SecretStr(os.environ.get("HUNYUAN_API_KEY", "")), # 腾讯混元API KEY
base_url="https://api.hunyuan.cloud.tencent.com/v1", # 腾讯混元API地址
model="hunyuan-lite", # 模型名称
temperature=0, # 采样温度
)
# 加载PDF文档
loader = PyPDFLoader("example.pdf")
docs = loader.load()
# 文本分块,便于refine链逐步处理
text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
chunk_size=1000, # 每块最大字符数
chunk_overlap=0, # 块之间不重叠
# encoding_name="cl100k_base" # 可选编码
)
split_docs = text_splitter.split_documents(docs)
# 定义初始总结的prompt模板
prompt_template = """总结以下内容:
{text}
总结:
"""
prompt = PromptTemplate.from_template(prompt_template)
# 定义refine链的prompt模板
refine_template = (
"你的任务是产生最终摘要\n"
"我们已经提供了一个到某个特定点的现有回答:{existing_answer}\n"
"我们提供给你的额外信息是:\n"
"--------------------------------\n"
"{text}\n"
"--------------------------------\n"
"请基于以上信息,修改现有回答,使其更加准确和完整。\n"
"修改后的回答:"
)
refine_prompt = PromptTemplate.from_template(refine_template)
# 构建refine链,设置相关参数
chain = load_summarize_chain(
llm=llm,
chain_type="refine",
verbose=True,
refine_prompt=refine_prompt, # refine链用的prompt
return_intermediate_steps=True, # 返回中间步骤
input_key="documents", # 输入文档的key
output_key="output_text" # 输出摘要的key
)
# 执行链,传入分块后的文档
result = chain({
"documents": split_docs},
return_only_outputs=True
)
print(result["output_text"]) # 输出最终摘要
print("\n\n".join(result["intermediate_steps"][:3])) # 输出前三步中间摘要
结果:
> Entering new RefineDocumentsChain chain...
> Entering new LLMChain chain...
Prompt after formatting:
Write a concise summary of the following:
"中国美食文化源远流长,博大精深,是中华民族几千年历史积淀下来的宝贵财富。中国地域辽阔
,南北气候差异显著,物产丰富,因此形成了丰富多样的饮食风格和独特的烹饪技艺。中国美食
不仅讲究色、香、味、形的和谐统一,更注重食材的搭配与营养的均衡。无论是宫廷盛宴,还是
市井小吃,都展现出中国人对美食的热爱与追求。
中国八大菜系各具特色。川菜以麻辣著称,讲究“麻、辣、鲜、香”,代表菜品有麻婆豆腐、宫
保鸡丁、水煮鱼等。粤菜则以清淡、鲜美、注重原汁原味为主,代表菜品有白切鸡、烧鹅、虾饺
等。鲁菜历史悠久,擅长爆炒、扒、炸,代表菜品有糖醋鲤鱼、九转大肠。苏菜以精致、清鲜、
讲究刀工见长,代表菜品有松鼠鳜鱼、清炖狮子头。闽菜、浙菜、湘菜、徽菜也各有千秋,形成
了中国美食的多元格局。
除了八大菜系,中国各地的小吃同样令人垂涎。北京的烤鸭、天津的狗不理包子、山西的刀削面
、陕西的肉夹馍、四川的担担面、重庆的小面、广东的肠粉、广西的螺蛳粉、云南的过桥米线、
福建的沙县小吃等,都是地方饮食文化的代表。每一道小吃背后,都有一段动人的故事和独特的
制作工艺。
中国人讲究“民以食为天”,饮食不仅仅是果腹,更是一种生活的享受和情感的寄托。家人团聚
时的一桌饭菜,朋友聚会时的推杯换盏,节日里的饺子、粽子、月饼,无不承载着亲情、友情和
对美好生活的向往。中国美食还讲究时令和养生,春吃芽、夏吃瓜、秋吃果、冬吃根,顺应自然
变化,注重食疗养生。
近年来,随着社会的发展和中外交流的加深,中国美食走向世界,成为全球美食爱好者追捧的对
象。无论是在纽约、巴黎、伦敦,还是在东京、悉尼、迪拜,都能看到中餐馆的身影。川菜的麻
辣、粤菜的清鲜、北方的面食、南方的米饭,都让世界各地的人们领略到中国美食的独特魅力。
中国美食不仅仅是一种味觉的享受,更是一种文化的传承和创新。无数厨师和美食家在继承传统
的基础上,不断创新,推出融合菜、创意菜,让中国美食焕发出新的活力。无论是高档餐厅的精
致菜肴,还是街头巷尾的平民美食,都体现了中国人对生活的热爱和对美好味道的不懈追求。"
CONCISE SUMMARY:
> Finished chain.
> Finished chain.
中国美食文化历史悠久,地域广阔,形成了丰富多样的风格和烹饪技艺。八大菜系各具特色,如川菜的麻辣、粤菜的清淡、鲁菜的历史悠久等。此外,中国各地小吃也各具特色,如北京烤鸭、天津狗不理包子等。中国人重视饮食,讲究色、香、味、形的和谐统一及食材搭配与营养均衡。近年来,随着社会发展和中外交流加深,中国美食走向世界,成为全球美食爱好者的追捧对象。
中国美食文化历史悠久,地域广阔,形成了丰富多样的风格和烹饪技艺。八大菜系各具特色,如川菜的麻辣、粤菜的清淡、鲁菜的历史悠久等。此外,中国各地小吃也各具特色,如北京烤鸭、天津狗不理包子等。中国人重视饮食,讲究色、香、味、形的和谐统一及食材搭配与营养均衡。近年来,随着社会发展和中外交流加深,中国美食走向世界,成为全球美食爱好者的追捧对象。
优点:适合长文档,摘要结果递进完善,信息吸收更充分。
缺点:速度比 stuff 慢,成本略高。
本质:每次用“已有摘要+新内容”让大模型补充完善,直到结束。
refine chain 让大模型像“写作文”一样,逐步吸收和完善每一块内容,最终生成高质量长文档摘要。
map reduce chain 是 LangChain 处理长文档/多文档的经典链式方案,借鉴了大数据中的 MapReduce 思想。其核心流程是:
# map reduce 示例,含详细注释
from langchain.chains import MapReduceDocumentsChain
from langchain.chains import ReduceDocumentsChain
from langchain.chains.combine_documents.stuff import StuffDocumentsChain
from langchain.prompts import PromptTemplate
from langchain.document_loaders import Docx2txtLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain_openai import ChatOpenAI
from langchain.chains import LLMChain
from pydantic import SecretStr
import os
from dotenv import load_dotenv
load_dotenv() # 加载环境变量
# 初始化腾讯混元大模型
llm = ChatOpenAI(
api_key=SecretStr(os.environ.get("HUNYUAN_API_KEY", "")), # 腾讯混元API KEY
base_url="https://api.hunyuan.cloud.tencent.com/v1", # 腾讯混元API地址
model="hunyuan-lite", # 模型名称
temperature=0, # 采样温度
)
# 加载docx文档
loader = Docx2txtLoader("example.docx")
docs = loader.load()
# print(docs[0].page_content) # 可选:打印首段内容
# 文本分块
text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
chunk_size=500, # 每块最大500字符
chunk_overlap=0, # 不重叠
)
split_docs = text_splitter.split_documents(docs)
# map阶段:每个分块单独总结
map_template = """简要总结下面的内容:
{content}
简要总结:
"""
map_prompt = PromptTemplate.from_template(map_template)
map_chain = LLMChain(llm=llm, prompt=map_prompt)
# reduce阶段:合并所有分块的总结
reduce_template = """
将以下内容合并为一篇完整的总结:
{doc_summaries}
完整的总结:
"""
reduce_prompt = PromptTemplate.from_template(reduce_template)
reduce_chain = LLMChain(llm=llm, prompt=reduce_prompt)
# stuff_chain用于合并文档
stuff_chain = StuffDocumentsChain(
llm_chain=reduce_chain,
document_variable_name="doc_summaries"
)
# reduce_final_chain负责多轮合并,超长时递归合并
reduce_final_chain = ReduceDocumentsChain(
combine_documents_chain=stuff_chain,
collapse_documents_chain=stuff_chain, # 超过token_max时再次合并
token_max=4000, # 最大token数
)
# map-reduce链:先map再reduce
map_reduce_chain = MapReduceDocumentsChain(
llm_chain=map_chain, # map链
document_variable_name="content", # map链输入变量名
reduce_documents_chain=reduce_final_chain, # reduce链
)
# 执行map-reduce链,得到最终总结
result = map_reduce_chain.run(split_docs)
print(result)
结果:
本文探讨了人工智能(AI)的发展历程、在各领域的应用以及面临的挑战。AI技术已在图像识别、自然语言处理、自动驾驶等方面取得显著成果,提高了诊断准确率、金融决策的科学性和安全性,并在智能家居、教育、交通等行业具有巨大潜力。然而,隐私保护、伦理道德和就业影响等问题也引起了广泛关注。未来,AI将与物联网、大数据、云计算等技术融合,在智慧城市、智能制造等领域发挥关键作用。为确保AI的可持续发展,需加强法规制定和国际合作。智元科技作为一家专注于人工智能技术研发与应用的公司,通过将AI算法与新一代信息技术融合,提供智能化解决方案,服务金融、医疗、教育等行业,推动人工智能技术产业化,助力企业数字化转型和社会智能化升级。总之,人工智能是科技革命和产业变革的核心,能扩展人类能力,促进社会和经济发展,未来将在多领域展现潜力。
map reduce chain 让大模型像“流水线”一样高效处理长文档,先分块理解再全局总结,适合大规模文档问答和摘要。
map re-rank chain 是 LangChain 处理文档问答的高阶链式方案,适合“多文档/多块内容检索+最佳答案筛选”场景。其核心思想是:
from langchain.document_loaders import Docx2txtLoader # 用于加载docx文档
from langchain.text_splitter import CharacterTextSplitter # 文本分块工具
from langchain_openai import ChatOpenAI # 腾讯混元 LLM 封装
from langchain.chains.qa_with_sources import load_qa_with_sources_chain # QA链加载器
import os
from pydantic import SecretStr
import dotenv
dotenv.load_dotenv() # 加载环境变量
# 初始化腾讯混元大模型
llm = ChatOpenAI(
api_key=SecretStr(os.environ.get("HUNYUAN_API_KEY", "")), # 腾讯混元API KEY
base_url="https://api.hunyuan.cloud.tencent.com/v1", # 腾讯混元API地址
model="hunyuan-t1-latest", # 模型名称
temperature=0, # 采样温度
)
# 加载docx文档
loader = Docx2txtLoader("example.docx")
docs = loader.load()
# 文本分块
text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
chunk_size=500, # 每块最大500字符
chunk_overlap=0, # 无重叠
)
split_docs = text_splitter.split_documents(docs)
# 构建map-rerank问答链
chain = load_qa_with_sources_chain(
llm=llm,
chain_type="map_rerank", # 采用map-rerank链
metadata_keys=["source"], # 返回文档来源
return_intermediate_steps=True # 返回中间步骤
)
query = "what is the document about? Answer in Chinese" # 查询问题
# 执行链,获取结果
result = chain({
"input_documents": split_docs,
"question": query
})
result # 输出结果
结果:
{'input_documents': [Document(page_content='人工智能(AI)是计算机科学的一个分支,致力于开发能够执行通常需要人类智能的任务的系统。近年来,随着深度学习和大数据的发展,AI在图像识别、自然语言处理、自动驾驶等领域取得了突破性进展。例如,深度神经网络通过模拟人脑神经元的连接方式,实现了对复杂数据的高效处理。在医疗领域,AI可以辅助医生进行疾病诊断,提高诊断的准确率和效率。在金融行业,智能算法能够分析大量市场数据,帮助投资者做出更科学的决策。此外,AI还在智能家居、教育、交通等多个行业展现出巨大的应用潜力。尽管AI带来了诸多便利,但也引发了关于隐私保护、伦理道德和就业影响的讨论。未来,随着技术的不断进步,AI有望在更多领域实现创新应用,推动社会进步。然而,我们也需要制定相应的法律法规,确保AI技术的健康发展。总之,人工智能作为一项前沿科技,正在深刻改变着我们的生活和工作方式。随着研究的不断深入,AI将在医疗、教育、交通、金融等领域发挥更大的作用。同时,AI的发展也需要社会各界的共同努力,推动其向着更加智能、安全和可控的方向前进。在未来的几十年里,人工智能有望成为推动人类社会进步的重要力量。我们应当积极拥抱AI带来的机遇,同时理性面对其带来的挑战。只有这样,才能实现科技与社会的和谐共生,让人工智能更好地服务于人类。随着AI技术的不断演进,相关产业链也在逐步完善。从芯片制造到算法优化,从数据采集到应用开发,AI产业生态日益丰富。各国政府和企业纷纷加大对AI的投入,推动技术创新和产业升级。在教育领域,AI可以根据学生的个性化需求,提供定制化的学习方案。在交通领域,智能交通系统能够提升道路安全和运输效率。AI还可以帮助科学家进行复杂的数据分析,加速科研进程。然而,AI的发展也面临诸如数据安全、算法偏见等问题。因此,建立健全的监管机制和伦理规范显得尤为重要。未来,AI将与物联网、大数据、云计算等技术深度融合,形成更强大的智能系统。这些系统将在智慧城市、智能制造、精准医疗等领域发挥关键作用。总的来说,人工智能作为新一轮科技革命的重要驱动力,正引领着全球科技创新的潮流。我们应当抓住这一历史机遇,推动AI技术的自主创新和产业化应用。同时,加强国际合作,共同应对AI带来的全球性挑战。只有这样,才能实现人工智能的可持续发展,让科技进步真正造福全人类。比如', metadata={'source': 'example.docx'}),
Document(page_content='人工智能(Artificial Intelligence,简称AI)是计算机科学的一个重要分支,旨在研究、开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。人工智能的核心目标是让机器能够像人类一样进行感知、推理、学习、规划和决策,从而完成复杂的任务。', metadata={'source': 'example.docx'}),
Document(page_content='人工智能的发展经历了符号主义、连接主义和行为主义等多个阶段。近年来,随着大数据、云计算和深度学习等技术的突破,AI在语音识别、图像处理、自然语言理解、自动驾驶、医疗诊断、金融风控等领域取得了显著进展。深度神经网络的应用,使得机器能够自动从海量数据中提取特征并进行高效学习,大大提升了AI系统的智能水平。', metadata={'source': 'example.docx'}),
Document(page_content='人工智能不仅推动了科技创新,也正在深刻改变着社会的生产和生活方式。智能助手、推荐系统、智能家居、智慧城市等应用场景日益普及,为人们带来了极大的便利和效率提升。同时,AI的发展也带来了诸如隐私保护、伦理道德、就业结构变化等新的挑战,需要社会各界共同关注和应对。', metadata={'source': 'example.docx'}),
Document(page_content='智元科技是一家专注于人工智能技术研发与应用的高科技企业。公司致力于将前沿的AI算法与大数据、云计算等新一代信息技术深度融合,推动智能化解决方案在各行各业的落地。智元科技的核心业务涵盖智能语音识别、自然语言处理、计算机视觉、智能机器人等领域,广泛服务于金融、医疗、教育、制造等行业客户。公司拥有一支由资深AI专家和工程师组成的研发团队,注重自主创新与技术积累,已获得多项核心专利和软件著作权。秉承“智能引领未来,创新驱动发展”的理念,智元科技不断推动人工智能技术的产业化进程,助力企业数字化转型与社会智能化升级。', metadata={'source': 'example.docx'}),
Document(page_content='总之,人工智能作为引领新一轮科技革命和产业变革的核心驱动力,正不断拓展人类的能力边界,推动社会进步与经济发展。未来,随着技术的持续演进,AI将在更多领域展现出巨大的潜力和价值。', metadata={'source': 'example.docx'})],
'question': 'what is the document about? Answer in Chinese',
'source': 'example.docx',
'intermediate_steps': [{'answer': 'Helpful Answer: 这篇文档主要介绍了人工智能(AI)的相关内容,包括其定义(计算机科学分支,开发执行人类智能任务的系统)、发展背景(深度学习和大数据推动)、在各领域的应用(如医疗辅助诊断、金融数据分析、智能家居、教育个性化学习、交通智能系统等)、带来的便利及引发的挑战(隐私保护、伦理道德、就业影响、数据安全、算法偏见等),并展望了未来趋势(技术创新、与物联网/大数据/云计算融合、产业升级、监管机制与伦理规范建设、国际合作等),强调AI作为科技革命驱动力将引领全球创新,需推动自主创新与可持续发展以造福人类。',
'score': '90'},
{'answer': 'Helpful Answer: 该文档主要介绍了人工智能(Artificial Intelligence,简称AI),指出其是计算机科学的一个重要分支,旨在研究、开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。其核心目标是让机器能够像人类一样进行感知、推理、学习、规划和决策,从而完成复杂的任务。',
'score': '100'},
{'answer': 'Helpful Answer: 该文档主要讨论了人工智能的发展历程(包括符号主义、连接主义和行为主义等阶段),以及近年来在大数据、云计算、深度学习等技术突破的推动下,AI在语音识别、图像处理、自然语言理解、自动驾驶、医疗诊断、金融风控等领域取得的显著进展,还提到深度神经网络使机器能够自动从海量数据中提取特征并高效学习,提升了AI系统的智能水平。',
'score': '100'},
{'answer': 'Helpful Answer: 该文档主要讨论了人工智能的作用与影响,包括推动科技创新、深刻改变社会生产和生活方式(如智能助手、推荐系统、智能家居、智慧城市等应用的普及为人们带来便利和效率提升),同时也带来了隐私保护、伦理道德、就业结构变化等新挑战,需要社会各界共同关注和应对。',
'score': '95'},
{'answer': 'Helpful Answer: 这篇文档主要介绍了智元科技的相关信息。智元科技是一家专注于人工智能技术研发与应用的高科技企业,致力于将前沿AI算法与大数据、云计算等新一代信息技术深度融合,推动智能化解决方案在各行各业的落地。其核心业务涵盖智能语音识别、自然语言处理、计算机视觉、智能机器人等领域,广泛服务于金融、医疗、教育、制造等行业客户。公司拥有一支由资深AI专家和工程师组成的研发团队,注重自主创新与技术积累,已获得多项核心专利和软件著作权。秉承“智能引领未来,创新驱动发展”的理念,智元科技不断推动人工智能技术的产业化进程,助力企业数字化转型与社会智能化升级。',
'score': '100'},
{'answer': 'Helpful Answer: 该文档主要讨论了人工智能作为引领新一轮科技革命和产业变革的核心驱动力,不断拓展人类能力边界,推动社会进步与经济发展,并指出未来随着技术持续演进,AI将在更多领域展现出巨大潜力和价值。',
'score': '100'}],
'output_text': 'Helpful Answer: 该文档主要介绍了人工智能(Artificial Intelligence,简称AI),指出其是计算机科学的一个重要分支,旨在研究、开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。其核心目标是让机器能够像人类一样进行感知、推理、学习、规划和决策,从而完成复杂的任务。'}
map re-rank chain 让大模型在多文档场景下自动“找最优答案”,适合高精度检索问答和智能筛选。