大模型之路

RAG：2025年检索增强生成前沿技术完全指南

一、RAG技术的核心突破与行业影响

在生成式人工智能爆发的今天，检索增强生成（Retrieval-Augmented Generation, RAG）正以其独特的技术架构，成为连接静态知识库与动态生成能力的桥梁。这项诞生于2020年的创新技术，通过将信息检索（Retrieval）与文本生成（Generation）解耦又融合的设计，突破了传统语言模型“幻觉”问题的桎梏，为构建可信、可控、可扩展的AI系统奠定了基础。

根据Gartner最新报告，2024年全球已有45%的企业在智能客服、数据分析等场景中部署RAG系统，预计到2025年这一比例将突破68%。在医疗领域，梅奥诊所通过RAG构建的医学问答系统，将病历检索效率提升了300%；金融行业的摩根大通，利用RAG技术实现了法律文档审查效率的400%增长。这些数据印证了RAG正在成为企业级AI落地的核心基础设施。

二、RAG基础架构的技术解析

2.1 三模块协同工作机制

RAG的经典架构由三大模块构成：

检索系统
：负责从知识库中提取相关信息。主流方案采用基于Transformer的句子编码器（如Sentence-BERT）生成文档嵌入向量，结合FAISS、Milvus等向量数据库实现高效语义检索。
生成模型
：基于检索到的上下文生成回答。常用模型包括GPT系列、LLaMA、PaLM等大语言模型，通过提示工程（Prompt Engineering）引导生成符合要求的内容。
融合机制
：解决外部知识与模型参数的融合问题。常见方法包括早期融合（检索阶段调整查询向量）、晚期融合（生成阶段拼接上下文）和混合融合（多阶段动态调整权重）。

2.2 基础RAG的代码实现

# 基于Hugging Face的基础RAG实现from sentence_transformers import SentenceTransformerimport faissfrom transformers import pipelineclass BasicRAG:    def __init__(self, documents):        self.documents = documents        self.encoder = SentenceTransformer("all-MiniLM-L6-v2")  # 文本编码        self.retriever = faiss.IndexFlatIP(768)  # FAISS向量索引        self.generator = pipeline("text-generation", model="gpt2")  # 生成模型        self._build_index()    def _build_index(self):        embeddings = self.encoder.encode(self.documents)        self.retriever.add(embeddings.astype('float32'))    def retrieve(self, query, k=3):        query_emb = self.encoder.encode([query])        _, indices = self.retriever.search(query_emb.astype('float32'), k)        return [self.documents[i] for i in indices[0]]    def generate(self, query, context):        prompt = f"Context: {context}\nQuestion: {query}\nAnswer:"        return self.generator(prompt, max_length=200)[0]["generated_text"]

三、2025年七大前沿RAG技术解析

3.1 CRAG：带纠错机制的增强检索

CRAG（Corrective RAG）通过置信度过滤和外部搜索机制，解决传统RAG的“误检索”问题。其核心创新在于：

双层验证机制
：首先通过余弦相似度筛选高置信度文档（阈值通常设为0.7），对低置信度结果触发二次检索（如调用Google Scholar API）。
领域适配优化
：在医疗等专业领域，引入领域特定语言模型（如BioBERT）进行语义编码，使检索准确率提升42%。

应用案例：

辉瑞制药构建的药物问答系统中，CRAG将药物相互作用查询的准确率从78%提升至95%，显著降低了因信息错误导致的用药风险。

3.2 CAG：思维链驱动的多步推理

CAG（Chain-of-Thought RAG）将复杂问题拆解为序列化子任务，实现“检索-推理-再检索”的循环迭代。关键技术点包括：

层次化提示工程
：使用“问题拆解提示+阶段推理提示+结果合成提示”的三级提示体系，引导模型进行结构化思考。
证据链追踪
：为每个推理步骤关联具体文档片段，生成可追溯的决策路径，满足审计合规要求。

技术实现：

class CAG:    def decompose_query(self, query):        # 使用LLM拆解问题为子步骤        prompt = f"请将以下问题拆解为3-5个子问题：{query}"        return self.llm(prompt)["steps"]    def chain_reasoning(self, query):        steps = self.decompose_query(query)        context = ""        for step in steps:            docs = self.retrieve(step)            reasoning = self.llm(f"根据{docs}，分析{step}")            context += f"{step}: {reasoning}\n"        return self.llm(f"基于以上分析，回答原始问题：{query}")

3.3 Graph RAG：知识图谱中的语义导航

Graph RAG通过引入知识图谱（KG），将文档级检索升级为实体级推理，适用于需要深度语义理解的场景：

图结构编码
：使用GCN（图卷积网络）、GraphSAGE等模型对实体关系进行向量化表示，捕捉“实体-属性-关系”的三元组语义。
多跳检索策略
：基于BFS（广度优先搜索）实现3-5跳范围内的关联实体检索，支持“人物-事件-时间”等复杂关系查询。

应用场景：

在智能电网领域，国家电网利用Graph RAG构建的故障诊断系统，可通过“变压器温度异常→附近线路负载→历史故障记录”的3跳检索，将故障定位时间从2小时缩短至15分钟。

代码示例：

import networkx as nxfrom neo4j import GraphDatabaseimport torchfrom torch_geometric.nn import GCNConvclass GraphRAG:    def __init__(self, neo4j_uri, username, password):        self.driver = GraphDatabase.driver(neo4j_uri, auth=(username, password))        self.graph = nx.Graph()        self.build_graph()  # 构建知识图谱    def build_graph(self):        """从Neo4j加载节点和关系"""        with self.driver.session() as session:            nodes = session.run("MATCH (n) RETURN n.id, n.type, n.properties")            edges = session.run("MATCH (a)-[r]->(b) RETURN a.id, b.id, type(r)")            for node in nodes:                self.graph.add_node(node['id'], type=node['type'], **node['properties'])            for edge in edges:                self.graph.add_edge(edge['source'], edge['target'], relation=edge['relation'])    def graph_walk_retrieve(self, query_entities, max_hops=3):        """基于图游走的检索"""        relevant_subgraph = nx.Graph()        queue = [(entity, 0) for entity in query_entities]        visited = set()        while queue:            current, depth = queue.pop(0)            if depth > max_hops or current in visited:                continue            visited.add(current)            relevant_subgraph.add_node(current, **self.graph.nodes[current])            # 扩展相邻节点（按关系相关性过滤）            for neighbor in self.graph.neighbors(current):                if self.is_relevant_relation(self.graph[current][neighbor]['relation']):                    relevant_subgraph.add_edge(current, neighbor,                                              **self.graph[current][neighbor])                    queue.append((neighbor, depth+1))        return relevant_subgraph

3.4 Agentic RAG：自主决策的智能体架构

Agentic RAG将RAG系统升级为具备规划、执行、反馈能力的智能体，核心能力包括：

动态动作规划
：根据问题复杂度（简单/复杂/极复杂）自动生成检索-验证-生成的组合策略（如图1所示）。
实时反馈学习
：通过用户评分调整置信度阈值，正向反馈使阈值降低5%（更信任结果），负向反馈使阈值提高5%（更谨慎检索）。

代码示例：

from enum import Enumclass AgentAction(Enum):    RETRIEVE = "检索"    GENERATE = "生成"    VERIFY = "验证"    SEARCH_EXTERNAL = "外部搜索"    DECOMPOSE = "拆解"class RAGAgent:    def __init__(self, tools):        self.tools = tools  # 检索/生成/搜索等工具集        self.memory = []  # 对话记忆        self.confidence_threshold = 0.8  # 置信度阈值    def create_action_plan(self, query):        """根据问题复杂度生成动作计划"""        complexity = self.analyze_complexity(query)        if complexity == "简单":            return [{"action": AgentAction.RETRIEVE, "k":3},                    {"action": AgentAction.GENERATE}]        elif complexity == "复杂":            return [{"action": AgentAction.DECOMPOSE},                    {"action": AgentAction.RETRIEVE, "k":5},                    {"action": AgentAction.VERIFY},                    {"action": AgentAction.GENERATE}]        # 其他复杂度层级的策略...

3.5 Adaptive RAG

Adaptive RAG通过用户画像和上下文感知实现“千人千面”的检索生成：

用户画像建模
：构建包含领域偏好（如金融/医疗）、表达风格（简洁/详细）、知识水平（初级/专家）的三维画像模型。
实时自适应机制
：根据当前查询动态调整检索参数，例如为专家用户增加技术文档的检索权重（+30%），为初级用户优先返回通俗解释内容。

数据支持：

某在线教育平台部署Adaptive RAG后，用户完成课程的平均时长缩短28%，知识点掌握率提升19%，体现了个性化服务的显著价值。

代码示例：

class AdaptiveRAG:    def adapt_to_user(self, user_id, query, feedback):        """用户个性化适配"""        profile = self.user_profiles.setdefault(user_id, self.create_profile())        # 更新领域偏好        domain = self.detect_domain(query)        if feedback['rating'] > 3:            profile['domain_preferences'][domain] *= 1.1  # 正向反馈增强偏好        else:            profile['domain_preferences'][domain] *= 0.9  # 负向反馈减弱偏好        # 调整检索参数        k = int(profile['complexity_preference'] * 5)  # 根据复杂度偏好调整k值        return self.base_retriever.retrieve(query, k=k,                                          sources=profile['preferred_sources'])

3.6 Multi Modal RAG：全模态信息的融合革命

Multi Modal RAG打破单一文本的限制，实现文本、图像、音频、视频的跨模态检索生成：

统一编码框架
：采用CLIP、ALBEF等多模态模型，将不同模态数据映射到共享语义空间（如512维向量空间）。
跨模态检索策略
：支持“以图搜文”“以文搜视频”等混合检索，例如输入“肺部CT影像”可检索到相关诊断报告和手术视频。

医疗应用案例：

约翰霍普金斯医院的Multi Modal RAG系统，可将病理切片图像与临床记录联合分析，使癌症诊断准确率提升至98.7%，接近资深病理学家水平。

代码示例：

class MultiModalRAG:    def __init__(self):        self.clip_model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")        self.processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")    def encode_multimodal(self, data):        """多模态编码"""        embeddings = {}        if 'text' in data:            embeddings['text'] = self.clip_model.get_text_features(                **self.processor(text=data['text'], return_tensors="pt")            )        if 'image' in data:            embeddings['image'] = self.clip_model.get_image_features(                **self.processor(images=Image.open(data['image']), return_tensors="pt")            )        # 音频/视频编码逻辑...        return embeddings    def cross_modal_search(self, query, modalities=['text', 'image']):        """跨模态检索"""        query_emb = self.encode_multimodal({'text': query}) if 'text' in modalities else None        results = []        for modality in modalities:            results.extend(self.index[modality].search(query_emb[modality], k=5))        # 多模态融合排序（考虑模态数量加权）        return sorted(results, key=lambda x: x['score'] * (1 + 0.1*len(x['modalities'])), reverse=True)

3.7 W-RAG：连接实时世界的知识管道

W-RAG解决传统RAG的知识滞后问题，实现本地知识库与网络信息的动态融合：

时效性感知检索
：对包含“最新”“2025年”等时间关键词的查询，自动触发网络搜索，优先返回1小时内的实时数据。
可信度评估模型
：基于来源权威性（如Nature影响因子）、内容一致性（跨平台交叉验证）构建可信度评分体系，过滤虚假信息。

金融场景应用：

高盛集团的W-RAG系统实时整合彭博终端数据与内部研究报告，使交易策略的市场响应速度提升至秒级，日均交易收益增长12%。

代码示例：

class WebEnhancedRAG:    async def hybrid_retrieve(self, query):        """本地+网络混合检索"""        local_results = await self.local_retriever.retrieve(query)        # 判断是否需要网络搜索        if self.needs_web_search(query, local_results):            web_results = await self.async_web_search(query)            # 结果融合（本地结果加权0.6，网络结果0.4）            return [{'content': lr['content'], 'score': lr['score']*0.6} for lr in local_results] + \                   [{'content': wr['snippet'], 'score': wr['relevance']*0.4} for wr in web_results]        return local_results    def needs_web_search(self, query, results):        """判断网络搜索必要性"""        return any(word in query for word in ['最新', '最近', '实时']) or \               any(result['score'] < 0.7 for result in results) or \               self.is_dynamic_topic(query)  # 动态主题检测（如新闻、股市）

四、RAG技术的未来演进方向

4.1 技术突破方向

因果RAG（Causal RAG）
：从相关性检索迈向因果推理，支持“如果-那么”（What-If）分析，例如模拟政策变化对经济的影响。
量子RAG（Quantum RAG）
：结合量子计算加速大规模向量检索，预计2028年可实现亿级文档的亚秒级检索。
生物启发RAG（Biological RAG）
：模仿人类大脑的海马体-皮层记忆系统，构建分层记忆架构，提升长时记忆检索效率。

4.2 应用场景拓展

太空探索
：在火星探测器中部署RAG系统，实时分析地质数据并生成探测路径建议。
脑机接口
：将RAG与神经信号解码结合，实现“意念检索-思维生成”的直接交互。
量子物理研究
：通过RAG系统自动检索量子实验数据，辅助验证弦理论等复杂假说。

五、企业级RAG落地实践指南

5.1 技术选型策略

场景类型	推荐RAG技术	关键指标
客服问答	CRAG + W-RAG	回答准确率>95%
科学研究	CAG + Graph RAG	推理步骤可追溯性
个性化推荐	Adaptive RAG + Multi Modal	用户满意度提升>20%
实时监控	W-RAG + Agentic RAG	响应延迟<500ms

5.2 实施路线图

POC阶段（1-3个月）
：选择单一业务场景（如发票识别），使用开源框架（LangChain+FAISS）搭建原型系统，验证检索生成效果。
扩展阶段（3-6个月）
：引入多模态数据，集成企业知识库（SharePoint/Confluence），部署实时监控仪表盘（Grafana+Prometheus）。
优化阶段（6-12个月）
：接入用户反馈系统，通过强化学习（RLHF）优化检索生成策略，实现模型的持续进化。
规模化阶段（12个月以上）
：构建跨部门的RAG中台，支持API级服务输出，实现成本的集中管理与效率提升。

5.3 风险管控要点

幻觉治理
：建立“检索可信度评分+生成内容校验”的双重防线，对低可信度内容强制标注“可能存在不确定性”。
数据安全
：采用联邦学习（Federated Learning）训练领域模型，确保医疗、金融等敏感数据不出本地。
伦理合规
：开发可解释性插件，生成决策过程的自然语言解释，满足GDPR等合规要求。

六、RAG定义AI的可信未来

从实验室走向企业级应用，RAG正在重新定义AI系统的构建范式。它通过“检索增强生成”的核心理念，既保留了大语言模型的创造性，又赋予其可追溯、可验证的可信属性。到2025年，随着七大前沿技术的成熟落地，RAG将不再局限于工具层面的优化，而是成为驱动各行业智能化转型的核心引擎。

对于企业而言，现在正是布局RAG技术的黄金窗口期。无论是构建智能客服、辅助科学发现，还是创新用户体验，RAG都将成为突破数据壁垒、释放AI价值的关键钥匙。正如深度学习重新定义了感知智能，RAG正在书写认知智能的新篇章——一个可信、可控、充满无限可能的AI未来。

你可能感兴趣的:(RAG,rag,检索增强生产,llm)

【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
善吃五色五味，女人更妖娆，想漂亮享受健康美味吃起来余老师讲健康
善吃五色五味，女人更妖娆我们所说的五色五味是指具有赤、青、黄、白、黑五种颜色以及酸、辛、甘、苦、咸五种味道的食物。其实五味和五色与人体的五脏对应，养生必养五脏，通过五味、五色的食物可以调养人的容颜。一、赤色、苦味入心——养颜，面色红润有句话这么说，“会吃的女人更漂亮，贪吃的女人变糟粕。”经过科学、合理搭配的五色五味饮食，就是最天然、最安全的美容药方。赤色——抗衰老，增强免疫力，改善血液循环。赤色即
北斗短报文兜底、5G-A增强：AORO P1100三防平板构建应急通信网络
公网中断的灾区现场，泥石流阻断了最后一条光缆。一支救援队却在废墟间有序穿行，队长手中的三防平板正闪烁着北斗卫星信号，定位坐标与伤亡信息化作一行行短报文，穿透通信孤岛直达指挥中心。这是AOROP1100三防平板搭载的北斗短报文功能在应急救援中的真实场景，更代表了工业移动终端在极端环境下的能力跃迁。AOROP1100三防平板作为遨游通讯2025年推出的旗舰三防设备，AOROP1100三防平板的技术基底
求解——妊娠纹霜哪个牌子好？皮肤专家推荐的热门秘诀！ zhangxing0100
妊娠纹会严重影响女性的美观，那孕期的女性朋友该如何避免减少妊娠纹的出现呢?下面美腹丽人小编为大家分享了预防妊娠纹的方法，赶紧一起来学习吧!一、预防妊娠纹的饮食习惯1、多食用对皮肤内胶原纤维有利的食品来增强皮肤的弹性。2、控制糖分摄入，少吃色素含量高的食物。3、早晚两杯脱脂牛奶，多食用维丰富的蔬菜、水果和富含维生素及矿物质的食物，增加细胞膜的通透性和皮肤的新陈代谢功能。4、正确的喝水习惯可以提速皮肤
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
复杂工况下泵组的 “健康秘籍”：从监测到维护的全攻略缘华工业智维人工智能制造运维
在工业生产的宏大版图中，泵组堪称默默耕耘的“幕后英雄”，承担着流体输送的重任，如同人体循环系统中的血管，确保生产流程的顺畅运行。然而，泵组常常面临复杂工况的挑战，这犹如让它们在崎岖蜿蜒、障碍重重的道路上负重前行，对其健康状况构成诸多威胁。因此，深入了解复杂工况下泵组的运行状况，实施全面、科学的健康管理，对于保障生产的连续性与稳定性、控制运营成本，有着举足轻重的意义。复杂工况：泵组运行的“荆棘之路”
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
牢记初心使命勇于担当作为 dc7bce189fd7
初⼼就是情怀，使命就是担当。初⼼和使命是⼀个⼈、⼀个民族、⼀个政党不断前进的根本动⼒。“不忘初⼼，⽅得始终”“能否敢于负责、勇于担当，最能看出⼀个⼲部的党性和作风”。坚定初心使命，笃定理想信念。作为⼀名党员⼲部，要树⽴坚定的理想信念，理想信念是我们精神上的“钙”。没有理想信念，理想信念不坚定，精神上就会“缺钙”，就会得“软⾻病”。进一步增强“四个意识”、坚定“四个自信”、做到“两个维护”，不断提高
2018年4月21日真昼之月
因为之前周末都是一起床就玩FM然后就不知不觉沉迷，所以这次试着先玩兰斯10试试（。）总之战力稳步增强中，但是直到13T退潮都没遇到海战路线选择，难道这次又要进魔王凯布利斯BE了？！之后打FIFA的联机联赛，新阵容感觉就那样吧，找到感觉后D4轻松升级，但是D3还是会输。之后TOTS活动出来后估计阵容劣势会进一步放大（←无氪党），估计今年是没法再上D1了……以及防守还是做不好，头疼。晚饭前后玩了会儿F
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
小宇20210329一善一美爆发中的小宇宙
今日善今天送大宝上学正好碰见了邻居，然后等着她送完娃搭她一起回小区；只要碰见了邻居，我都会邀请她们坐我的小白回家今日美刚刚写完“小宇与幸福力的故事”，感觉特别舒服，没有想到居然被锁了，我还不是很明白，还好我生产了图片，不管你锁不锁，都不能影响我与幸福力的故事。附图
2023年做什么行业最赚钱夕阳行业还有赚钱机会么目前哪些行业比较赚钱测评君高省
在快手上面看到赚钱案例，大体的意思是，一个专门做DVD的厂家这几年随着移动设备越来便捷，后自己的生意不是很好干，于是想把自己的DVD卖到非洲去，在非洲一年后，才发现自己的做的产品利润已经压到了最低，但是仍然卖不过印度人制作的！原来他们的产品生产成本更低，比如我们的工资在一些小县城也就2000元左右，而印度人工资在二三百人民币！所以他们的生产成本更低！那怎么办呢？他说自己什么也不会干，只会干dvd！
搜索引擎技术选型 dusty_giser
近期，业主对POI检索提出了一些想法，针对之前简单的WordSegment分词和模糊匹配搜索需要进行一些更为符合业主需求的调整。于是这几天对搜索引擎进行了一些技术选型；一、ApacheLucene Lucene是一个开源的高性能、可扩展的全文检索引擎工具包，但不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎。所以它是一套信息检索工具包，可以说是当今最先进
涵盖轻量级锁（SpinLock）与操作系统同步原语（如 CRITICAL_SECTION）的性能优化、Monitor 的原子性和数据竞争防护、Monitor.Wait 和 Pulse 在生产者-消费者 zhxup606 C#实战教程李工篇 wpf 开发语言 C#
涵盖轻量级锁（SpinLock）与操作系统同步原语（如CRITICAL_SECTION）的性能优化、Monitor的原子性和数据竞争防护、Monitor.Wait和Pulse在生产者-消费者中的作用、控制线程执行顺序、Thread.Join的含义、避免嵌套锁的锁顺序策略，以及防止伪唤醒的条件检查。每个问题包括核心概念、实现细节、与之前讨论的关联（如线程池、进程间同步、分布式同步）、代码示例、测试用
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
蚂蚁在觅食过程中通过释放信息素来引导同伴的行为，这种自然现象确实为蚂蚁算法（Ant Colony Optimization, ACO）的设计提供了灵感 Bol5261 engineering)ACO(Ant Colony Optimization)Data(Structures Algorithms)算法
蚂蚁在觅食过程中通过释放信息素来引导同伴的行为，这种自然现象确实为蚂蚁算法（AntColonyOptimization,ACO）的设计提供了灵感。以下是关于蚂蚁算法的一些详细解释：蚂蚁算法的基本原理模拟蚂蚁的行为：每只蚂蚁在路径上移动时，会根据路径上的信息素浓度来选择下一步的移动方向。信息素浓度越高，选择该路径的概率越大。蚂蚁在找到食物后返回蚁巢时，会在路径上释放信息素，增强该路径的信息素浓度。随
Navicat 全面支持金仓数据库 KingbaseES，为金仓生态圈注入新动能 Navicat中国 Navicat 17 焕新上市 Navicat 免费版数据库
近日，我们宣布Navicat系列产品全面支持中电科金仓（北京）科技股份有限公司旗下金仓数据库管理系统KingbaseES。KingbaseES是面向全行业、全客户关键应用的企业级大型通用融合数据库产品，适用于事务处理类应用、数据分析类应用、海量时序数据采集检索类应用、要求苛刻的互联网等应用场景。这次合作，不仅是Navicat在数据库管理领域的又一重要里程碑，更凭借卓越的技术为金仓数据库的生态注入新
多光谱相机助力第四次全国农业普查-农业用地调查中达瑞和-高光谱·多光谱数码相机
国家政策背景：耕地保护，国之大者粮食安全是“国之大者”，耕地是粮食生产的命根子。近年来，国家将耕地保护提升到前所未有的战略高度：严守18亿亩耕地红线：这是保障国家粮食安全的底线要求。坚决遏制耕地“非农化”、防止“非粮化”：明确要求对耕地用途实施最严格的管制，确保耕地主要用于粮食和棉、油、糖、蔬菜等农产品生产。《国务院关于开展第四次全国农业普查的通知》（国发〔2025〕9号）正式发布。根据通知，国务
yolo 目标检测600类目标大霸王龙行业+领域+业务场景=定制 YOLO 目标检测人工智能
1.模型架构调整类别适配：将YOLO输出层的类别节点数调整为600（如YOLOv5的detect.yaml中修改nc=600），并更新类别名称映射表（classes.txt）。骨干网络优化：若使用YOLOv5/v8，可升级骨干网络（如C3模块深度）或替换为更高性能的主干（如EfficientNet、ResNet-101），以增强复杂场景的特征提取能力。多尺度检测头：保留或扩展YOLO的多尺度输出（
2025年7月技术问答第1期大势智慧实景三维三维建模教程问答答疑干货
1.如图，用重建大师时重建好几次空间区域都是空的，周围的建模成功，该如何处理？答：确定下是中间两个缺失瓦块的名称，可以对瓦块右键清理中间结果，重新提交下生产。2.网格大师可以合并OSGB和3Dtiles的根结点吗，，不是想要的单独只有一个目录的那种，是不是只有最高级的那个文件夹里面的瓦片才是最终结果？答：根节点合并，只合并头文件，不会把瓦块整个合并。网格大师是一款能够解决实景三维模型空间参考、原点
Terraform 系列-Terraform Cloud 比 Terraform OSS 有哪些增强？东风微鸣
系列文章Terraform系列文章前言最近在使用TerraformCloud来置备OCI的AlwaysFreeTier,发现它非常好用，相比TerraformOSS,用起来省心多了。也借此总结学习下：TerraformCloud比TerraformOSS有哪些增强，这些增强功能面向哪些客户，解决了哪些痛点？可以作为我们基于Terraform开发自己的IaC云平台的经验。TerraformOSS的功
算力驱动新质生产力：应用实践与发展路径智能计算研究中心其他
内容概要算力作为新质生产力的核心驱动力，正通过技术创新与场景融合重构产业生态。当前算力发展呈现多维突破态势：在基础架构层面，异构计算与模型压缩技术推动硬件资源利用率提升；在应用场景端，工业互联网算力优化生产流程，智能安防算力实现毫秒级风险响应；在系统协同方面，算力调度机制与能效优化策略形成动态平衡网络。随着国家算力网战略推进，芯片架构创新、绿色数据中心建设与算力租赁模式正加速形成产业链闭环，为量子
100天写作计划之Day12巧妙应对拖延，开挂的人生便开始了（下） Tobey写作100天计划
接着昨天的分享，今天继续分享拖延应对措施：我们得想想办法帮帮未来的我（前额叶）、让它做出正确的选择，站到正义的队伍里。3、前额叶就像全身的肌肉一样，也是可以锻炼的！就像，积极心理学之父马丁塞利格曼在《意志力》一书里这样说的「意志力像肌肉一样，过度使用就会疲劳，长期锻炼就会增强。」同理，长此以往的拖延，前额叶的抑制冲动的能力也会减弱，从而陷入恶性循环。接下来，我就和大家分享几个既能帮助前额叶有效地对
怎样理解在新阶段以改革创新精神推进党的建设新的伟大工程大熊在友谊
首先，以改革创新精神全面推进党的建设新的伟大工程，是顺利完成党肩负的执政使命的现实需要。改革创新是当今时代精神的核心，也是增强党的创造力、凝聚力、战斗力的必由之路。中国特色社会主义事业是改革创新的事业。党领导的中国特色社会主义伟大事业，要靠党的建设新的伟大工程来保证。我们党作为领导中国特色社会主义伟大事业的马克思主义政党，要始终保持蓬勃生机和旺盛活力，始终成为中国特色社会主义事业的坚强领导核心，始
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
基于知识图谱技术增强大模型RAG知识库应用效果罗伯特之技术屋知识图谱人工智能
【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
金英沧州焦点解决初64中17，本周第六次、第七次约练，第355次、第356次分享，坚持分享第65天守护甜心
第355次分享观摩一场咨询展示，来访者开始叙述的时候情绪差，能量很低。当咨询师看到她的优势，询问他为了改变做了很多努力，他的是怎么做到的时候，他的情绪就发生了变化。看到自己的优势，语气变得轻松了，语句中还带着一丝骄傲，这么难我都做到了。通过这次咨询，来访者增强了自己能解决问题的信心。第356次分享但妈妈想改变孩子而求助的时候，这样的咨询是不能接的。即使真的接了，也要弄清咨询目标到底以谁的目标为准。
BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb