汪汪汪侠客

源码解析（一）：GraphRAG

原文技术博客

GraphRAG 通过从非结构化文本构建知识图谱并将其用于检索，增强了传统的 RAG 系统。与仅依赖向量相似度的标准 RAG 方法不同，GraphRAG 提取实体和关系，执行社区检测，并生成不同层级的报告。这种结构化方法为语言模型提供了更多上下文和关系信息，从而产生更全面、更准确的响应。

系统框架

实体提取 (Entity Extraction)

从非结构化或半结构化数据（如文本、表格）中识别并抽取出具有特定语义的独立对象（如人名、地点、机构、时间等）。
图谱构建 (Knowledge Graph Construction)

将提取的实体和它们之间的关系组织成结构化网络的过程，形成“节点-边-属性”三元组（如**<人物, 就职于, 公司>**）。
社区检测 (Community Detection)

在图结构中自动发现紧密连接的子图（社区），使社区内部连接密集，社区之间连接稀疏。
社区报告 (Community Reporting)

对检测到的社区进行统计、分析和可视化，描述其规模、关键节点、语义特征及与其他社区的关系。
向量化 (Embedding)

将知识图谱中的实体和关系映射为低维数值向量（如用[0.2, -0.5, 1.3]表示“北京”），以便机器学习模型处理语义和相似性计算。

安装与使用

软件要求

Python 3.10-3.12
OpenAI API 密钥或 Azure OpenAI 访问权限（或者其他大模型的接口API）

pip直接安装

pip install graphrag

快速使用

项目初始化

graphrag init --root ./myproject

上述指令将创建下面3个配置文件：

settings.yaml：基础配置文件
.env：环境配置文件
prompts/：提示模板

用户数据准备

将自己的数据放在输入目录中：

mkdir -p ./myproject/input

GraphRAG 支持以下输入格式：

文本文件（.txt）
**text**带有列的 CSV 文件
**text**带有字段的 JSON 文件

自动化构建知识图谱

graphrag index --root ./myproject

这个过程：

将文档分成文本单元
提取实体和关系
构建知识图谱
创建社区集群
生成社区报告
嵌入文本以进行矢量搜索

查询知识图谱

索引完成后，使用以下几种搜索方法之一查询数据：

graphrag query --root ./myproject --method global --query "What are the main themes in this dataset?"

多种查询方法

#全局搜索
graphrag query --method global --query "What are the primary themes?"
#本地搜索
graphrag query --method local --query "Tell me about Entity X and its relationships"
#DRIFT搜索
graphrag query --method drift --query "What is the significance of Entity X in the broader context?"
#基本搜索
graphrag query --method basic --query "Find information about X"

核心模块代码解读

图谱构建

实体和关系提取是 GraphRAG 索引流程中的关键组件，它将纯文本转换为结构化知识图谱。此过程从文本文档中识别关键概念（实体）并确定它们之间的关系，从而实现比传统 RAG 系统更复杂的信息检索和推理能力。

GraphRAG 使用自然语言处理技术从文本单元（文档块）中提取实体和关系。这构成了知识图谱的基础，并支持高级查询功能。

主要代码文件：

graphrag/index/workflows/extract_graph_nlp.py
graphrag/index/operations/build_noun_graph/build_noun_graph.py

实体提取

GraphRAG 提供了多个提取器来从文本中识别实体，每个提取器在准确性、语言支持和性能方面都有不同的权衡。

#graphrag/index/operations/build_noun_graph/build_noun_graph.py
async def _extract_nodes(
    text_unit_df: pd.DataFrame,
    text_analyzer: BaseNounPhraseExtractor,
    num_threads: int = 4,
    cache: PipelineCache | None = None,
) -> pd.DataFrame:

名词短语提取

可用的提取器有：

句法分析提取器：通过 SpaCy 进行依赖项分析和命名实体识别 (NER)。此提取器结果准确，支持多种语言，但速度比其他选项慢。

graphrag/index/operations/build_noun_graph/np_extractors/syntactic_parsing_extractor.py

上下文无关语法 (CFG) 提取器：使用上下文无关语法规则来识别名词短语。这在速度和准确性之间取得了平衡。

graphrag/index/operations/build_noun_graph/np_extractors/cfg_extractor.py

正则表达式提取器：使用专门针对英文文本的正则表达式。这是最快的选项，但仅适用于英文内容。

graphrag/index/operations/build_noun_graph/np_extractors/regex_extractor.py

实体提取过程遵循以下步骤：

文本分析：使用配置的名词短语提取器分析每个文本单元
名词短语识别：提取器识别潜在的名词短语
过滤：短语根据启发式方法进行过滤，例如：
- 排除特定的词性标记或实体类型
- 验证令牌长度
- 识别复合词或专有名词
聚合：合并相似的名词短语，并生成频率计数

graphrag/index/operations/build_noun_graph/build_noun_graph.py

关系提取

实体之间的关系是根据同一文本单元内的共现情况来识别的。具体流程如下：

对于每个文本单元，在其中提到的所有实体之间创建连接
计算每个实体对在所有文本单元中同时出现的次数
可选地使用逐点互信息 (PMI) 对权重进行归一化

#graphrag/index/operations/build_noun_graph/build_noun_graph.py
def _extract_edges(
    nodes_df: pd.DataFrame,
    normalize_edge_weights: bool = True,
) -> pd.DataFrame:

使用 PMI 进行权重归一化

PMI 权重计算通过将观察到的共现频率与实体独立出现时的预期频率进行比较来突出显示重要的关系：

PMI(x,y) = log2(p(x,y) / (p(x) * p(y)))

其中：

p(x,y) = 实体 x 和 y 共现的频率
p(x) = 实体 x 的频率
p(y) = 实体 y 的频率

这种规范化对于区分有意义的关系和巧合的共现尤为重要。

图谱配置

实体和关系提取通过**ExtractGraphNLPConfig**GraphRAG 配置中的部分进行配置：

名称	描述	默认
`normalize_edge_weights`	是否使用 PMI 作为边权重	`True`
`concurrent_requests`	提取线程数	`4`
`text_analyzer.extractor_type`	提取器的类型：语法、cfg 或正则表达式	`'syntactic'`
`text_analyzer.model_name`	SpaCy 模型名称	`'en_core_web_sm'`
`text_analyzer.max_word_length`	最大字长	`15`
`text_analyzer.include_named_entities`	包括命名实体	`True`
`text_analyzer.exclude_nouns`	要排除的停用词	（常见停用词列表）
`text_analyzer.exclude_entity_tags`	要排除的实体类型	`[]`
`text_analyzer.exclude_pos_tags`	要排除的 POS 标签	`['DET', 'PUNCT', 'ADP']`

输出格式

实体和关系提取的输出由两个数据框组成：

实体数据框：

title：实体文本（名词短语）
frequency：实体出现的频率
text_unit_ids：实体出现的文本单元的 ID
type：实体类型（默认：“名词短语”）
description：实体描述（初始为空）

关系数据框：

source：源实体
target：目标实体
weight：关系强度（共现或 PMI）
text_unit_ids：出现关系的文本单元的 ID
description：关系描述（初始为空）

社区检测

GraphRAG 中的社群检测功能将知识图谱划分为相关实体的层次化集群。这些社群构成了全局搜索功能的基础，并为检索和查询解答提供了结构化的上下文。

代码文件位置：
该**create_communities**函数实现了社区检测工作流程，以实体和关系表作为输入，并生成具有层次结构的社区表。

graphrag/index/workflows/create_communities.py

参数配置

社区检测过程可以通过几个参数进行定制：

范围	描述	默认
`max_cluster_size`	集群的最大大小（实体数量）	在设置中配置
`use_lcc`	是否仅使用最大的连通分量	在设置中配置
`seed`	随机种子用于重复性	无（系统定义）

这些参数可以在配置文件中设置，如测试装置所示：

#tests/fixtures/text/config.json

"create_communities": {
    "row_range": [1, 30],
    "max_runtime": 30,
    "expected_artifacts": ["communities.parquet"]
}

社区检测算法

实际的社区检测由函数执行**cluster_graph**。该函数根据网络连接模式将图划分为多个聚类。

代码文件位置：

graphrag/index/workflows/create_communities.py

聚类受以下配置参数的影响：

max_cluster_size：限制任何单个社区的规模，迫使较大的自然社区分裂成较小的社区
use_lcc：设置为 true 时，仅考虑图中最大的连通分量
种子：为具有随机组件的算法提供可重复性

社区结构

GraphRAG 中的社区采用分层结构组织，允许多层次地组织知识。

每个社区都具有定义其与其他社区关系的属性：

级别：层次结构级别（0 = 顶级）
Parent：父社区的 ID
Children：子社区的 ID

其具体结构模型参数如下：

colum	desc
`id`	唯一标识符 (UUID)
`human_readable_id`	与社区号码匹配的数字标识符
`title`	人类可读的标题（例如“社区 1”）
`level`	层级（0 = 顶部）
`parent`	家长社区ID
`children`	子社区 ID
`entity_ids`	此社区中的实体 ID 列表
`relationship_ids`	两个端点都属于此社区的关系 ID 列表
`text_unit_ids`	与此社区关联的文本单元 ID 列表
`period`	社区创建的 ISO 日期（用于增量更新）
`size`	社区实体数量

图谱存储

存储系统负责在整个索引管道中持久保存所有数据工件，并存储搜索操作中使用的向量嵌入。

存储架构

存储系统负责在整个索引管道中持久保存所有数据工件，并存储搜索操作中使用的向量嵌入。

GraphRAG 采用双层存储架构，包括：

**管道存储：**将结构化数据存储为代表知识图谱组件（文档、文本单元、实体、关系、社区等）的 Parquet 文件。
**向量存储：**用于向量嵌入的专用存储，以实现语义搜索

代码文件位置：

graphrag/utils/storage.py
graphrag/index/update/incremental_index.py
graphrag/vector_stores/azure_ai_search.py

图谱检索

GraphRAG 查询系统提供先进的搜索功能，用于从索引过程中创建的知识图谱中检索和生成答案。与传统的基于向量的 RAG 方法不同，GraphRAG 提供了多种针对不同类型问题优化的搜索策略，充分利用了知识图谱、实体关系和社区层级的丰富结构。

代码文件位置：

#文件夹：graphrag/query/structured_search/
graphrag/query/structured_search/base.py
graphrag/query/factory.py

分为下面四种检索方法：

搜索方法	类名	目的	适合场景
全局搜索	`GlobalSearch`	利用社区报告提供整体理解	关于主题、主题和模式的高级问题
本地搜索	`LocalSearch`	专注于以实体为中心的探索	关于具体实体及其关系的详细问题
DRIFT 搜索	`DRIFTSearch`	灵活遍历的动态推理	复杂的问题需要广泛的背景和具体的细节
基本搜索	`BasicSearch`	传统向量相似性搜索	不需要图形上下文时的简单事实问题

全局搜索

全局搜索旨在解决需要了解整体数据集的广泛、高层次问题。它利用索引过程中生成的社区报告，其中包含不同主题集群的摘要。

全局搜索采用 map-reduce 方法：

上下文构建：根据语义相似性或社区级别选择相关的社区报告
映射阶段：分别处理每个报告块，提取关键点
减少阶段：结合所有报告块的见解来生成全面的答案

该实现支持可选的动态社区选择，它使用 LLM 来识别给定查询最相关的社区报告，而不是使用固定社区级别的所有报告。

本地搜索

本地搜索专注于实体相关的问题，通过检查与查询主题相关的实体、关系和文本单元来解决问题。它旨在提供有关特定实体及其联系的详细答案。

本地搜索过程包括：

实体识别：使用向量相似度查找与查询相关的实体
语境构建：收集与这些实体相关的关系、文本单元以及可选的社区报告
混合上下文创建：结合实体信息、关系和文本证据
响应生成：使用 LLM 根据此焦点上下文创建响应

本地搜索对于有关实体、其属性以及它们与知识图谱中其他实体的关系的特定问题最有效。

DRIFT 搜索

DRIFT（动态推理与灵活遍历）搜索结合了全局搜索和局部搜索的优势，能够为复杂问题提供全面的答案。它采用一种新颖的方法来动态生成和跟踪问题，从而探索知识图谱。

DRIFT Search 主要分为三个阶段：

启动：利用社区报告获得高层次的理解并生成初步的后续问题
探索：对每个后续问题执行本地搜索，并根据发现生成新问题
缩减：将所有收集到的信息合并成一个综合的响应

这种方法创建了知识图谱的动态、迭代探索，允许系统在保持整体背景的同时“深入”到特定领域。

基本搜索

基本搜索提供类似于标准 RAG 系统的传统基于向量的检索方法。它比其他方法更简单，并且没有利用完整的知识图谱结构。

基本搜索流程：

向量搜索：将查询转换为向量并查找相似的文本单元
上下文构建：将这些文本单元组装成提示上下文
响应生成：使用 LLM 根据检索到的文本生成答案

基本搜索对于比较简单的问题或当您想要绕过知识图结构并执行直接文本检索时很有用。

搜索接口使用

API接口

response, context_data = await global_search(
    config=config,
    entities=entities,
    communities=communities,
    community_reports=community_reports,
    community_level=2,
    dynamic_community_selection=True,
    response_type="multiple paragraphs",
    query="What are the main themes in the dataset?"
)

# Streaming API example
async for chunk in global_search_streaming(
    config=config,
    entities=entities,
    communities=communities,
    community_reports=community_reports,
    community_level=2,
    dynamic_community_selection=True,
    response_type="multiple paragraphs",
    query="What are the main themes in the dataset?"
):
    print(chunk, end="")

CLI界面

# Global Search
graphrag query --root ./project --method global --query "What are the main themes in the dataset?"

# Local Search with specific community level
graphrag query --root ./project --method local --community-level 2 --query "Tell me about Entity X"

# DRIFT Search with streaming
graphrag query --root ./project --method drift --streaming --query "What insights can be derived?"

# Basic Search
graphrag query --root ./project --method basic --query "What does the text say about topic Y?"

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

源码解析（一）：GraphRAG

系统框架

安装与使用

软件要求

pip直接安装

快速使用

项目初始化

相关配置的设置

用户数据准备

自动化构建知识图谱

查询知识图谱

多种查询方法

核心模块代码解读

图谱构建

实体提取

关系提取

图谱配置

输出格式

社区检测

图谱存储

存储架构

图谱检索

全局搜索

本地搜索

DRIFT 搜索

基本搜索

搜索接口使用

你可能感兴趣的:(源码解析,graphrag,大模型,算法,面试,rag)