TGITCIC

RAG四件套全解析：模型×向量库×检索×排序，一文打通落地闭环

1. RAG不是拼乐高，是系统工程

企业做AI落地，最常踩的第一个坑，就是把RAG当成“插件式”功能来组装。
上传文档，调个API，再连个大模型——三步走完，结果问“报销流程”出来的是“团建通知”。

问题出在哪？
不是大模型不行，也不是文档没传对。
是你忽略了RAG背后的四大支柱：向量模型、向量库、检索策略、排序机制。这四个环节环环相扣，任意一环掉链子，整个系统就会失准。

很多人以为，只要用上BGE或text2vec，再搭个FAISS，就能实现“语义理解”。
现实却是：用户提问“离职要提前几天”，系统召回的却是“入职培训安排”。

这不是AI不智能，而是你在构建检索链路时，跳过了关键决策点。
就像盖楼不打地基，直接砌墙，风一吹就倒。

我们今天要做的，不是罗列工具清单，而是带你穿透这四层结构，看清每个模块背后的原理、权衡和真实场景适配逻辑。
让你在面对客户需求时，不再靠“听说哪个好用”来做技术选型，而是能基于数据特征、业务目标和资源约束，做出有依据的判断。

2. 向量模型：语义表达的起点，决定上限

2.1 什么是向量模型？

文本进入AI世界的第一步，是被“翻译”成数字向量。
这个过程由Embedding模型完成。它的任务，是将一句话、一段话，压缩成一个固定长度的向量，使得语义相近的文本在向量空间中距离更近。

比如：“关闭灯”和“熄灭照明设备”在词面上不同，但理想状态下，它们的向量应该非常接近。
而“打开灯”虽然只差一个字，语义却相反，向量应足够远。

这就是语义表达能力的核心：能否捕捉细微语义差异。

2.2 选型四大维度

很多人选模型只看“是不是大厂出的”“维度多高”，这是误区。
真正决定效果的，是以下四个维度：

语义表达能力：能不能区分近义词、反义词、上下位关系？
压缩率与维度：384维能否媲美1024维？低维是否意味着低效？
领域适应性：通用模型能否胜任法律、医疗等专业场景？
部署成本与语言支持：能否本地运行？中英文表现是否均衡？

这些不是理论指标，而是直接影响召回质量的实际因素。

2.3 维度≠精度：别被数字迷惑

常见误解：维度越高，效果越好。
事实是：维度只是表达能力的“容器”，不代表实际表现。

举个例子：
BGE-small-zh 是384维，GTE-base是768维，BGE-M3是1024维。
按理说，1024维应该最强。
但在中文客服场景中，BGE-small-zh 的召回准确率反而更高。

原因在于：小模型经过中文语料专项训练，对“请假流程”“打卡异常”这类短句匹配更精准。
而大模型虽表达能力强，但容易“过度泛化”，把“薪资调整”和“调岗申请”也拉近。

维度高，就像一间大房子，能放更多家具。
但如果家具摆得乱，空间再大也没用。

2.4 中文场景主流模型对比

模型名称	维度	优点	适用场景	HuggingFace ID
BGE-M3	1024	通用性强，支持rerank，中英双语	企业级RAG、多语言系统	BAAI/bge-m3
BGE-small-zh	384	轻量、本地部署友好，中文优化好	ToC产品、边缘设备	BAAI/bge-small-zh
text2vec-base-chinese	768	兼容图文对齐，社区支持强	中文项目、图文混合	shibing624/text2vec-base-chinese
GTE-base	768	多语言支持好，OpenAI替代方案	跨境业务、国际化产品	thenlper/gte-base
E5-multilingual	768	英文表现强，中英混合可用	多语言检索	intfloat/multilingual-e5-base
Cohere embed-v3	1024	商用级精度，支持100+语言	高要求国际化系统	API调用

这张表不是让你照抄，而是帮你建立判断框架。
如果你做的是国内企业知识库，优先看中文优化程度；
如果是跨境电商客服，就要考虑多语言覆盖能力；
若资源有限，轻量模型+本地部署才是王道。

2.5 rerank能力：一模两用的价值

注意一个隐藏优势：有些模型不仅能做检索，还能用于重排序（rerank） 。
比如BGE-M3和BGE-Reranker，可以在召回后再次打分，提升Top-K相关性。

这意味着：你只需要维护一套模型，就能覆盖“初筛+精排”两个阶段。
节省部署成本，减少版本错乱风险。

相比之下，text2vec-base-chinese只能用于检索，后续若要rerank，还得引入额外模型，增加复杂度。

所以选型时要问一句：这个模型能不能“一岗多责”？

3. 向量库：不只是存向量，更是性能引擎

3.1 为什么不能用列表存向量？

设想你有10万条知识条目，每条都是768维向量。
用户提问时，系统需要计算Query与每条向量的相似度。

一次计算耗时约0.1ms，10万次就是10秒——用户早就关页面了。

传统线性搜索不可行。
你需要的是近似最近邻搜索（ANN） ，能在毫秒级返回最相似的Top-K结果。

这就必须依赖专业向量库。

3.2 主流向量库能力对比

向量库	语言	特点	本地部署	metadata支持	适用场景
FAISS	C++/Python	Meta出品，轻量快，适合测试	✅	❌（基础版）	本地实验、快速验证
Milvus	C++/Go	工业级，支持混合检索	✅	✅	中大型企业系统
Qdrant	Rust	高性能，REST/gRPC友好	✅	✅	API服务、云原生架构
Weaviate	Go	内置RAG特性，支持GraphQL	✅	✅	hybrid检索、图结构数据
ElasticSearch	Java	老牌搜索引擎，向量功能后加	✅（复杂）	✅	传统搜索升级向量
Chroma	Python	零依赖，LangChain默认	✅	✅	快速开发、轻量项目

这张表背后，是不同团队的技术哲学。

FAISS像一把瑞士军刀，小巧灵活，但功能有限。
它不支持metadata过滤，意味着你无法按“部门=财务”“时间>2023”来筛选结果。

Chroma胜在集成简单，适合原型开发。
但一旦数据量超过10万，性能急剧下降，不适合生产环境。

Milvus和Qdrant则是真正的工业级选手。
Zilliz团队推出的Milvus，在电信、金融领域已有大量落地案例。
其支持结构化字段+向量混合查询，例如：“召回与‘合同终止’语义相近，且签署日期在2024年后的文档”。

Qdrant用Rust编写，内存管理高效，特别适合高并发API场景。
它的metadata索引机制强大，可对标签做范围查询、布尔组合。

Weaviate更进一步，原生支持hybrid检索，能同时处理关键词、向量、图关系。
适合构建复杂知识图谱型应用。

ElasticSearch则是“老将转型”。
原本是文本搜索引擎，后来加入dense_vector字段支持向量。
优势在于已有ES集群的企业可平滑升级，缺点是向量检索性能不如原生库。

3.3 选型建议：按项目阶段决策

本地轻量测试：FAISS 或 Chroma。快速验证想法，无需运维。
中型项目上线：Qdrant 或 Milvus。支持REST接口，便于前后端对接。
高精度混合检索：Weaviate 或 ElasticSearch。关键词+向量联合召回。
大规模稳定部署：Milvus（Zilliz托管版）。企业级SLA保障。

记住：向量库不是“越强越好”，而是“越匹配越好”。
小团队用Milvus集群，反而会被运维压垮。

4. 检索方式：从关键词到混合，层层递进

4.1 三种检索范式

检索方式	技术基础	优点	缺点	典型场景
关键词检索	BM25、TF-IDF	快、可解释	不懂语义	FAQ、日志搜索
向量检索	Embedding + ANN	理解语义	不透明、难调优	RAG问答、推荐
混合检索	向量 + 关键词 + rerank	准、鲁棒	复杂度高	医疗、法律等高要求场景

这三种方式，代表了信息检索的演进路径。

4.2 关键词检索：快但“死板”

BM25是当前最主流的关键词匹配算法。
它基于词频、逆文档频率和字段权重打分，能快速命中包含特定词汇的文档。

例如：用户问“年假几天”，系统直接找含有“年假”“天数”“规定”等词的段落。

优点是响应快、结果可解释。
你知道为什么这条被召回，因为词对上了。

缺点是无法理解语义。
“婚假”和“结婚假期”若未同义词扩展，就会漏召。

更适合标题、标签、代码片段等结构化内容搜索。

4.3 向量检索：语义自由，但代价高昂

向量检索的核心，是让机器“理解”语言背后的含义。

用户问“我最近压力大怎么办”，系统可能召回“心理疏导渠道”“弹性工作申请流程”等内容，即使原文没有“压力大”三个字。

这种能力来自Embedding模型的语义编码。

但它也有明显短板：

不解释召回理由，黑箱操作；
容易误召，比如把“离职流程”也拉进来；
对精确信息（如合同金额）不敏感。

所以纯向量检索，适合开放性问题，不适合精准条款查询。

4.4 混合检索：工业级系统的标配

真正高精度的RAG系统，几乎都采用混合检索架构。

典型流程如下：

用户输入Query；
分别执行向量检索和BM25关键词检索；
合并两路结果，去重并加权打分；
使用reranker进行最终排序。

例如：
向量检索召回50条语义相关文档，BM25召回30条关键词匹配文档。
合并后得到70条候选，再通过BGE-Reranker模型打分，选出Top5返回给大模型。

这种方式兼顾了“广度”与“精度”。
既不会遗漏语义相近内容，又能确保关键词命中。

Weaviate和Qdrant已内置混合检索支持，Milvus可通过自定义脚本实现。

4.5 元数据过滤：结构化筛选的利器

每条向量数据，除了文本内容，还应携带metadata：

{
  "content": "员工离职需提前30天书面通知",
  "metadata": {
    "source": "劳动合同法.pdf",
    "type": "条款",
    "category": "人事",
    "year": 2023
  }
}

在检索前，可先做结构化过滤：
“只查2023年以后的人事类条款”。

这能大幅缩小搜索范围，提升效率与准确性。

Qdrant和Milvus支持对metadata建立索引，查询速度接近原生数据库。
FAISS和Chroma则需全量扫描，性能较差。

5. 排序机制：从TopK到精排，决定用户体验

5.1 TopK不是终点，而是起点

TopK指的是从所有候选中取出前K个最相关结果。
K通常设为20~100，供后续处理使用。

但“相关性”如何定义？
不同检索方式，评分机制不同：

BM25：基于词频统计打分；
向量检索：计算余弦相似度；
rerank：使用更强大模型进行语义匹配打分。

单纯依赖向量相似度，容易出现“似是而非”的结果。
比如用户问“报销发票要求”，系统召回“发票开具指南”，看似相关，实则答非所问。

5.2 召回 vs 精排：两阶段检索的必然选择

现代RAG系统普遍采用两阶段架构：

第一阶段：召回（Recall）
目标：快速从百万级文档中捞出可能相关的100条。
方法：向量检索或BM25。
要求：速度快，覆盖广，允许一定噪声。
第二阶段：精排（Rerank）
目标：从100条中选出最贴合的5~10条。
方法：使用BGE-Reranker、ColBERT等模型重新打分。
要求：精度高，语义理解深，可牺牲部分延迟。

这就像招聘：
HR先筛简历（召回），再由部门负责人面试打分（精排）。

5.3 Reranker模型选型建议

模型	特点	是否开源	适用场景
BGE-Reranker	中文优化好，与BGE系列兼容	✅	企业知识库、客服系统
ColBERT	细粒度匹配，效果顶尖	✅	学术、法律等高精度场景
MiniLM	轻量，适合边缘部署	✅	移动端、低资源环境
Cohere Rerank	API调用，商用级精度	❌	国际化产品

BGE-Reranker目前已成为中文RAG项目的事实标准。
它能准确判断“报销流程”和“请假流程”之间的细微差别，避免混淆。

而MiniLM虽小，但在简单场景下表现稳定，适合嵌入式设备。

6. 数据预处理：被忽视的“隐形杠杆”

6.1 数据清洗：去噪才能提纯

原始文档往往充满噪音：
页眉页脚、水印、二维码、OCR错别字、HTML标签……

这些内容一旦进入向量空间，会污染语义表达。
“第5页”被反复出现，模型可能误以为这是重要关键词。

清洗要点：

删除非正文元素；
修复乱码与断行；
保留标题层级与段落结构；
PDF文档建议OCR后重建逻辑结构（如用LayoutParser）。

6.2 切片策略：长度决定召回质量

切片不是越短越好，也不是越长越优。
关键在于语义完整性与检索粒度的平衡。

常见策略：

固定长度+滑动窗口：每512字符切一段，重叠100字符。
适合无结构文本，防止关键信息被截断。
按语义切分：依据标题、换行、列表符号分割。
适合手册、文档，保持段落完整。
保留结构字段：FAQ类内容应保留“问题-答案”对，不拆散。

建议每chunk控制在200~500字之间。
太短：语义碎片化，影响理解；
太长：包含多主题，召回不准。

每个chunk必须附带唯一ID（chunk_id + doc_id），便于后续更新与溯源。

7. 实战建议：如何搭建你的第一套RAG流水线

从零开始，推荐以下路径：

数据准备：清洗PDF/Word，提取正文，结构化存储；
切片处理：按语义或固定长度切分，添加metadata；
向量化：选用BGE-small-zh或text2vec进行embedding；
存储：本地用Chroma或FAISS，线上用Qdrant；
检索：初期用纯向量检索，验证效果；
进阶：加入BM25混合检索，引入BGE-Reranker精排；
监控：记录召回率、响应时间、用户反馈，持续优化。

不要追求一步到位。
先跑通最小闭环，再逐步增强。

8. 中国的AI正在崛起，你我皆可参与

我们正站在一个前所未有的技术拐点上。
大模型不再是实验室里的概念，而是真正走进企业、工厂、医院、学校的生产力工具。

中国AI的发展速度令人振奋。
从BGE到Qwen，从Milvus生态到华为昇腾算力，本土技术创新层出不穷。
越来越多企业开始自研向量模型、搭建私有知识库、构建智能客服系统。

这不仅是技术的进步，更是产业智能化的浪潮。
每一个开发者，都是这场变革的参与者。

别觉得自己渺小。
你写的每一行代码，调的每一个参数，都在为AI落地添砖加瓦。

投身AI，不是追逐风口，而是参与未来。
让我们一起，用技术解决真实问题，让机器真正服务于人。

中国的AI，正在路上。
而你，已经在路上。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
程翔授《评价一篇记叙文》行吟斯基
桂林十一中高一2中学生自读程老师学生文章板书课题师巡看。看完举手。问：它是记叙文。不商量。独立打分。学生评价打分。师：高低都正常，不受干扰。师巡，略评。打完举手。调查：分层次举手——高分先举手。最低分。最高95分。最低45分。女：差距太大！师：同一篇，相差55分。若是你的文章，愿落谁手？男：身临其境感觉。师：你有此经历？没也没关系。女：不优美……，结尾无升华……无感悟……师：辞藻不美？(师追问)男
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
自律打卡第四天：比昨天进步一点点花儿的念想
今天新闻我们县城又确诊了一例，截止目前已经确诊的三例了，打开，看了一篇简友写的武汉的真实情况，有病住不了院，还没等到床位已经去世的消息，心里更加的难受，武汉尚且这样，如果是我们这没有高速没有火车的十八线的小县城发生这种情况，那情况将是更加的不堪设想，不敢想，唯有祈求灾难早点快去，平安才是最大的福气。突然觉得我的自律打卡，比昨天进步一点点。更希望疫情战争每一天都要比昨天好一点，希望一觉醒来听到的是好
15个小技巧，让我的Windows电脑更好用了！曹元_
01.桌面及文档处理第一部分的技巧，主要是围绕桌面的一些基本操作，包括主题设置、常用文档文件快捷打开的多种方式等等。主题换色默认情况下，我们的Win界面可能就是白色的文档界面，天蓝色的图表背景，说不出哪里不好看，但是就是觉得不够高级。imageimage说到高级感，本能第一反应就会和暗色模式联想起来，如果我们将整个界面换成黑夜模式的话，它会是这样的。imageimage更改主题颜色及暗色模式，我们
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
月光下的罪恶（5）允歌玖沐
5.被孤立顾纨是转校过来的，进入学校后，回头率很高“诶诶诶，你看那女生，哪个系的？”“不知道没见过。”“看那样，一看就是个胆小的货。”顾纨当做没听到，更狠的话她都听过，更何况女生们耍心眼？“他爸爸是做黑生意的，估计女儿也不是什么好的，你以后离他一家子远点。”她走向自己要上课的教室，一进门，所有人的目光看向她，顾纨若无其事的走进教室，开始上课。下课，一群人站起来，但是很显然，她周围的一圈人都不愿意和
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
贝多芬诞辰250周年纪念万千星河赴远方
就算不是古典音乐爱好者，你也一定听说过贝多芬。作为古典音乐史上最伟大的音乐家之一，他不仅是古典主义风格的集大成者，同时也是浪漫主义风格的开创者。贝多芬肖像画（1813年）贝多芬的一生共创作了9部交响曲、36首钢琴奏鸣曲、10部小提琴奏鸣曲、16首弦乐四重奏、1部歌剧及2部弥撒曲等等。数量虽然不及前辈海顿、莫扎特多，但他几乎改造了当时所有的音乐表达形式，赋予了它们全新的价值，对后世音乐的发展产生了极
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
三件事—小白猫·雨天·八段锦咸鱼月亮
1.最近楼下出现一只非常漂亮的粘人小白猫，看着不像是流浪猫，非常亲人。眼睛比蓝球的还大，而且是绿色的，很漂亮。第一次遇到它，它就跟我到电梯口，如果我稍微招招手，肯定就跟我进电梯了。后来我喂过它几次，好可惜不能养它，一只蓝球就是我的极限了。2.下雨天就心烦，好奇怪。明明以前我超爱看窗外的雨和听雨声，看来近来的心情不够宁静了。3.最近在练八段锦，从第一次就爱上了这个运动，很轻松缓慢，但是却出汗。感觉可
25-1-2019 树藤与海岛呢
hello八月来报道了今天看到了一篇文章就只想记下那两句话：良田千顷不过一日三餐广夏万间只睡卧榻三尺大概的意思就是要珍惜当下不要等来不及的时候才珍惜分享今天的两餐最近没有时间运动呢下个月补回好了说完了哈哈goodnight图片发自App图片发自App
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
力扣热题100-------54. 螺旋矩阵海航Java之路力扣 leetcode 矩阵 java
给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[1,2,3,6,9,8,7,4,5]示例2：输入：matrix=[[1,2,3,4],[5,6,7,8],[9,10,11,12]]输出：[1,2,3,4,8,12,11,10,9,5,6,7]提示：m==matrix.lengthn
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
SpringMVC执行流程（原理），通俗易懂国服冰 SpringMVC spring mvc
SpringMVC执行流程（原理），通俗易懂一、图解SpringMVC流程二、进一步理解Springmvc的执行流程1、导入依赖2、建立展示的视图3、web.xml4、spring配置文件springmvc-servlet5、Controller6、tomcat配置7、访问的url8、视图页面一、图解SpringMVC流程图为SpringMVC的一个较完整的流程图，实线表示SpringMVC框架提
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
现在发挥你的优势爱生活的佑嘉
来和我做咨询的一些朋友，涉及到定位的，都会说，我不知道我的优势是什么，你能不能帮我看看？还有一些朋友，喜欢做各种测试来了解自己，测试过后，然并卵。今天，我想来聊聊优势，如何能了解自己的优势是什么。首先，我们要知道，如果要成为“不一般”的人，我们所做的事情，就要基于自身的优势。我做管理者十多年，看到每个员工都有不同的特长，有的擅长数字，有的擅长人际，有的擅长写作。这些知道自己优势并且在这方面刻意练习
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
48. 旋转图像 - 力扣（LeetCode） Fiee-77 #数组 leetcode 算法 python 数据结构数组
题目：给定一个n×n的二维矩阵matrix表示一个图像。请你将图像顺时针旋转90度。你必须在原地旋转图像，这意味着你需要直接修改输入的二维矩阵。请不要使用另一个矩阵来旋转图像。示例1：输入：matrix=[[1,2,3],[4,5,6],[7,8,9]]输出：[[7,4,1],[8,5,2],[9,6,3]]示例2：输入：matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在