wshzd

LLM之RAG理论（四）| RAG高级数据索引技术

本文将重新审视分块技术以及其他方法，包括查询增强、层次结构和知识图谱。

一、简单RAG架构快速概览

在2023年年初，我的主要关注点集中在Vector DB及其在更广泛的设计领域中的表现上。然而，随着2023年的收尾，这一领域出现了重大进展。在RAG系统的设计中，需要考虑以下一些事情：

LLM模型领域正在进行的开源和开源之间的斗争，那么在实际使用中最好的模型是什么？
应该微调LLM还是直接对数据集进行嵌入？
文件处理有了新的突破。之前仅依靠文档块，现在拥有一系列技术，包括层次结构、句子窗口、自动合并等。
数据检索技术也突飞猛进。今年年初，只使用了k-相似性技术，现在我们有递归、混合搜索、重新排序、元数据过滤器、多智能体等。

那么，是什么造就了一个好的数据检索系统呢？

两个词：相关性和相似性。

相关性是指检索到的信息与用户的查询相关的相关性或重要性，而相似性在数据检索的上下文中是指用户的查询与可用数据之间的相似性或相似性。

similarity = word matching，relevancy = context matching.

矢量数据库有助于识别语义相近的内容（相似性），但识别相关性或检索相关内容更复杂的方法（可以参考：https://www.youtube.com/watch?v=TRjq7t2Ms5I）。

二、高级数据处理实现更好的数据检索

2.1 分块策略

在自然语言处理的背景下，“分块”是将文本分解为可管理、清晰和重要的块的过程。在这种情况下，使用较小的文本片段而不是较大的文档可以使RAG系统更快、更准确地发现相关上下文。

确保选择的分块是合适的，这对分块策略的成功至关重要。这些文本段落的水平和组织对这种策略的效果有很大影响。为了找到和提取捕捉RAG系统所需的基本细节或上下文的文本段落，需要仔细检查内容和上下文。智能分块策略提高了系统遍历和理解自然语言的能力，最终实现了更准确、更有效的信息处理。

在本文中，块大小为1024似乎会产生更好的结果

较大的块可以捕获更多的上下文，但由于它们产生的噪声，处理它们需要更长的时间和更多的钱。虽然较小的片段可能无法完全传达必要的上下文，但它们的噪音确实较小。平衡这两个要求的一种方法是具有重叠部分。组合块的查询可能能够从各种向量中获得足够的相关信息，以产生适当的上下文化答案。

2.2 这种策略有什么不好的地方？

该策略假设需要访问的每一条信息都可以位于一个文档中，这是其局限性之一。如果相关上下文分布在多个单独的文档上，请使用具有递归方法的多文档代理和子查询等解决方案。

2.3 小到大分块与小到大检索相结合

这个想法是，选择最佳的块大小有时不是最佳的，因为嵌入/检索大文本块并不总是最好的选择。大的文本块可能包含大量的填充内容，这些填充内容模糊了语义表示并降低了检索性能。如果我们可以根据更集中、更小的比特进行提取或嵌入，同时为LLM保持足够的上下文以做出适当的响应，该怎么办？将用于合成的文本块与用于检索的文本块分离可能是有益的。较大的文本块提供更多的上下文信息，而较小的文本块提高了检索的准确性。小到大检索背后的概念是在检索过程中使用较小的文本块，然后将检索到的文本所属的较大文本块提供给大语言模型。

在（https://towardsdatascience.com/advanced-rag-01-small-to-big-retrieval-172181b396d4）文章中，作者对分块大小进行了两种方案的简单比较，从小到大似乎效果更好，但缺点是查询时间更长，而且重新嵌入数据的成本也更高。

如果想体验一下从小到大的方案，可以使用LlamaHub包，链接：https://llamahub.ai/l/llama_packs-recursive_retriever-small_to_big?from=all

2.4 文档层次结构

构建数据结构以增强信息检索的一种有效方法是创建文档层次结构。文档层次结构可以与RAG系统的目录进行比较。通过构建块，RAG系统可以更快地检索和处理相关数据。因为文档层次结构有助于LLM选择包含要提取的最相关数据的部分，所以文档层次结构对RAG的效率至关重要。

在文档层次结构中，节点以父子关系排列，块与节点链接。数据的摘要存储在每个节点上，这有助于快速遍历数据，并帮助RAG系统确定要提取哪些块。

2.5 为什么你需要一个文档层次结构？

文档层次结构可以与文件目录或目录进行比较。虽然LLM能够从矢量数据库中提取相关的文本片段，但通过使用文档层次结构作为预处理步骤来识别最相关的文本段，可以提高检索速度和可靠性。除了提高速度、可重复性和检索可靠性外，这种策略还可以减少块提取问题带来的幻觉。构建文档层次结构可能需要特定领域或问题的知识，以确保摘要与当前工作完全相关。

在左侧菜单中，存在多个部分，每个部分都包含自己的一组子部分，而每个子部分又包含其唯一的文档和随后的信息层。在一种基本的分块方法中，矢量查询可能会从不同的部分检索类似的代码片段，这可能会在没有适当排名的情况下导致混乱。

通过实现文档层次结构，RAG系统可以显著增强其在给定部分内为特定问题提供准确答案的能力。这种层次结构能够更细致地理解上下文，防止共享相似代码但存在细微差异的部分之间的潜在混淆。例如，当解决有关SageMaker处理的特定方面的问题时，系统可以准确地识别与该特定部分相关的信息并对其进行优先级排序，避免与SageMaker模型构建无意中混淆，后者可能有共同之处，但需要不同的考虑。这种方法降低了幻觉的风险，并有助于建立一个更可靠和上下文感知的RAG系统。

具体实现，可以参考：https://docs.llamaindex.ai/en/stable/examples/retrievers/auto_merging_retriever.html和https://llamahub.ai/l/llama_packs-auto_merging_retriever?from=llama_packs

2.6 知识图谱

知识图谱是为文档层次结构提供数据基础的好方法，而数据基础对于保持一致性至关重要。从本质上讲，知识图是不同概念和实体之间连接的确定性映射。与矢量数据库中的相似性搜索不同，知识图提供了可靠、准确地检索相关规则和概念的能力，大大降低了产生幻觉的可能性。

使用知识图谱来表示文档层次结构的一个明显好处是，它们可以用于将信息检索过程转换为LLM能够理解的指令。例如，当LLM被呈现有特定的查询（例如，X）时，知识图可以通过指示数据必须从某个文档（例如，文档a）中提取，然后被引导将提取的数据与另一个文档（如，文档B）进行比较来引导LLM。这种有条不紊的技术提高了知识检索的准确性，并使LLM能够通过遵循逻辑步骤生成上下文良好的回复，从而提高了RAG系统的整体功效。

知识图谱使用自然语言映射关系，这意味着即使是非技术用户也可以构建和修改规则和关系，以控制他们的企业RAG系统。例如，规则可能会说，要响应有关SageMaker内置算法的查询，应首先查阅适当的SageMaker文档，然后查找其中的特定算法。

（https://neo4j.com/developer-blog/advanced-rag-strategies-neo4j/）这篇文章介绍了使用LlamaIndex是如何来操作知识图谱的。官方文档：https://docs.llamaindex.ai/en/stable/examples/index_structs/knowledge_graph/Neo4jKGIndexDemo.html。如果想寻求简单的实现，请查看此LlamaHub包的实现：https://llamahub.ai/l/llama_packs-neo4j_query_engine?from=llama_packs

除了讨论的基本分块策略之外，再讨论两种更高级的数据检索。

三、两项数据检索技术

3.1 查询增强

RAG中的一个主要问题是查询的措辞不当，可以通过查询扩充来解决，为查询提供进一步的上下文来解决查询缺乏特定场景的情况，从而确保生成的答案具有最佳相关性。这种方法提高了系统理解和处理更广泛问题的能力，最终提高了RAG框架的性能和用户满意度。

糟糕的问题表述往往是由语言的复杂性造成的。例如，根据上下文的不同，同一个单词可以有两种不同的含义。

即使是像GPT-4这样的高级模型仍然不知道所指的LLM的上下文。这在很大程度上是一个特定于领域的问题。

那么，如果你想使用特定于行业或领域的术语来将LLM上下文化呢？公司缩写词就是一个简单的例子（例如，MLA ak度量日志聚合）。大多数LLM发现很难区分这些术语。然而，当涉及到MLA时，MLA（现代语言协会）、MLA（医学实验室助理）或MLA（最大似然估计）是两种不同的东西。我的方法包括预处理查询，并添加特定于公司的上下文以引用相关分段来映射“MLA”。我使用的另一种更昂贵的方法是微调嵌入或微调LLM模型。

PS：查询增强可以参考llamaindex的实现：https://docs.llamaindex.ai/en/latest/optimizing/advanced_retrieval/query_transformations.html#

3.2 子问题规划

子问题规划代表了生成子问题的过程，这些子问题需要适当地将其上下文化并生成答案，当这些答案组合在一起时，可以完全回答原始问题。添加相关上下文的过程在原理上可以类似于查询扩充。

让我们以个人理财顾问中的一个问题为例：

投资者简介：John，45岁，风险承受能力中等，拥有由个股组成的多元化投资组合。他旨在评估股票投资的表现，并将其与相关基准进行比较。

问题：“作为一名风险承受能力中等的45岁投资者，John如何评估其个人股票投资的表现，并将其与基准进行比较，以确保其与他的长期财务目标相一致？”

子问题：

John目标的度量标准选择：

考虑到John的投资目标和风险承受能力，在评估投资组合中个股的表现时，他应该优先考虑哪些具体指标？
为John量身定制的基准：

考虑到John的投资状况，他如何确定一个符合其多元化投资组合并反映其财务目标的基准？
审查频率与John的策略一致：

考虑到John繁忙的日程安排和长期的投资前景，什么频率的绩效评估对他来说是实用和有益的？
符合John偏好的风险调整后回报：

考虑到John适度的风险承受能力和对稳定、长期增长的渴望，他如何将风险调整后的指标纳入绩效评估？
为John的投资组合量身定制的相对绩效分析：

John可以通过什么方式进行相对绩效分析，具体考虑其多元化投资组合中所代表的行业和行业？
股息再投资策略与John的目标一致：

考虑到John对长期增长的偏好，他应该如何处理股息的再投资，以优化他的整体投资组合表现？
符合John目标的长期关注：

鉴于John强调长期财务目标，在评估股票表现时，他应该如何平衡短期波动和持续增长？
调整和战略与John的财务目标保持一致：

根据绩效评估，John应该考虑哪些具体调整（如果有的话），以确保他的股票投资与他更广泛的财务战略和退休计划保持一致？

PS：现有的子查询引擎能够做到这一点有点牵强。然而，考虑到用于微调LLM的训练数据集的数量。

这种方法因在推理过程中引入人工参与以及不可能为每个可能的问题想象每个可能的子问题而受到批评。这是准确的。考虑到LLM的当前状态，应该避免试图重现每一个潜在的子问题，而是只在LLM即将失败时才采用外部推理规则进行干预。

四、将高级数据处理与高级数据检索相结合

要么得到响应的速度，要么用金钱和时间换取更好的RAG响应。

把它想象成一个乐高游戏，把所有的碎片叠在一起。你在上面放的乐高越多，你的乐高就越好，但过程也就越慢。你必须尝试多种组合，找出最适合你的文档的组合。没有一个适合所有人的建筑师可以使用。

上图说明了如何将多个检索放在查询引擎的顶部以产生更好的结果。除此之外，还可以尝试上面讨论的多种数据处理技术。

知识图可以对已知关系的某些关键主题和概念进行一致检索。

例如：除了上面的摘要索引、矢量索引和图形索引外，还可以添加另一个具有文档层次结构的矢量索引，也可以添加一个具有句子窗口或从小到大分块的矢量索引。

当涉及到检索时，可以进行多次检索加上混合搜索，然后使用重新排序来获得与您的查询最匹配的结果。

当涉及到查询引擎时，可以尝试上面讨论的多种查询规划技术，并将它们堆叠在一起。

来自多个查询引擎的多个响应将被发送到LLM以获得最终答案。

五、RAG中未解决的问题

数据处理不存在一刀切的问题。当为多个查询引擎索引组合多个数据处理时，成本效率是一个问题。
构建或改进矢量数据库在自动检索方面的表现。
能把知识图谱和传统的矢量数据库结合起来吗？
有什么简单的方法来处理不断变化的文档而不是编程的方法吗？

六、心得

尽管我觉得LLM很吸引人，尽管有很多关于人工智能，特别是LLM如何改变行业的讨论，但采用仍在缓慢进行，主要是因为企业不愿在市场上表明明确立场。这导致几乎每家公司都进入了“只会说话的人工智能阶段”，而不是“行动阶段”。

许多企业在将人工智能（包括LLM的强大功能）纳入其内部系统方面取得了进展。但是，从内部使用转向广泛的市场吸引力，并专注于当前用户，这带来了一系列独特的困难。它需要一种超越技术使用的战略方法，探索用户体验、市场动态和行业接受度等领域。

特别是大型语言模型（LLM）和人工智能（AI），将在未来一年蓬勃发展，看看它们将如何融入通用产品中是非常有趣的。最终实现通用人工智能（AGI）的期望是由对人工智能初创公司的重大投资、最新进步背后的创造性思维以及更强大但更实惠的芯片的可用性推动的，尽管AGI完全融入我们的个人生活可能需要一段时间。

未来几年有望取得前所未有的进步，使人工智能在广泛的领域和应用中离其革命性潜力又近了一步。

2024年的已来，我一直在思考未来如何进行软件开发。我坚信，初创公司和公司应该重新集中精力创建平台，而不是专注于创建以人工智能为中心的个人产品或应用程序。我相信，随着通用人工智能（AGI）的发展，现有的以“应用/产品”为中心的模型最终将失去其主导地位。

企业应通过投资平台开发，建立一个更灵活、更可扩展的基础，支持一系列人工智能服务和功能。这一策略符合人工智能的发展方式，在人工智能中，许多应用程序和领域之间的集成越来越普遍。平台可以作为一个灵活的框架，促进合作，促进一系列用例的创新，并使各种人工智能技术能够顺利集成。随着软件开发格局的不断变化，对平台架构的战略关注表明了充分利用人工智能潜力的前瞻性战略。

为充满进步、扩张和更多人工智能领域研发的光明2024干杯！

参考文献：

[1] https://pub.towardsai.net/rag-in-action-beyond-basics-to-advanced-data-indexing-techniques-b7e07e3f5e43

日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
第八课: 写作出版你最关心的出书流程和市场分析（无戒学堂复盘）人在陌上
今天是周六，恰是圣诞节。推掉了两个需要凑腿的牌局，在一个手机，一个笔记本，一台电脑，一杯热茶的陪伴下，一个人静静地回听无戒学堂的最后一堂课。感谢这一个月，让自己的习惯开始改变，至少，可以静坐一个下午而不觉得乏味枯燥难受了，要为自己点个赞。我深知，这最后一堂课的内容，以我的资质和毅力，可能永远都用不上。但很明显，无戒学堂是用了心的，毕竟，有很多优秀学员，已经具备了写作能力，马上就要用到这堂课的内容。
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
《感官品牌》读书笔记 1 西红柿阿达
原文:最近我在东京街头闲逛时，与一位女士擦肩而过，我发现她的香水味似曾相识。“哗”的一下，记亿和情感立刻像潮水般涌了出来。这个香水味把我带回了15年前上高中的时候，我的一位亲密好友也是用这款香水。一瞬间，我呆站在那里，东京的街景逐渐淡出，取而代之的是我年少时的丹麦以及喜悦、悲伤、恐惧、困惑的记忆。我被这熟悉的香水味征服了。感想:感官是有记忆的，你所听到，看到，闻到过的有代表性的事件都会在大脑中深深
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
20210517坚持分享53天读书摘抄笔记非暴力沟通——爱自己 f79a6556cb19
让生命之花绽放在赫布·加德纳（HerbGardner）编写的《一千个小丑》一剧中，主人公拒绝将他12岁的外甥交给儿童福利院。他郑重地说道：“我希望他准确无误地知道他是多么特殊的生命，要不，他在成长的过程中将会忽视这一点。我希望他保持清醒，并看到各种奇妙的可能。我希望他知道，一旦有机会，排除万难给世界一点触动是值得的。我还希望他知道为什么他是一个人，而不是一张椅子。”然而，一旦负面的自我评价使我们看
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
08.学习闭环三部曲：预习、实时学习、复习 0058b195f4dc
人生就是一本效率手册，你怎样对待时间，时间就会给你同比例的回馈。单点突破法。预习，实时学习，复习。1、预习：凡事提前【计划】（1）前一晚设置三个当日目标。每周起始于每周日。（2）提前学习。预习法进行思考。预不预习效果相差20％，预习法学会提问。（3）《学会提问》。听电子书。2.实时学习（1）（10％）相应场景，思维导图，快速笔记。灵感笔记。（2）大纲，基本记录，总结篇。3.复习法则，（70％），最
《如何写作》文心读书笔记逆熵反弹力
《文心》这本书的文体是以讲故事的形式来讲解如何写作的，读起来不会觉得刻板。读完全书惊叹大师的文笔如此之好，同时感叹与此书相见恨晚。工作了几年发现表达能力在生活中越来越重要，不管是口语还是文字上的表达。有时候甚至都不能把自己想说的东西表达清楚，平时也有找过一些书来看，想通过提升自己的阅读量来提高表达能力。但是看了这么久的书发现见效甚微，这使得我不得不去反思，该怎么提高表达能力。因此打算从写作入手。刚
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
《4D卓越团队》习书笔记第十六章创造力与投入 Smiledmx
《4D卓越团队-美国宇航局的管理法则》（查理·佩勒林）习书笔记第十六章创造力与投入本章要点：务实的乐观不是盲目乐观，而是带来希望的乐观。用真相激起希望吉姆·科林斯在《从优秀到卓越》中写道：“面对残酷的现实，平庸的公司选择解释和逃避，而不是正视。”创造你想要的项目1.你必须从基于真相的事实出发。正视真相很难，逃避是人类的本性。2.面对现实，你想创造什么？-我想利用现有资源创造一支精干、高效、积极的橙
2020-12-10 生活有鱼_727f
今日汇总：1.学习了一只舞蹈2.专业知识抄了一遍3.讲师训作业完成今日不足之处：1.时间没管理好，浪费了很多时间到现在才做完明日必做：1.讲师训作业完成2.群消息做好笔记3.宽带安装
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
ChatGPT还不能写小说吗？刘若愚
最近，ChatGPT大热，据说可以写论文，编故事，好像无所不能。于是，我给它出了个题目：写一篇5万字的科幻小说。人物：刘若愚，化学家；刘子琪，大律师；仔仔，刘子琪的宠物猫；周金凝，医生；刘泽余，大侦探；赵政淇，程序猿；杰夫（Jeff）机器人它给我的回答是：我很抱歉，我是一个AI语言模型，无法写出如此长篇的小说。但我可以为您提供一些写作灵感和指导：确定故事背景和时间线：在科幻小说中，背景和时间线非常
微信公众号写作：如何通过文字变现？氧惠爱高省
微信公众号已成为许多人分享知识、表达观点的重要平台。随着自媒体的发展，越来越多的人开始关注微信公众号上写文章如何挣钱的问题。本文将详细探讨微信公众号写作的盈利模式，帮助广大写作者实现文字变现的梦想。公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲身经历，四个月公众号流量主从0到日入过万！》公司旗下管理800+公众号矩阵账号。代表案例如：爸妈领域、职场道道、国学
流利说懂你英语笔记要点句型·核心课·Level 8·Unit 3·Part 2·Video 1·Healing Architecture 1 羲之大鹅video
HealingArchitecture1EveryweekendforaslongasIcanremember,myfatherwouldgetuponaSaturday,putonawornsweatshirtandhe'dscrapeawayatthesqueakyoldwheelofahousethatwelivedin.ps:从我记事起，每个周末，我父亲都会在周六起床，穿上一件破旧的运动衫
java学习笔记8 幸福，你等等我学习笔记 java
一、异常处理Error：错误，程序员无法处理，如OOM内存溢出错误、内存泄漏...会导出程序崩溃1.异常：程序中一些程序自身处理不了的特殊情况2.异常类Exception3.异常的分类:（1）.检查型异常(编译异常):在编译时就会抛出的异常(代码上会报错),需要在代码中编写处理方式(和程序之外的资源访问)直接继承Exception（2）.运行时异常:在代码运行阶段可能会出现的异常,可以不用明文处理
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
Java注解笔记 m0_65470938 java 开发语言
一、什么是注解Java注解又称Java标注，是在JDK5时引入的新特性，注解(也被称为元数据)Javaa注解它提供了一种安全的类似注释的机制，用来将任何的信息或元数据(metadata)与程元素类、方法、成员变量等)进行关联二、注解的应用1.生成文档这是最常见的，也是iava最早提供的注解2.在编译时进行格式检查，如@Overide放在方法前，如果你这个方法并不是看盖了超类Q方法，则编译时就能检查
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d