带娃的IT创业者

《AI大模型应知应会100篇》第57篇：LlamaIndex使用指南：构建高效知识库

第57篇：LlamaIndex使用指南：构建高效知识库

——从数据摄入到查询的全流程实战教程

摘要

在大模型（LLM）应用开发中，知识库系统 是提升模型准确性和专业性的关键。本文将带你全面掌握 LlamaIndex（原 GPT Index） 这一强大的开源框架，从基础架构讲起，通过多个实战代码示例，展示如何构建一个完整的、高效的 RAG（检索增强生成）知识库系统。

我们将涵盖：

数据摄入与处理
向量索引与混合检索
查询引擎定制与代理集成
实战案例：企业文档库、个人知识助手等

✅ 适合对象：AI初中级开发者
实战内容：文本分块、向量检索、混合搜索、流式输出
️ 工具链完整：OpenAI、本地模型、Web爬取、PDF解析
场景覆盖：企业知识库、研究文献分析、个性化问答

核心概念与知识点

1. LlamaIndex基础架构【实战部分】

1.1 核心概念：Documents、Nodes、Indices与Retrievers

LlamaIndex 的核心流程是：

Document → Node → Index → Retriever → Query Engine → Response

组件	功能
Document	原始输入数据（如 PDF、网页、数据库）
Node	分块后的最小处理单元
Index	构建可检索的结构（如向量索引）
Retriever	负责从索引中查找相关内容
Query Engine	结合 LLM 和检索结果生成最终回答

1.2 架构设计：数据摄入、索引与查询流水线

from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

# 步骤1：加载文档
documents = SimpleDirectoryReader("./data").load_data()

# 步骤2：构建索引
index = VectorStoreIndex.from_documents(documents)

# 步骤3：创建查询引擎
query_engine = index.as_query_engine()

# 步骤4：执行查询
response = query_engine.query("量子计算的基本原理是什么？")
print(response)

解释说明：

SimpleDirectoryReader 支持多种格式（txt/pdf/docx/json）；
VectorStoreIndex 构建基于向量的检索结构；
as_query_engine() 是默认查询引擎，也可自定义。

1.3 最新版本特性：高级检索与响应合成功能

Hybrid Search：结合关键词 + 向量检索；
Streaming Output：支持实时输出；
Context Compression：优化检索上下文长度；
Evaluation Framework：内置评估工具；
LangChain 集成：无缝对接 Agent、Prompt 等组件。

1.4 与LangChain集成：两大框架协同工作模式

from langchain.agents import Tool
from langchain.chains import RetrievalQA
from langchain_openai import ChatOpenAI

# 将 LlamaIndex 索引包装为 LangChain 工具
tool = Tool.from_function(
    func=lambda q: str(query_engine.query(q)),
    name="KnowledgeBase",
    description="用于回答关于知识库的问题"
)

llm = ChatOpenAI(model="gpt-4o")
qa_chain = RetrievalQA.from_chain_type(llm=llm, retriever=index.as_retriever())

# 在 LangChain 中使用
result = qa_chain.invoke({"query": "太阳系有哪些行星？"})
print(result["result"])

解释说明：

LlamaIndex 提供高质量的索引和检索能力；
LangChain 提供灵活的流程控制和工具集成；
两者结合可用于构建复杂 AI 应用。

数据摄入与处理【实战部分】

2.1 多源数据加载：文档、网页、API等数据源处理

from llama_index.core import SimpleDirectoryReader
from llama_index.readers.web import SimpleWebPageReader

# 加载本地文档
documents = SimpleDirectoryReader("./data").load_data()

# 加载网页内容
web_documents = SimpleWebPageReader().load_data([
    "https://example.com/page1",
    "https://example.com/page2"
])

解释说明：

SimpleDirectoryReader 支持 txt、pdf、csv、json 等格式；
SimpleWebPageReader 可抓取网页并提取文本；
支持自定义解析器扩展。

2.2 文本分块策略：不同分块方法的代码实现与效果对比

from llama_index.core.node_parser import SentenceSplitter, TokenTextSplitter

# 基于句子的分块器
sentence_parser = SentenceSplitter(chunk_size=512, chunk_overlap=50)
nodes = sentence_parser.get_nodes_from_documents(documents)

# 基于token的分块器
token_parser = TokenTextSplitter(chunk_size=256, chunk_overlap=20)
token_nodes = token_parser.get_nodes_from_documents(documents)

解释说明：

SentenceSplitter 按句分割，语义连贯；
TokenTextSplitter 按 token 数量分割，适合严格限制；
可根据任务选择合适的分块方式。

2.3 自定义解析器：专业领域文档的处理方案

from llama_index.core.readers.base import BaseReader
from typing import List, Dict

class MyCustomReader(BaseReader):
    def load_data(self, file_path: str) -> List[Dict]:
        with open(file_path, 'r') as f:
            text = f.read()
        return [{"text": text}]

custom_reader = MyCustomReader()
docs = custom_reader.load_data("my_custom_file.txt")

解释说明：

继承 BaseReader 即可定义自己的读取逻辑；
适用于 XML、HTML、日志文件等特殊格式。

2.4 元数据提取：增强节点检索的信息提取技术

from llama_index.core import Document
from datetime import datetime

doc = Document(text="这是一段重要信息", metadata={"source": "internal_doc", "date": str(datetime.now())})

解释说明：

每个 Node 或 Document 可附加元数据；
可用于过滤、排序、增强检索相关性。

索引与检索技术【实战部分】

3.1 向量索引构建：不同索引类型的创建与配置

from llama_index.core import VectorStoreIndex, SimpleKeywordTableIndex, KnowledgeGraphIndex

# 创建向量索引
vector_index = VectorStoreIndex.from_documents(documents)

# 创建关键词索引
keyword_index = SimpleKeywordTableIndex.from_documents(documents)

# 创建知识图谱索引
kg_index = KnowledgeGraphIndex.from_documents(documents)

解释说明：

VectorStoreIndex：最常用，适合通用检索；
SimpleKeywordTableIndex：基于关键词匹配；
KnowledgeGraphIndex：适合实体关系丰富的场景。

3.2 混合检索策略：关键词、向量、知识图谱混合检索

from llama_index.core.retrievers import VectorIndexRetriever, BM25Retriever
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.retrievers import EnsembleRetriever

# 创建混合检索器
retriever_vector = VectorIndexRetriever(index=vector_index)
retriever_keyword = BM25Retriever.from_documents(documents)

ensemble_retriever = EnsembleRetriever(
    retrievers=[retriever_vector, retriever_keyword],
    weights=[0.6, 0.4]
)

# 使用混合检索
nodes = ensemble_retriever.retrieve("量子计算的应用场景有哪些？")

解释说明：

EnsembleRetriever 支持多检索器融合；
weights 控制各检索器权重；
适用于对召回率和准确性都有要求的场景。

3.3 上下文压缩：大规模文档的高效检索技术

from llama_index.core.postprocessor import SentenceEmbeddingOptimizer

optimizer = SentenceEmbeddingOptimizer(threshold_cutoff=0.7)
nodes = optimizer.postprocess_nodes(nodes, query_str="量子计算")

解释说明：

SentenceEmbeddingOptimizer 移除不相关的句子；
提高检索效率，减少冗余内容；
可显著提升长文档的响应质量。

3.4 重排序策略：基于相关性的结果优化方法

from llama_index.core.postprocessor import SimilarityPostprocessor

postprocessor = SimilarityPostprocessor(similarity_cutoff=0.7)
filtered_nodes = postprocessor.postprocess_nodes(nodes, query_str="太阳能")

解释说明：

SimilarityPostprocessor 过滤低相似度节点；
可结合 LLM 判断相关性；
提升最终回答的相关性和简洁性。

高级应用开发【实战部分】

4.1 查询引擎定制：不同查询模式的引擎配置

from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.response_synthesizers import CompactAndRefine

# 配置响应合成器
synthesizer = CompactAndRefine(
    llm=llm,
    verbose=True,
    streaming=True
)

# 创建查询引擎
query_engine = RetrieverQueryEngine(
    retriever=ensemble_retriever,
    response_synthesizer=synthesizer,
    node_postprocessors=[postprocessor]
)

# 执行查询
response = query_engine.query("太阳能技术的最新进展是什么？")

解释说明：

CompactAndRefine 逐条处理上下文，节省内存；
streaming=True 支持流式输出；
node_postprocessors 可叠加多个后处理步骤。

4.2 代理集成：结合工具使用的知识代理实现

from langchain.agents import create_openai_functions_agent, AgentExecutor
from langchain.tools import Tool

def query_knowledge_base(query):
    return str(query_engine.query(query))

tool = Tool.from_function(
    func=query_knowledge_base,
    name="KnowledgeBase",
    description="用于回答基于知识库的问题"
)

agent = create_openai_functions_agent(openai_llm, [tool], prompt)
agent_executor = AgentExecutor(agent=agent, tools=[tool], verbose=True)

# 执行代理
agent_executor.invoke({"input": "请总结一下这篇论文的主要观点。"})

解释说明：

将 LlamaIndex 查询封装为 LangChain 工具；
可与其他工具组合使用；
适用于复杂问答或自动化决策场景。

4.3 流处理：实时响应生成的流式API应用

from llama_index.core.callbacks import CallbackManager, StreamingOutCallbackHandler

callback_manager = CallbackManager([StreamingOutCallbackHandler()])
llm.callback_manager = callback_manager

response = query_engine.query("请详细解释一下光合作用的过程。")
for token in response.response_gen:
    print(token, end="", flush=True)

解释说明：

StreamingOutCallbackHandler 支持回调流式输出；
可用于前端实时显示；
提升用户体验。

4.4 评估框架：RAG系统性能评估与优化方法

from llama_index.evaluation import DatasetGenerator, RelevancyEvaluator
from llama_index.core import SimpleDirectoryReader

# 生成评估数据集
generator = DatasetGenerator(documents)
eval_dataset = generator.generate_questions_from_nodes(num=50)

# 评估检索器
evaluator = RelevancyEvaluator()
results = evaluator.evaluate_dataset(eval_dataset, query_engine)

解释说明：

自动生成问题和答案；
评估检索准确率、相关性；
有助于持续优化知识库系统。

案例与实例

5.1 企业文档库：处理大规模PDF文档的完整实现

使用 SimpleDirectoryReader 加载 PDF；
使用 VectorStoreIndex 构建向量库；
支持多用户并发查询；
可部署为 Web API（FastAPI + Gradio）；

5.2 个人知识助手：结合记忆的持久化助手系统

使用 RedisStorageContext 存储索引；
结合 LangChain 记忆机制；
支持长期对话状态管理；
可作为桌面端或移动端助手。

5.3 研究文献分析器：学术论文智能问答系统

使用 arxiv.Reader 抓取论文；
构建学科专属索引；
支持摘要、关键词提取、图表识别；
可用于科研辅助写作。

️ 实战代码与配置

6.1 完整项目模板：生产级知识库应用架构

GitHub 示例地址（假设）：https://github.com/yourname/llamaindex-knowledgebase-template

6.2 自定义检索器：特定领域优化的检索组件

自定义 BM25Retriever；
支持中文分词；
支持专业术语加权。

6.3 性能优化配置：大规模部署的系统参数

使用 FAISS 替代默认向量存储；
启用缓存（cache=True）；
设置 max_input_size 限制输入长度；
使用异步接口提高吞吐量。

6.4 评估脚本：系统质量测试与优化工具

自动生成 QA 对；
支持 BLEU/NIST 自动评估；
输出准确率、召回率、F1值。

总结与扩展思考

7.1 LlamaIndex与其他知识库框架的优劣对比

框架	优点	缺点
LlamaIndex	插件丰富、社区活跃、生态强大	学习曲线陡峭
Haystack	界面友好、可视化强	社区较小
LangChain	灵活、模块化强	知识库功能较弱
Milvus + LangChain	强大的向量数据库	部署复杂

7.2 大规模知识应用的扩展性考量

使用分布式向量数据库（如 Weaviate、Pinecone）；
支持增量更新和自动索引重建；
使用缓存、负载均衡、微服务架构提升可用性。

7.3 知识库技术未来发展趋势与应用前景

更智能的检索算法（如基于强化学习）；
多模态知识库（图像、视频、音频）；
与 Agent、LangGraph 深度整合；
行业垂直化知识库平台兴起。

参考资料

LlamaIndex官方文档：https://docs.llamaindex.ai/en/stable/
GitHub仓库：https://github.com/jerryjliu/llama_index
LlamaIndex中文社区：https://llamaindex.cn/

‍ 结语

LlamaIndex 是构建现代 RAG 系统的核心工具之一。本文不仅介绍了其核心组件与架构，还通过多个实战代码帮助你快速上手，构建真实可用的知识库应用。

如果你想了解某个平台的深度评测、定制化训练或私有化部署方案，欢迎留言，我们将安排专题深入讲解！

✅ 关注《AI大模型应知应会100篇》专栏，持续更新前沿技术干货！

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
新一代数据库：融合多模智能，重塑数据价值
一、场景重塑产业格局：数据库“融合进化”AI浪潮奔涌而至，数字产业格局加速重构。云计算、移动互联、万物互联（IoT）、人工智能（AI）等技术的深度融合与快速落地，正以前所未有的速度重塑着企业的应用形态。新业务场景层出不穷——从高并发的在线交易、实时精准的分析决策，到海量物联网设备监控、基于图关系的风控反欺诈，再到AI驱动的智能推荐与内容生成，应用场景的多样性与复杂性已突破传统数据库的能力边界。这对
基于知识图谱技术增强大模型RAG知识库应用效果罗伯特之技术屋知识图谱人工智能
【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
朋友圈发的原力元宇宙项目到底能不能挣钱口碑信息传播者
原力元宇宙项目正如其名，是一场前所未有的数字化革命，融合了虚拟现实（VR）、人工智能（AI）、区块链（Blockchain）等前沿技术，开辟了全新的商业模式和赚钱机会。在朋友圈中频繁看到对该项目的推广宣传，确实反映了其在赚钱方面的潜力。本文将从多个角度解析原力元宇宙项目的盈利机制，揭示其中的商机所在。13分钟视频内容讲明白原力元宇宙创富项目，中国区运营服务对接微信：ForceZen激发兴趣的独特魅
构建高效 RAG 流程的七个关键点及其落地实践 charles666666 搜索引擎大数据需求分析交互笔记数据库
人工智能应用浪潮中，检索增强生成（RAG）技术凭借着结合大型语言模型（LLMs）的生成能力和信息检索系统的独特优势，成为了各企业挖掘数据价值、提升业务智能化水平的关键手段之一。然而，构建一个高效且精准的RAG流程并非易事，其中存在着诸多关键点和挑战。作为一名非资深IT技术顾问，我将基于丰富的实战经验，为大家深入剖析构建高效RAG流程的七个关键点及其落地实践。一、文档解析：混合格式的“第一道坎”在企
智能网关芯片：物联网连接的核心引擎
在物联网（IoT）生态系统中，智能网关芯片扮演着至关重要的角色，它是实现设备互联、数据转换和边缘计算的核心硬件。随着5G、人工智能（AI）和低功耗通信技术的快速发展，智能网关芯片的性能和功能不断提升，推动着智慧家居、工业物联网（IIoT）、智慧城市等领域的创新。智能网关芯片的关键技术智能网关芯片的核心能力在于其多协议支持能力。由于物联网设备采用不同的通信标准（如Wi-Fi、蓝牙、Zigbee、Lo
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

《AI大模型应知应会100篇》第57篇：LlamaIndex使用指南：构建高效知识库

第57篇：LlamaIndex使用指南：构建高效知识库

摘要

核心概念与知识点

1. LlamaIndex基础架构【实战部分】

1.1 核心概念：Documents、Nodes、Indices与Retrievers

1.2 架构设计：数据摄入、索引与查询流水线

1.3 最新版本特性：高级检索与响应合成功能

1.4 与LangChain集成：两大框架协同工作模式

数据摄入与处理【实战部分】

2.1 多源数据加载：文档、网页、API等数据源处理

2.2 文本分块策略：不同分块方法的代码实现与效果对比

2.3 自定义解析器：专业领域文档的处理方案

2.4 元数据提取：增强节点检索的信息提取技术

索引与检索技术【实战部分】

3.1 向量索引构建：不同索引类型的创建与配置

3.2 混合检索策略：关键词、向量、知识图谱混合检索

3.3 上下文压缩：大规模文档的高效检索技术

3.4 重排序策略：基于相关性的结果优化方法

高级应用开发【实战部分】

4.1 查询引擎定制：不同查询模式的引擎配置

4.2 代理集成：结合工具使用的知识代理实现

4.3 流处理：实时响应生成的流式API应用

4.4 评估框架：RAG系统性能评估与优化方法

案例与实例

5.1 企业文档库：处理大规模PDF文档的完整实现

5.2 个人知识助手：结合记忆的持久化助手系统

5.3 研究文献分析器：学术论文智能问答系统

️ 实战代码与配置

6.1 完整项目模板：生产级知识库应用架构

6.2 自定义检索器：特定领域优化的检索组件

6.3 性能优化配置：大规模部署的系统参数

6.4 评估脚本：系统质量测试与优化工具

总结与扩展思考

7.1 LlamaIndex与其他知识库框架的优劣对比

7.2 大规模知识应用的扩展性考量

7.3 知识库技术未来发展趋势与应用前景

参考资料

‍ 结语

你可能感兴趣的:(人工智能)