sky丶Mamba

最全大模型术语表，从入门到入土，从此告别小白！

分类	代表性产品
AI对话	ChatGPT: OpenAI开发的通用对话模型、DeepSeek: 深度求索推出的中文大模型、腾讯元宝: 腾讯社交生态集成助手、豆包: 字节跳动轻量化AI助手
AI图像	Midjourney: 艺术创作标杆工具、Stable Diffusion: 开源文生图框架、通义万相: 阿里多模态图像生成
AI视频	Sora: OpenAI文生视频模型、即梦AI: 字节跳动电影级生成工具、可灵AI: 快手短视频生成平台、Pika: 创意动画生成工具
AI编程	Cursor: AI代码编辑器、Trae: 国产低代码工具、Cline: 开源编程助手、通义灵码: 阿里云智能编码
LLM应用开发平台	Coze: 字节跳动Bot开发平台、Dify: 开源LLM工作流工具、n8n: 自动化流程编排平台
Agent开发框架	Spring AI: Java生态集成框架、LangChain4J: Java版LangChain、LangChain: Python多工具链框架
多Agent协作框架	LangGraph: 基于图的智能体编排、MetaGPT: 模拟软件公司协作流程
RAG工具	Ragflow: 可视化知识库构建、FastGPT: 低代码问答系统、LlamaIndex: Python向量检索框架
开源模型社区	Hugging Face: 全球最大模型库、ModelScope: 阿里云中文模型社区
模型部署框架	Ollama: 本地化模型运行器、vLLM: 高通量推理引擎、LMDeploy: 国产硬件优化部署工具
模型微调工具	LLama Factory: 可视化微调平台、Xtuner: 轻量化参数高效微调库

前置概念

函数（Function）

函数是模型中的数学运算单元，如ReLU激活函数f(x)=max(0,x)。它们堆叠构成网络层，决定信息流动方式（如Transformer中的前馈层）。

参数（Parameter）

参数是决定LLM根据输入生成什么输出的数字。LLM的输入和输出之间的关系由这些参数定义。小的LLM可能有大约10亿个参数，而大的LLM可能有超过1000亿个参数。一般来说，参数越多，模型越“聪明”，但同时成本也越高，因为每个参数都对应计算机需要执行的操作。

权重（Weights）

大模型权重是神经网络中决定输入数据如何被处理和转换的参数，通常以矩阵形式存储。它们的作用类似于人类大脑的神经连接强度，直接影响模型的预测能力。

模型（Model）

模型是AI系统中从数据学习规律的数学表示，如线性回归或神经网络。其性能依赖架构设计（如ResNet）和训练策略（如迁移学习）。

大模型（Large Model）

大模型指参数量超亿级的深度学习模型，如GPT-3（175B参数）。其核心优势在于通过海量数据预训练获得泛化能力，可适应多种下游任务。

LLM

大语言模型（LLM, Large Language Model）

大语言模型是通过海量文本训练的 AI 模型，能够理解和生成人类语言。现代 LLM（如 GPT 系列、Claude 等）可以撰写文章、回答问题、编写代码，甚至进行推理，它们是各种 AI 应用的核心引擎，尤其适合需要语言理解和生成的场景。

推理（Inference）

大模型推理是利用训练好的模型对输入数据生成预测结果的过程，属于前向计算（Forward Pass）。

AGI（Artificial General Intelligence）

AGI指具备人类水平通用智能的AI系统，能自主完成任何智力任务。当前大模型（如GPT-4）虽展现部分通用能力，但仍属窄AI范畴。AGI需突破因果推理、跨模态学习等瓶颈。

AIGC（AI-Generated Content）

AIGC是通过AI生成文本、图像、视频等内容的技术。例如，Stable Diffusion生成图像时，模型将文本提示（如“星空下的城堡”）转化为像素排列，其质量依赖训练数据和扩散算法。

提示词（Prompt）

提示词是引导 AI 模型生成特定响应的输入文本。精心设计的提示词能显著提高输出质量，包括明确指令、提供示例、设定格式要求等元素。例如，不同的提示词可以引导同一模型生成学术文章、创意故事或技术分析，是影响 AI 输出的最关键因素之一。

Token

Token是模型处理文本的最小单元，不同模型的token处理稍有区别，约等于一个单词或汉字。例如，“ChatGPT”可能被拆分为“Chat”、“G”、“PT”三个token。模型通过token序列理解输入，其处理效率直接影响生成速度。

上下文（Context）

上下文是大模型处理当前输入时参考的先前信息，通常以对话历史或文本片段的形式存在。模型通过注意力机制捕捉上下文关联，例如在问答中，用户追问“它的优点呢？”时，模型需结合前文讨论的对象（如某款手机）来生成合理回答。

上下文窗口（Context Window）

上下文窗口是LLM能够处理的最大文本量。虽然更多的指令和上下文通常能让LLM表现得更好，但它的处理能力是有限的。对于现代LLM来说，这个上限大约是10万字（相当于一本普通书的长度）。不过，像Gemini 1.5 Pro这样的模型可以处理100万字以上。

幻觉（Hallucination）

指生成式人工智能模型在生成文本或回答问题时，尽管表面上呈现出逻辑性和语法正确的形式，但其输出内容可能包含完全虚构、不准确或与事实不符的信息。AI幻觉的产生通常是由于模型在缺乏相关信息的情况下，通过概率性选择生成内容，而非基于真实世界的知识库或逻辑推理，这使得其输出不仅难以信赖，且可能误导用户。

涌现（Emergence）

涌现指模型在参数量达到阈值时突现的新能力，如GPT-3突然掌握多语言翻译。这种现象源于复杂系统中量变到质变的转换，目前尚无法完全预测。

记忆（Memory）

记忆是 AI 系统保存和使用历史交互信息的能力，使多轮对话保持连贯。有效的记忆机制让 AI 能够理解上下文引用、记住用户偏好、追踪长期目标，从而提供个性化且有连续性的用户体验，避免重复询问已提供的信息。

短期记忆（Short-term Memory）

上下文对话记录，依赖模型的上下文窗口，仅能处理当前会话内的信息。每次对话时，模型将历史对话拼接为一段文本输入，通过注意力机制动态关注相关部分。

长期记忆（Long-term Memory）

通过外部系统（如数据库、向量存储）实现跨会话、跨任务的信息持久化存储。例如通过数据库记录用户偏好、行为历史，支持时间感知检索和动态更新。本质是结构化、可扩展的"外部记忆库"，需结合检索增强生成（RAG）等技术调用。

流式结果返回（Streaming Response）

流式结果返回是一种实时响应机制，AI 系统边生成内容边返回给用户，而不是等所有内容生成完毕再一次性展示。这种方式显著改善用户等待体验，特别是对于长回答，用户可以立即看到部分内容并开始阅读，提供更自然的交互感受，类似于人类对话中的即时反馈。

本地模型推理（Local Model Inference）

本地模型推理是在用户自己的设备上运行 AI 模型的过程，而非依赖云服务。这种方式提供更好的隐私保护（数据不离开本地）和更低的延迟（无需网络传输），适合处理敏感数据或需要离线工作的场景，但通常受限于本地设备的计算能力。比如Ollama、vLLM、LMDeploy等工具部署大模型。

私有化部署（Private Deployment）

私有化部署指将AI模型或服务部署在企业自有的服务器或数据中心，而非依赖公共云服务。这种方式提供更高的数据安全性和定制化能力，适用于对数据隐私和合规性要求严格的场景。例如，金融机构可能选择私有化部署核心风控模型，以确保客户数据不外泄。

模型即服务（MaaS, Model-as-a-Service）

模型即服务是一种云服务模式，提供商通过 API 提供预训练模型的访问。用户无需关心模型的训练、部署和维护，只需调用 API 并支付使用费用，大幅降低了 AI 应用的开发门槛和基础设施成本，适合快速验证想法或构建原型。

预定义模型（Predefined Model）

预定义模型是由 AI 厂商训练并提供的现成模型，用户可以直接调用而无需自行训练。这些闭源模型（如 GPT-4、Claude 等）通常经过大规模训练和优化，能力强大且易于使用，适合快速开发应用或缺乏自主训练资源的团队。

预训练模型（Pre-trained Model）

在大规模通用数据（如文本、图像）上预先训练的模型，通过迁移学习适配下游任务。和预定义模型区别：预训练模型已完成权重优化（如ResNet在ImageNet上的参数），预定义模型可能是未训练的架构（如PyTorch提供的Transformer类），需用户从头训练。预训练模型直接用于微调（Fine-tuning），预定义模型可能作为基础架构，用户可选择是否加载预训练权重。

闭源模型（Proprietary Model）

闭源模型由企业严格控制访问权限，如GPT-4。用户仅能通过API调用，无法查看内部机制。优势在于商业可控性，但可能引发“黑箱”疑虑。

开放权重（Open Weights）

开放权重指仅公开模型参数（如.safetensors文件），但不提供训练细节。用户可基于权重微调，但难以复现原始训练过程。例如，Bloom模型开放176B参数权重，但未公开完整数据集

完全开源（Fully Open-Source）

完全开源指公开模型全部代码、权重和训练数据。例如Meta的LLaMA-2，用户可自由修改模型结构或用于商业项目，但需遵守许可协议。开源促进技术透明，但可能增加滥用风险。

思维链（CoT, Chain of Thought）

思维链是一种提示技术，引导大语言模型展示其逐步思考过程，典型模型的代表就是DeepSeek R1。例如，解决数学问题时，模型会先列出已知条件，然后按照推理步骤一步步求解，最后得出结论，整个过程类似人类的思考方式。

思维骨架（BoT, Backbone of Thought）

思维骨架是一种结构化思考框架，如同人类在解决数学题时先列“解题步骤”，为大语言模型提供推理的主干结构。它帮助模型在处理复杂问题时保持清晰的思考路径，类似于论文的提纲或决策树的骨架。Chain-of-Thought是思维骨架的微观实现手段之一。

思维图（GoT, Graph of Thought）

思维图是一种将思考过程表示为网络结构的方法，捕捉概念之间的复杂关系。不同于线性的思维链，思维图可以表达分支、循环和多路径的思考模式，适合处理有多个相互关联因素的复杂问题。

思维树（ToT, Tree of Thought）

思维树是一种探索多个推理路径的思考方法，允许模型从不同角度分析问题。类似于人类的”如果…那么…”思考模式，思维树让模型生成多个可能的思考分支，评估每个分支的可行性，然后选择最优路径继续，特别适合解决需要试错或考虑多种可能性的复杂问题。

LLM参数

温度（Temperature）

温度是控制语言模型输出随机性的参数，通常在 0-1 之间。温度越低（接近 0），模型输出越确定和保守，倾向于高概率词汇，适合事实性回答；温度越高（接近 1），输出越多样和创造性，适合创意写作。例如，天气预报可能使用 0.1 的低温度，而故事创作可能使用 0.8 的高温度。

最大标记数（Max Tokens）

最大标记数控制模型在单次响应中生成的最大字符量。一个标记大约相当于 4 个字符或 3/4 个英文单词。设置合理的最大标记数可以控制回答的长度，避免过于冗长的输出，同时确保完整表达必要信息。例如，一篇简短摘要可能设为 200 标记，而详细报告可能需要 2000 标记。

核采样（TopP, Nucleus Sampling）

核采样是一种文本生成控制方法，只从累积概率达到阈值 P 的最可能词汇中选择下一个词。与固定选择最高概率词或完全随机不同，TopP 在确定性和创造性间取得平衡。例如，TopP=0.9 意味着模型只考虑概率和占 90% 的词汇，忽略低概率选项，既避免了完全可预测的输出，又不会生成过于随机的内容。取值越大，生成的随机性越高;取值越低，生成的确定性越高。

频率惩罚（Frequency Penalty）

频率惩罚是一种文本生成控制参数，通过降低频繁出现词汇的生成概率来增加输出的多样性。值越高，模型越倾向于使用多样化的词汇和表达方式；值为 0 时，模型不会特意避免重复使用相同词汇。

存在惩罚（Presence Penalty）

存在惩罚是防止语言模型重复内容的参数设置。它通过降低已出现词汇的生成概率，鼓励模型探索新的表达方式。参数值越高，模型越不倾向于重复之前生成的内容，有助于避免 AI 回答中常见的循环论证或重复叙述问题。

响应格式（Response Format）

响应格式指定模型输出的结构类型，如纯文本、JSON 或 HTML。设置特定的响应格式可以使 AI 输出更容易被程序处理或集成到其他系统。例如，要求模型以 JSON 格式回答可以确保输出具有一致的结构，便于前端应用直接解析和展示。

微调

微调（Fine-tuning）

在预训练模型基础上，使用任务特定数据（如1k-100k样本）调整参数。分为：对整个预训练模型的所有参数进行微调的全量微调；在已微调的模型基础上，用新数据进一步微调的增量微调；仅微调模型的部分参数（如特定层或模块）的局部微调。目前常说的微调一般指局部微调。

LoRA（Low-Rank Adaptation，低秩适应）

LoRA是一种高效微调大模型的技术，通过冻结原模型参数并添加低秩矩阵（ΔW=BA）来调整模型行为，仅需训练少量参数（如原模型的0.1%），显著降低计算资源需求。

QLoRA（Quantized Low-Rank Adapter，量化低秩适应）

QLoRA是LoRA的量化升级版，将模型权重压缩至4位精度（如NF4类型），结合双重量化和分页优化器技术，进一步减少显存占用，可在消费级GPU（如24GB显存）上微调百亿级模型。和LoRA的区别如下，LoRA：保持全精度计算，适合中等规模模型快速微调；QLoRA：牺牲少量精度（约1-2%），支持超大规模模型单卡微调。

预训练（Pre-training）

基于海量无标注数据（如FineWeb数据集）的自监督学习，通过掩码语言建模（MLM）或自回归预测任务构建通用知识库。例如，GPT系列通过万亿token训练掌握语言统计规律，为下游任务提供先验知识。

模型压缩（Model Compression）

模型压缩是剪枝、量化、蒸馏等技术的统称，旨在降低资源消耗。例如，将ViT模型压缩至10MB以下，使其能在手机端实时运行。

剪枝（Pruning）

剪枝通过移除冗余连接压缩模型，如删除权重接近0的神经元。例如，将BERT参数量减少30%而保持90%准确率，提升部署效率。

量化（Quantization）

量化将模型参数从32位浮点转为8位整数，减少存储和计算开销。例如，GPT-3量化后显存占用降低75%，适合边缘设备。

蒸馏（Distillation）

蒸馏用小模型（学生）模仿大模型（教师）的行为。例如，TinyBERT通过蒸馏BERT的注意力分布，实现10倍加速但保留90%性能。

RAG

检索增强生成（RAG, Retrieval-Augmented Generation）

检索增强生成是结合外部知识检索和语言生成的技术架构。系统首先从知识库检索与用户问题相关的信息，然后将这些信息作为上下文提供给语言模型，生成有依据、准确的回答。RAG 克服了语言模型知识有限和幻觉问题，特别适合需要最新或专业知识的应用场景。

引用与归属（Citation and Attribution）

引用与归属功能让 AI 系统能够清晰标明信息来源，提高响应的可信度和透明度。当系统基于知识库内容生成回答时，可以自动标注引用的文档名称、页码或 URL，让用户了解信息的出处。

召回测试（Retrieval Test）

召回测试是验证知识库检索效果的功能，开发者可以模拟用户查询并评估系统返回结果。这种测试帮助开发者了解系统的检索能力边界，发现并修复潜在问题，如漏检、误检或相关度不佳的情况，是优化 RAG 系统不可或缺的工具。

RAG数据处理

提取、转换、加载（ETL, Extract, Transform, Load）

ETL 是数据处理的经典流程：提取原始数据，转换为适合分析的格式，然后加载到目标系统。在 AI 文档处理中，ETL 可能包括从 PDF 提取文本、清理格式、分割内容、计算嵌入向量，最后加载到向量数据库中，为 RAG 系统做准备。

元数据（Metadata）

元数据是描述数据的数据，提供关于内容的结构化信息，如文档的创建时间、作者、标题、标签、文件格式等属性信息等。这些信息可用于组织、分类和检索内容。通过元数据，系统可以实现更精确的内容管理和检索，例如按时间范围筛选文档、按作者分类或根据文件类型过滤搜索结果。

元数据筛选（Metadata Filtering）

元数据筛选利用文档属性信息（如标题、作者、日期、分类标签）进行内容过滤。例如，用户可以限定只检索特定日期范围内的技术文档，或只查询特定部门的报告，从而在检索前缩小范围，提高查找效率和结果相关性。

RAG文档切分

分段（Chunking）

分段是将长文本拆分成较小内容块的处理技术，使检索系统能更精准地找到相关信息。合理的分段策略既要考虑内容的语义完整性，也要满足语言模型的上下文窗口限制，从而提高检索和生成质量。

通用分段模式（General Chunking Pattern）

通用分段模式是一种简单的文本分割策略，将文档拆分为相互独立的内容块。这种模式适合结构清晰、段落相对独立的文档，如产品说明书或百科条目，每个分段可以独立理解而不严重依赖上下文。

固定大小分块（Fixed-size Chunking）

固定大小分块是一种基础文本分割策略，按预定义的字符数、词数或Token数均匀切分文本。这种模式适合处理格式规整的文档（如日志文件或标准化报告），通过重叠部分缓解语义截断问题，但可能破坏复杂句子的连贯性。

语义分块（Semantic Chunking）

语义分块是一种智能文本分割策略，通过嵌入模型计算相邻段落的余弦相似度，动态合并语义相关的文本单元。这种模式适合处理主题连贯的长文档（如学术论文或技术文档），能保留完整思想但需调整相似度阈值。

递归分块（Recursive Chunking）

递归分块是一种分层文本分割策略，先按段落/章节切分，超长部分继续递归分割为句子或短语。这种模式适合结构复杂且长度不一的文档（如技术手册或法律合同），平衡结构完整性与长度限制，但实现复杂度较高。

文档结构分块（Document Structure-based Chunking）

文档结构分块是一种规则驱动文本分割策略，利用标题、表格、代码块等固有结构定义分块边界。这种模式适合格式规范的文档（如Markdown文件或API文档），需结合递归分块处理超长片段。

LLM智能分块（LLM-based Chunking）

LLM智能分块是一种模型驱动的文本分割策略，通过大语言模型分析语义边界动态划分内容块。这种模式适合处理语义关系复杂的文本（如跨段落论述或专业文献），精度最高但依赖算力成本。

父子分段模式（Parent-Child Chunking）

父子分段模式是一种高级文本分割策略，创建两层级的内容块：父区块保留完整上下文，子区块提供精确匹配点。系统先通过子区块确定相关内容位置，再获取对应父区块以提供完整背景，同时兼顾检索精度和上下文完整性，适合处理复杂文档如研究论文或技术手册。

RAG存储

知识库（Knowledge Base）

知识库是 AI 应用中存储结构化信息的数据库，为模型提供专业知识来源。知识库可以包含各种文档（PDF、Word、网页等），经过处理后供 AI 检索并用于生成准确、有根据的回答，特别适合构建领域专家型应用。

文本嵌入（Text Embedding）

也叫词嵌入，文本嵌入是将文本转换为数值向量的过程，使 AI 系统能够理解和处理语言。这些向量捕捉了词汇和句子的语义特征，使计算机可以测量文本间的相似度、聚类相关内容或检索匹配信息。不同的嵌入模型（如 OpenAI 的 text-embedding-ada-002 或 Cohere 的 embed-multilingual）针对不同语言和应用场景进行了优化。

向量数据库（Vector Database）

向量数据库是专门存储和搜索向量嵌入的数据库系统，是高效语义检索的基础设施。与传统数据库不同，向量数据库针对高维向量相似度搜索进行了优化，能快速从数百万文档中找出语义相近的内容。常见的向量数据库包括 Pinecone、Milvus、Qdrant 等，它们在 RAG 系统、推荐引擎和内容分析中发挥关键作用。

问答模式（Q&A Mode）

问答模式是一种特殊索引策略，为文档内容自动生成问答对，实现”问题到问题”的匹配。当用户提问时，系统会寻找语义相似的预生成问题，然后返回对应答案。这种模式特别适合 FAQ 内容或结构化知识点，能提供更精准的问答体验。

RAG检索

余弦相似度（Cosine Similarity）

余弦相似度通过向量夹角衡量语义相关性，范围在-1到1之间。例如，比较“猫”和“狗”的嵌入向量，若相似度为0.8，说明二者语义接近。常用于检索和聚类任务。

欧式距离（Euclidean Distance）

欧式距离计算向量空间中的直线距离，值越小表示越相似。例如，评估生成文本与参考答案的差异时，距离越小则质量越高。与余弦相似度互补，共同优化模型输出。

知识检索（Knowledge Retrieval）

知识检索是从知识库中找出与用户问题最相关信息的过程，是 RAG 系统的关键环节。有效的知识检索不仅要找到相关内容，还要控制返回的信息量，避免无关内容干扰模型，同时提供足够背景确保回答准确完整。

关键词检索（Keyword Search）

关键词检索是基于精确匹配的搜索方法，查找包含特定词汇的文档。这种方法计算效率高，适合用户明确知道要查找的术语的场景，如产品型号、专有名词或特定命令，但可能会漏掉使用同义词或相关概念表达的内容。

倒排索引（Inverted Index）

倒排索引是搜索引擎的核心数据结构，它记录每个词出现在哪些文档中，搜索引擎Elastic Search就是采用该方法。与传统索引从文档找内容不同，倒排索引从词汇出发找文档，大幅提高全文检索速度。例如，“人工智能”一词的索引项会列出所有包含这个词的文档 ID 和位置。

语义检索（Semantic Search）

语义检索基于理解和匹配文本意义而非简单关键词匹配的检索方法。它利用向量嵌入技术将文本转换为数学表示，然后计算查询与文档的语义相似度。这种方法能够找到表达方式不同但含义相近的内容，理解同义词和上下文关系，甚至支持跨语言检索，特别适合复杂或自然语言形式的查询。

向量检索（Vector Retrieval）

向量检索是基于文本向量嵌入相似度的搜索方法，是语义搜索的技术核心。系统首先将用户查询转换为向量，然后在预先计算的文档向量中查找最相似的内容。这种方法能够捕捉深层语义关系，找到表达不同但意思相近的内容，克服了关键词搜索的局限，特别适合处理自然语言查询和概念性问题。

全文检索（Full-text Search）

全文检索是索引文档中的所有词汇，从而允许用户查询任意词汇，并返回包含这些词汇的文本片段。这种技术是现代搜索引擎的基础，能够扫描整个文档集合，无论内容规模多大，都能快速定位包含特定字词或短语的内容。全文检索通常结合倒排索引等数据结构实现高效查询，适用于各类文档库、知识库和搜索系统。

混合检索（Hybrid Search）

混合检索结合关键词匹配和语义搜索的优势，提供更全面的检索结果。例如，当搜索”苹果营养成分”时，混合检索既能找到包含”苹果”和”营养”关键词的文档，也能找到讨论”水果健康价值”等相关语义的内容，通过权重调整或重排序选出最优结果。

多路召回（Multi-path Retrieval）

多路召回是通过多种检索方法并行获取信息的策略。例如，系统可以同时使用关键词搜索、语义匹配和知识图谱查询，然后合并筛选结果，提高信息获取的覆盖面和准确性，特别适合处理复杂或模糊的用户查询。

TopK

TopK 是控制检索返回结果数量的参数，指定保留相似度最高的前 K 个文本片段。合理设置 TopK 值对 RAG 系统性能至关重要：值太小可能丢失关键信息，值太大则可能引入噪音并增加语言模型处理负担。例如，简单问题可能只需 TopK=3，而复杂问题可能需要 TopK=10 以获取足够背景。

分数阈值（Score Threshold）

分数阈值是过滤检索结果的相似度门槛，只有评分超过设定值的内容才会被返回。设置合理的阈值可以避免无关信息干扰模型生成，提高回答的精确性。例如，如果阈值设为 0.8（满分 1.0），则只有高度相关的内容会被采用，但可能导致信息不全；降低阈值则会纳入更多内容但可能引入噪音。

RAG重排序

重排序（ReRank）

重排序是对初步检索结果进行二次排序的技术，提高最终结果的相关性。例如，系统可能先通过高效算法快速检索出大量候选内容，然后使用更复杂但精准的模型对这些结果重新评分排序，将最相关的内容置前，平衡了检索效率和结果质量。

重排序模型（Rerank Model）

重排序模型专门用于评估检索结果与查询的相关性并重新排序。与初步检索不同，这类模型通常采用更复杂的算法，考虑更多语义因素，能更精确地判断内容与用户意图的匹配度。例如，Cohere Rerank 和 BGE Reranker 等模型可显著提升搜索和推荐系统的结果质量。

Agent

智能代理（Agent）

智能代理是一种自主 AI 系统，能够根据环境信息做出决策并执行任务。智能代理能够结合大语言模型的理解能力与外部工具的交互能力，可以自动完成从简单到复杂的一系列操作，如搜索信息、调用 API 或生成内容。比如Manus。

工具调用（Tool Calling）

工具调用是 AI 系统识别并使用外部功能的能力，极大扩展了模型的能力边界。例如，语言模型本身不能访问实时数据，但通过调用天气 API，它可以提供当前天气信息；通过调用数据库查询工具，它可以获取最新产品库存；通过调用计算器，它可以执行复杂计算，这使 AI 能够解决超出其训练数据范围的问题。

函数调用（Function Calling）

函数调用是大型语言模型的能力，允许模型识别何时需要调用特定函数并提供所需参数。例如，当用户询问天气时，模型可以自动调用天气 API，构造正确的参数格式（城市、日期），然后根据 API 返回结果生成回答。

推理与行动（ReAct, Reasoning and Acting）

推理与行动是一种 AI 代理框架，使模型能够交替进行思考和执行操作。在解决问题过程中，模型先分析当前状态，制定计划，然后调用合适工具（如搜索引擎、计算器），根据工具返回结果进行下一步思考，形成思考-行动-思考的循环，直到解决问题，适合处理需要多步骤和外部工具的复杂任务。

多工具调用（Multi-tool-call）

多工具调用是模型在单次响应中调用多个不同工具的能力。例如，处理”比较北京和上海明天的天气并推荐适合的衣着”这样的请求时，模型可以同时调用两个城市的天气 API，然后基于返回结果给出合理建议，提高处理复杂任务的效率。

MCP（Model Control Protocol）

模型上下文协议，Claude大模型的公司 Anthropic 于2024年11月倡导推出并开源。这是一个将AI连接到第三方数据源的新标准，包括内容存储库、业务工具和开发环境。可以让大模型通过统一的方式调用第三方数据和工具。通过MCP，用户可以轻松地使用各种在线服务和本地工具，实现更丰富的功能。

A2A（Agent-to-Agent）

A2A指多智能体协作，Google推出的开放协议，旨在标准化多Agent系统间的通信，解决不同框架（如LangGraph、CrewAI）Agent协作中的痛点，如多个AI分工完成代码编写（生成、测试、优化）。

WorkFlow

工作流（Workflow）

工作流是一种任务编排方式，将复杂 AI 应用拆分为多个独立节点并按特定顺序执行。在 Dify 等平台中，开发者可以可视化设计工作流，组合多个处理步骤（如用户输入处理、知识检索、多模型协作、条件分支），构建能处理复杂业务逻辑的 AI 应用，使应用开发既灵活又直观。

对话流（Chatflow）

对话流是一种面向对话场景的工作流编排模式，专为需要多步逻辑处理的交互式应用设计。与普通工作流相比，对话流额外支持对话历史记忆、问题理解和上下文管理等功能，使大模型能够在多轮对话中保持连贯性。

智能体工作流（Agentic Workflow）

智能体工作流是一种任务编排方法，工作流中可配置一个或多个Agent节点，允许 AI 系统通过多个步骤自主解决复杂问题。例如，一个智能体工作流可以先理解用户问题，然后查询知识库，接着调用计算工具，最后整合信息生成完整回答，全程无需人工干预。

流式工具调用（Stream-tool-call）

流式工具调用是一种实时处理模式，允许 AI 系统在生成响应的同时调用外部工具，而不必等待完整回答生成后再处理。这种方式大大提高了处理复杂任务的响应速度，让用户体验更加流畅，适合需要多次工具调用的交互场景。

多模态模型

多模态模型（Multimodal Model）

多模态模型能处理多种类型的输入数据，如文本、图像、音频等。这类模型打破了传统 AI 的单一感知限制，可以理解图片内容、分析视频场景、识别声音情绪，为更全面的信息理解创造可能，适用于需要跨媒体理解的复杂应用场景。

视觉能力（Vision）

视觉能力是多模态 LLM 理解和处理图像的功能，允许模型分析用户上传的图片并结合文本生成回答。例如，用户可以上传产品照片询问使用方法，上传菜单照片请求翻译，或上传图表要求分析数据趋势。这种能力大大拓展了 AI 应用场景，使交互更加直观和多样化。

自动语音识别（ASR, Automatic Speech Recognition）

自动语音识别技术将人类语音转换为文本，是语音交互应用的基础。这项技术使用户可以通过说话而非打字与 AI 系统交互，广泛应用于语音助手、会议记录和无障碍服务等场景。

语音转文字（STT, Speech-to-Text）

语音转文字技术将用户的语音输入转换为文本数据。这项技术让用户可以通过说话而非打字与 AI 系统交互，提高了交互的自然性和便捷性，特别适合移动设备、驾驶场景或无障碍应用，是语音助手和实时转录等应用的基础。

文本转语音（TTS, Text-to-Speech）

文本转语音是将书面文本转换为自然语音的技术，使 AI 系统能以语音方式与用户交流。现代 TTS 系统能生成接近人类的自然语音，支持多种语言、音色和情感表达，广泛应用于有声读物、导航系统、语音助手和无障碍服务，为不同场景和用户提供更自然的交互体验。

光学字符识别（OCR，Optical Character Recognition）

是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

数字人（Digital Human）

数字人是基于大模型的虚拟形象，能自然对话和表情互动。例如，银行客服数字人通过语音合成和情感识别提供拟人化服务。

Dify

领域特定语言（DSL, Domain-Specific Language）

领域特定语言是为特定应用领域设计的编程语言或配置格式。Dify DSL 是一种基于 YAML 格式的应用工程文件标准，用于定义 AI 应用的各项配置，包括模型参数、提示词设计和工作流编排，使非专业开发者也能构建复杂 AI 应用。

反向调用（Reverse Calling）

反向调用是插件与平台交互的双向机制，允许插件主动调用平台功能。在 Dify 中，这意味着第三方插件不仅能被 AI 调用，还能反过来使用 Dify 的核心功能，如触发工作流或调用其他插件，极大增强了系统的扩展性和灵活性。

会话变量（Session Variables）

会话变量是存储多轮对话上下文信息的机制，使 AI 能维持连贯交互。例如，系统可以记住用户的偏好（如”简洁回答”）、身份信息或交互历史状态，避免重复询问，提供个性化体验。在 Dify 中，开发者可以定义和管理这些变量，建立真正记住用户的”有记忆”应用。

IT通用

软件开发工具包（SDK, Software Development Kit）

软件开发工具包是一组用于开发特定平台或服务应用程序的工具集合。在 Dify 中，SDK 提供了各种编程语言的接口库，使开发者能够方便地集成和调用 Dify 的功能，包括对话管理、知识库操作、应用配置等。通过使用 SDK，开发者可以在自己的应用中快速实现 AI 能力，而无需深入了解底层 API 细节。

应用程序编程接口（API, Application Programming Interface）

是一些预先定义的函数，目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力，而又无需访问源码，或理解内部工作机制的细节。

你可能感兴趣的:(LLM,LLM)

【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
VideoChat：开源的数字人实时对话系统，支持自定义数字人的形象和音色蚝油菜花每日 AI 项目与应用实例人工智能开源 TTS 语音识别
❤️如果你也关注大模型与AI的发展现状，且对大模型应用开发非常感兴趣，我会快速跟你分享最新的感兴趣的AI应用和热点信息，也会不定期分享自己的想法和开源实例，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读VideoChat是一款开源的实时数字人对话系统，支持语音输入和实时对话功能，首包延迟低至3秒。用户可以根据需要自定义数字人的形象和音色，实现个性化交互。VideoChat支持ASR-LLM-T
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
大模型【进阶】（四）QWen模型架构的解读 ReinaXue 人工智能 transformer 语言模型迁移学习 AudioLM 语音识别神经网络
一、Qwen大模型的背景Qwen（通义千问）是阿里巴巴云开发的大型语言模型（LLM）和多模态模型系列，旨在提供强大的自然语言理解、文本生成、图像理解、音频处理及工具使用能力。Qwen系列包括Qwen、Qwen1.5、Qwen2、Qwen2.5和Qwen3等版本，涵盖了从小型（0.5B参数）到超大型（480B参数）的模型规模，支持多语言（119种语言）和多模态任务（文本、图像、音频、视频）。本文将重
AI+MCP智能研判系统架构
AI+MCP智能研判系统架构1.系统概述1.1核心理念AI+MCP智能研判系统是一个创新的网络安全分析平台，通过将大语言模型（LLM）的智能理解能力与MCP（ModelContextProtocol）协议的标准化工具调用能力相结合，实现了"自然语言提问→AI智能理解→MCP工具调用→AI深度研判→智能结果输出"的完整闭环。1.2技术创新点智能意图识别：基于LLM的自然语言理解，自动解析用户查询意图
优化提示内容生成技术框架：提示工程架构师的坚实后盾
优化提示内容生成技术框架：提示工程架构师的坚实后盾引言背景：大语言模型时代的“提示瓶颈”当GPT-4、Claude3、Gemini等大语言模型（LLM）的参数规模突破万亿、上下文窗口扩展至百万token时，一个矛盾逐渐凸显：模型能力的跃升与提示质量的滞后，正在成为制约AI应用落地的核心瓶颈。2023年斯坦福大学的研究显示，在企业级LLM应用中，70%的功能故障源于提示设计缺陷——或因指令模糊导致输
从0搭建到持续优化：提示工程架构师的评估体系迭代全流程
从0搭建到持续优化：提示工程架构师的评估体系迭代全流程引言：AI时代的关键角色与评估挑战在人工智能技术迅猛发展的今天，提示工程(PromptEngineering)已从一个小众技能演变为决定AI系统成败的核心能力。随着大语言模型(LLM)能力的不断增强，提示工程架构师(PromptEngineeringArchitect)作为一个新兴职业应运而生，成为连接业务需求与AI能力的关键桥梁。为什么提示工
！LangChain代理决策架构与源码深度剖析(75)
LangChain代理决策架构与源码深度剖析一、LangChain代理决策架构概述1.1代理决策架构的核心组件LangChain代理的决策架构是其智能交互的核心，主要由大语言模型（LLM）、工具集（Tools）、提示模板（PromptTemplate）、规划器（Planner）、执行器（Executor）和反馈机制六大组件构成。这些组件通过协同工作，实现从用户输入解析到最终结果输出的完整决策流程。
Crome：因果鲁棒奖励建模框架——破解LLM对齐中的奖励黑客难题大千AI助手人工智能 #OTHER Python 人工智能深度学习神经网络大模型因果推断奖励黑客 RewardHacking
Crome（CausalRobustRewardModeling）是由GoogleDeepMind联合麦吉尔大学和魁北克人工智能研究所（MILA）于2025年提出的创新框架，旨在解决大语言模型（LLM）对齐中奖励模型（RM）的奖励黑客（RewardHacking）问题。该框架通过因果数据增强与反事实训练机制，显著提升RM对真实质量属性（如事实性、安全性）的敏感性，同时抑制对虚假属性（如文本长度、格
【大模型LLM学习】function call/agent学习记录威化饼的一隅大模型LLM学习 agent langchain 意图识别 function call 工具调用
【大模型LLM学习】functioncall/agent学习记录0前言1langchain实现functioncall2调用本地模型3微调本地模型3.1few-shot调用Claude生成Q-A对3.2tools格式3.3agent微调格式3.4swift微调p.s.0前言记录一下使用langchain做简单的functioncall/agent(或者说意图识别，如果函数有返回值再进行summ
提示工程监控不到位：5个未做日志记录导致的排查困难
提示工程监控不到位：5个未做日志记录导致的排查困难关键词：提示工程,日志记录,LLM应用调试,AI监控,排查困难,提示模板,上下文追踪摘要：在大语言模型(LLM)应用爆发的时代，提示工程已成为连接人类需求与AI能力的核心桥梁。但多数开发者聚焦于"如何写好提示"，却忽视了"如何记录提示"——日志记录作为提示工程的"黑匣子"，直接决定了AI应用故障排查的效率与准确性。本文通过5个真实场景案例，深入浅出
提示工程中的上下文窗口优化：架构师提升模型记忆的关键 AI实战架构笔记 ai
提示工程中的上下文窗口优化：架构师提升模型记忆的关键元数据标题：提示工程中的上下文窗口优化：架构师提升模型记忆的关键策略与实践指南关键词：上下文窗口管理、提示工程架构、大型语言模型优化、注意力机制效率、长序列处理、记忆增强技术、动态上下文规划摘要：在大型语言模型(LLM)应用中，上下文窗口是连接模型能力与实际需求的关键桥梁。本文从架构师视角，系统探讨上下文窗口优化的理论基础、设计原则与实施策略。通
「实战指南」使用 Python 调用大模型（LLM）用什么都重名大模型相关 python LLM 大模型 api调用
目录前言1.原生HTTP请求方式1.1核心特点1.2关键代码分析1.3优势和适用场景1.4完整代码2.封装式API调用2.1核心特点2.2关键代码分析2.3优势和适用场景2.4完整代码3.OpenAISDK方式3.1核心特点3.2关键代码分析3.3优势和适用场景3.4完整代码4.传统OpenAI库方式4.1核心特点4.2关键代码分析4.3优势和适用场景4.4完整代码5.对比分析总结前言随着大语言模
实践篇：构建基于LLM与本地Pandas的混合式数据分析引擎超人阿亚 pandas 数据分析数据挖掘
公众号：dify实验室基于LLMOps平台-Dify的一站式学习平台。包含不限于：Dify工作流案例、DSL文件分享、模型接入、Dify交流讨论等各类资源分享。在上一篇《思路探索：当大型语言模型遇见数据分析的现实挑战》中，我们阐述了团队确立的技术路线：利用大型语言模型（LLM）作为自然语言到代码的“翻译器”，并结合PythonPandas库作为后端的高性能“计算核心”。本文将从工程实践的角度，详细
2024智能交通趋势：提示工程架构师用AI提示词引领技术变革 AIGC应用创新大全人工智能 ai
2024智能交通趋势：提示工程架构师用AI提示词引领技术变革副标题：从自动驾驶决策到城市交通大脑——大语言模型提示工程实战指南摘要/引言问题陈述：智能交通系统正面临前所未有的复杂性挑战——自动驾驶车辆需要实时处理多源异构数据，城市交通管理需平衡效率与安全，出行服务平台要满足个性化需求。传统AI开发模式依赖大量标注数据和专业领域知识，导致系统迭代缓慢、场景适应性差。当大语言模型(LLM)成为通用人工
Java中的模型API、RAG与向量数据库：构建智能应用的新范式张道宁人工智能
引言在当今人工智能迅猛发展的时代，Java开发者如何利用最新的AI技术构建智能应用？本文将深入探讨模型API、检索增强生成(RAG)和向量数据库这三种关键技术，以及它们如何协同工作来提升Java应用的智能化水平。一、模型API：Java中的AI能力接入1.1什么是模型API模型API是大型语言模型(LLM)提供的编程接口，允许开发者通过HTTP请求与AI模型交互。在Java生态中，我们可以通过多种
大模型 MCP：开启 AI 与现实世界的无缝交互革命 u013250861 LLM 人工智能交互 microsoft
前言MCP无疑是当前最受关注的前沿技术之一，无论是在公司内部还是外部，都引起了广泛的讨论与实践。作为一名互联网从业者，笔者自然不愿错过这一科技浪潮。本篇文章分享笔者最近的一些实践经验和心得，希望能抛砖引玉。WHAT：什么是MCP？MCP（ModelContextProtocol，模型上下文协议）是由Anthropic推出的开源协议，旨在实现大型语言模型（LLM）与外部数据源和工具的无缝集成，用来在
揭秘Transformer架构：残差流与隐藏层的关系 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python transformer 深度学习人工智能 linux 算法
在Transformer架构的LLM中，“残差流”（residualstream）和“隐藏层”（hiddenlayers）是密切相关但不同的概念，前者是层间流动的核心数据，后者是处理这些数据的结构单元。1.残差流（ResidualStream）：层间传递的“信息流”残差流指的是在Transformer层之间传递的核心张量，它是模型中“流动”的数据载体。其本质是通过“残差连接”（residualco
神经架构搜索革命：从动态搜索到高性能LLM的蜕变之路
本文将揭示如何通过神经架构搜索技术（NAS）自动发现最优网络结构，并将搜索结果转化为新一代高性能大型语言模型的核心技术。我们的实验证明，该方法在同等计算资源下可实现80%的性能飞跃！第一部分：神经架构搜索引擎的实现奥秘1.动态操作熔炉架构classMaxStateSuper(nn.Module):def__init__(self,dim_size,heads):#定义5种候选操作self.ops=
大模型服务架构设计与性能优化指南陈乔布斯人工智能大模型 AI 性能优化人工智能 Python 大模型 AI 模型服务
引言在大模型应用开发中，模型服务作为核心组件，负责提供高效、稳定的模型推理能力。随着大语言模型（LLM）的快速发展，模型服务架构面临着性能、可扩展性和成本的多重挑战。本文将深入探讨模型服务的核心组件、架构设计、性能优化技术，并结合电商、金融科技等合规行业案例，为开发者提供全面的模型服务设计指南。一、模型服务核心组件1.1推理引擎推理引擎是模型服务的核心，负责执行模型推理计算。目前主流的推理引擎包括
Dify 本地化部署深度解析与实战指南逻极 dify AI 开源模型 Dify AI 人工智能工作流 Agent AI编程 AI实战
Dify本地化部署深度解析与实战指南引言Dify是一个开源的低代码/无代码AI应用开发平台，旨在帮助用户快速构建和部署基于大型语言模型（LLM）和自主代理的AI应用。Dify的本地化部署允许用户在本地机器或服务器上运行平台，提供更高的数据隐私、成本控制和离线功能。本文将深入探讨Dify的本地化部署方法，包括DockerCompose和源代码部署，结合系统要求、实战步骤和最佳实践，为用户提供逻辑清晰
LLM微调训练指南小小怪 @ 人工智能自然语言处理
模型选择策略开源LLM的选择需综合评估任务需求与资源限制：LLaMA-2（7B/13B/70B）：商用友好，推荐使用HuggingFace格式的社区变体（如NousResearch版本）Mistral（7B）：Apache2.0许可，在推理和数学任务表现突出Falcon（7B/40B）：商业授权宽松，特别适合多轮对话场景硬件匹配参考：NVIDIA3090可微调7B模型（QLoRA），A100建议尝
AI应用 | 【AI+工业】LLM（大型语言模型）在工业领域中的十个应用我爱学大模型人工智能自然语言处理 ai大模型机器学习 LLM 大语言模型 AI工业
随着时间的推移，LLM（大型语言模型）的特性和能力逐渐为人们所熟知。它们展现了无与伦比的人类语言理解、出色的文本生成能力以及友好的对话指令跟随倾向。而像GPT-4和Claude等更为强大的LLM则展现出了对现实世界因果关系的深刻理解。据报道，GPT-4甚至采用了八个与GPT-3.5规模相当的LLM，通过混合专家（MoE）的方式进行配置。尽管LLM在某些方面存在限制，如在过多上下文的情况下可能产生事
大语言模型 LLM 通过 Excel 知识库增强日志分析，根因分析能力的技术方案（1）：总体介绍 shiter 人工智能系统解决方案与技术架构语言模型 excel 人工智能
文章大纲1.核心目标2.系统总体架构3.GoogleCloud端到端方案（含无RAG&RAG双模式）3.1无RAG：Function-Calling查表模式3.2RAG：托管式向量检索4.开源轻量级方案5.数字孪生联合验证（实验性）6.知识图谱增强（Neo4j）7.监控与持续优化（CometLLM）8.实施路线图（4~10周）9.典型案例速览10.一键复现仓库11.参考文献1.核心目标让LLM在“
RAG面试内容整理-1. 检索增强生成（RAG）概述与意义不务正业的猿面试 AI 面试 RAG 人工智能算法大模型检索
检索增强生成（Retrieval-AugmentedGeneration,RAG）是一种将大语言模型与外部知识库相结合的生成式AI架构。传统的大型预训练语言模型（LLM）容易受到训练语料限制，面对超出其知识范围或需要最新信息的查询时可能产生“幻觉”。RAG通过在生成答案前检索相关文档片段，引入新鲜、可信的知识，从而提升回答的准确性和时效性。RAG系统包含两个核心组件：检索器（Retriever）和
集成Tavily Search API以提升AI应用的实时检索能力 dgay_hua 人工智能 python 开发语言
技术背景介绍在AI开发中，尤其是处理大型语言模型（LLM）时，实时、准确的信息检索至关重要。TavilySearchAPI专为AI代理设计，提供高速、准确和事实性的搜索结果，是一个理想的选择。通过将其集成为retriever，可以显著增强信息获取的效率和准确性。核心原理解析TavilySearchAPI作为检索器，依托于其强大的互联网搜索能力，能够快速返回与查询相关的文档。其集成过程主要涉及环境配
Prompt Engineering(提示词工程)基础了解 Fuly1024 LLM prompt
参考:https://blog.csdn.net/qq_56438555/article/details/1448865171.基础概念:提示词工程(promptEngineering)是指通过设计、优化输入给大语言模型的文本指令（即“提示词”）,引导LLM输出我们期望的结果。让大模型在无需微调（Fine-tuning）的情况下，通过“更好的提问方式”完成复杂任务(开发潜力,不会的还是不会)。但是
9、LLaMA-Factory项目微调介绍 Andy_shenzl 大模型学习 llama LLaMA Factory 微调大模型 LoRA
1、LLaMAFactory介绍 LLaMAFactory是一个在GitHub上开源的项目，该项目给自身的定位是：提供一个易于使用的大语言模型（LLM）微调框架，支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。更细致的看，该项目提供了从预训练、指令微调到RLHF阶段的开源微调解决方案。截止目前（2024年3月1日）支持约120+种不同的模型和内置了60+的数据集，同时封
AI原生应用领域函数调用的团队协作开发模式 AI算力网络与通信 AI-native ai
AI原生应用领域函数调用的团队协作开发模式：从技术协同到组织进化引言背景：AI原生应用与函数调用的崛起2023年以来，以GPT-4为代表的大语言模型（LLM）推动了AI应用开发的范式转移——AI原生应用（AI-NativeApplication）成为新的开发热点。这类应用从设计之初就将AI能力深度融入核心逻辑，而非简单集成AI功能模块。与传统应用相比，AI原生应用的最大特点是**“动态决策”**：
Deja Vu: 利用上下文稀疏性提升大语言模型推理效率 AI专题精讲模型加速人工智能模型加速 AI技术应用
温馨提示：本篇文章已同步至"AI专题精讲"DejaVu:利用上下文稀疏性提升大语言模型推理效率摘要拥有数百亿参数的大语言模型（LLMs）催生了一系列令人振奋的AI应用。然而，在推理阶段它们计算开销极大。稀疏化是一种自然的降本策略，但现有方法要么需要代价高昂的重新训练，要么必须放弃LLM的“in-contextlearning”能力，要么在现代硬件上无法带来真实的墙钟时间加速。我们提出**上下文稀疏
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p