从零开始学习人工智能

深入解析 Qwen3-Embedding 和 Qwen3-Reranker：原理、应用与代码示例

在当今数字化信息爆炸的时代，高效的信息检索与处理技术成为了众多领域的关键需求。文本嵌入（Embedding）和重排序（Reranking）技术在语义搜索、推荐系统、检索增强生成（RAG）等应用中发挥着基础性作用。然而，现有的方法在实现多语言的高保真度和任务适应性方面面临诸多挑战，特别是在需要对多种语言进行细致语义理解的场景，或诸如代码检索和指令跟随等特定领域任务中，现有模型往往表现欠佳。此外，大多数开源模型缺乏规模和灵活性，而商业 API 则成本高昂且封闭。为应对这些挑战，阿里巴巴的 Qwen 团队推出了 Qwen3-Embedding 和 Qwen3-Reranker 系列模型，为多语言文本嵌入和相关性排序设立了新的标杆。

Qwen3-Embedding 技术解析

技术原理与架构

Qwen3-Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列，采用了基于密集 Transformer 的架构，并专注于因果注意力机制以提升性能。其核心功能是将离散的、高维的符号（如文字）转化为低维、连续的数字向量（Vector），通过这种转化技术来捕捉不同数据点在嵌入空间中的距离远近，进而挖掘出它们之间隐藏的语义关系。

该模型接收单段文本作为输入，在处理过程中，利用模型最后一层的「EOS」标记对应的隐藏状态向量，将其作为输入文本的语义表示。例如，当输入 “苹果手机真好用” 和 “我有一部 iPhone” 这两句话时，Qwen3-Embedding 会将它们转化为数字向量。由于这两句话在语义上很接近，所以它们对应的向量也十分相似；而若输入 “今天天气不错”，与前两句表达的内容差别较大，其在向量空间中的位置就会与前两者距离更远。通过这种方式，AI 就能自动判断文本内容的相关性，为后续的搜索、推荐、聚类等任务提供有力支持。

训练过程详解

Qwen3-Embedding 的训练遵循多阶段训练范式，具体包括以下三个阶段：

大规模弱监督阶段：利用 Qwen3-32B 生成了 1.5 亿个合成训练对，这些训练对涵盖了多种语言和任务，包括检索、分类、语义文本相似度（STS）以及双文本挖掘等。此阶段通过大规模的弱监督数据进行对比学习预训练，让模型初步学习到文本之间的语义关系。
监督微调阶段：从众多数据中筛选出 1200 万个余弦相似度大于 0.7 的高质量数据对，使用这些数据对模型进行监督训练，以提高模型在实际应用场景中的准确性。这一步基于高质量标注数据进行，使得模型能够更好地适应具体任务需求。
模型融合阶段：采用球面线性插值（Slerp）的方法对多个微调后的检查点进行模型融合，确保模型的鲁棒性和泛化能力。通过这种融合策略，能够综合多个候选模型的优势，进一步提升模型的整体性能。

模型特色功能

多语言支持：支持多达 119 种语言，涵盖了主流自然语言以及多种编程语言，具备强大的多语言、跨语言及代码检索能力。
表征维度自定义：允许用户根据实际需求调整表征维度，开发者可以根据具体应用场景和资源限制，灵活地设置向量的维度，有效降低应用成本。
指令适配优化：支持用户自定义指令模板，用户可根据不同的任务类型、语言特点或特定场景，定制输入指令。官方测试显示，使用自定义指令通常比不使用指令能提高 1% 到 5% 的性能。

示例代码

以下是一个使用 Qwen3-Embedding 模型生成文本嵌入向量的 Python 示例代码。假设我们使用的是 Hugging Face 的 transformers 库来加载和运行模型。

安装依赖

pip install transformers torch

示例代码

import torch
from transformers import AutoModel, AutoTokenizer

# 加载 Qwen3-Embedding 模型和分词器
model_name = "Qwen/Qwen3-Embedding"  # 替换为实际的模型名称
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

# 输入文本
texts = [
    "苹果手机真好用",
    "我有一部 iPhone",
    "今天天气不错"
]

# 对输入文本进行分词并生成嵌入向量
embeddings = []
for text in texts:
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
    outputs = model(**inputs)
    # 获取最后一层的 [CLS] 标记对应的隐藏状态向量
    embedding = outputs.last_hidden_state[:, 0, :].detach().numpy()
    embeddings.append(embedding)

# 打印嵌入向量
for i, text in enumerate(texts):
    print(f"Text: {text}")
    print(f"Embedding: {embeddings[i]}")
    print("-" * 50)

Qwen3-Reranker 技术解析

技术原理与架构

Qwen3-Reranker 是专门用于提升搜索和推荐系统相关性排序能力的模型，与 Qwen3-Embedding 配套使用。它采用跨编码器（Cross-Encoder）架构，输入为文本对（例如用户查询与候选文档），通过深度语义分析来计算并输出两个文本的相关性得分，进而对初步检索结果进行精细排序，确保最相关的文档排在前面。

在实际应用中，当一个检索系统基于 Qwen3-Embedding 完成初步检索后，会得到一批与查询相关的候选文档。此时，Qwen3-Reranker 会对这些候选文档与查询进行精细化打分和排序。例如，在一个文档检索系统中，用户输入查询 “如何提高跑步速度”，Qwen3-Embedding 可能会初步检索出一批相关文档，但这些文档的相关性程度参差不齐。Qwen3-Reranker 会对每一个文档与查询组成的文本对进行分析，通过其跨编码器结构，深入理解查询与文档之间的语义关系，然后给出一个相关性得分。最终，系统根据这个得分重新排序，将最相关的文档优先展示给用户。

训练过程

在 Reranker 模型的训练中，基于实验验证结果，直接采用高质量标注数据进行监督训练。这种方式能够有针对性地提升模型在排序任务上的性能，相比于一些需要大量无监督或弱监督数据预训练的方法，大大提升了训练效率。通过对高质量标注数据的学习，模型能够更好地捕捉查询与文档之间的相关性特征，从而在实际应用中给出更准确的排序结果。

模型优势

高精度排序：通过深度语义分析，Qwen3-Reranker 能够捕捉查询和文档间的细微相关性。与传统的排序方法相比，它不仅仅依赖于关键词匹配，而是从语义层面深入理解文本对之间的关系，显著提升了排序质量。
高效推理：经过优化的推理速度，结合阿里云 DashVector 服务，能够实现低延迟、高吞吐量。这使得在大规模的信息检索应用中，能够快速响应用户的查询请求，为用户提供流畅的检索体验。
用户自定义：同样支持自定义指令，开发者可以根据不同的任务需求和应用场景，灵活调整输入格式，从而提升排序效果。

示例代码

以下是一个使用 Qwen3-Reranker 模型对文本对进行相关性打分的 Python 示例代码。

示例代码

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

# 加载 Qwen3-Reranker 模型和分词器
model_name = "Qwen/Qwen3-Reranker"  # 替换为实际的模型名称
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 输入文本对
query = "如何提高跑步速度"
documents = [
    "提高跑步速度需要坚持训练。",
    "跑步速度的提升与饮食无关。",
    "天气对跑步速度有影响。"
]

# 对每个文本对进行相关性打分
for doc in documents:
    # 构造输入文本对
    input_text = f"{query} [SEP] {doc}"
    inputs = tokenizer(input_text, return_tensors="pt", padding=True, truncation=True)
    
    # 获取模型输出
    outputs = model(**inputs)
    logits = outputs.logits
    score = torch.nn.functional.softmax(logits, dim=1)[:, 1].item()  # 获取相关性得分
    
    print(f"Query: {query}")
    print(f"Document: {doc}")
    print(f"Relevance Score: {score:.4f}")
    print("-" * 50)

Qwen3-Embedding 和 Qwen3-Reranker 的协同应用

在实际应用中，Qwen3-Embedding 和 Qwen3-Reranker 常常结合使用，构建出一套完整的语义检索流程，显著提升搜索、推荐等系统的准确性。以检索增强生成（RAG）系统为例，Embedding 模型和 Reranker 模型共同构建了检索部分的骨干框架。首先，Qwen3-Embedding 模型将用户的查询以及文档库中的文档都转化为向量表示，通过计算向量之间的相似度，进行初步检索，从大规模的文档库中筛选出一批可能相关的候选文档。然后，Qwen3-Reranker 模型对这些候选文档与查询组成的文本对进行精细化打分和排序，从语义层面深入分析它们之间的相关性，将最相关的文档筛选出来提供给后续的生成模型或直接展示给用户。

在电商推荐系统中，Qwen3-Embedding 可以根据用户的历史浏览行为、购买记录等生成用户向量，同时将商品信息转化为商品向量，通过向量相似度进行初步的商品推荐。然后，Qwen3-Reranker 根据用户当前的查询或浏览情境，对初步推荐的商品进行相关性排序，优先展示最符合用户当前需求的商品，从而提升用户体验和转化率。

性能表现与对比

Qwen3-Embedding 和 Qwen3-Reranker 在多个多语言基准测试中展现出了强大的性能：

在 MMTEB（涵盖 250 多种语言的 216 个任务）测试中，Qwen3-Embedding-8B 取得了 70.58 的平均任务得分，超越了 Gemini 和 GTE-Qwen 2 系列等模型。
在 MTEB（英语 v2）测试中，Qwen3-Embedding-8B 达到了 75.22 的分数，优于其他开源模型，如 NV-Embed-V2 和 Grit LM-7B 等。
在 MTEB-Code 测试中，Qwen3-Embedding-8B 以 80.68 的分数领先，在代码检索和 Stack Overflow 问答等应用中表现出色。
Qwen3-Reranker-0.6B 已经超越了 Jina 和 BGE 重排器。
Qwen3-Reranker-8B 在 MTEB-Code 测试中获得 81.22 的分数，在 MMTEB-R 测试中获得 72.94 的分数，达到了当前最先进的性能水平。

通过对比实验和消融研究发现，Qwen3-Embedding 和 Qwen3-Reranker 的训练过程中的各个阶段都至关重要。例如，在 Qwen3-Embedding 的训练中，如果跳过合成预训练或模型融合阶段，会导致性能显著下降（在 MMTEB 测试中最多下降 6 分），这充分证明了其全面训练方法的有效性。与其他类似模型如 BGE（智源）、Sentence-BERT 等相比，Qwen3-Embedding-8B 在 MTEB 多语言排行榜上得分 70.58，领先于 BGE 等模型，Reranker 模型在多语言检索任务中也表现优异。此外，阿里还开源了 GTE 系列模型（如 gte-multilingual-reranker-base），该系列采用更轻量的 ModernBERT 架构，支持 70 + 语言，推理速度提升 10 倍，但由于参数规模较小，性能稍逊于 Qwen3 系列。

总结与展望

阿里巴巴的 Qwen3-Embedding 和 Qwen3-Reranker 系列模型为多语言信息检索领域带来了重大突破。通过强大的技术架构、精心设计的训练过程以及卓越的性能表现，它们为开发者和研究人员提供了构建更有效的语义检索和 RAG 应用的有力工具。其开源特性也使得更多的人能够基于这些模型进行创新和拓展，推动整个机器学习社区的发展。

随着对语言理解和信息检索需求的不断增长，相信 Qwen3 系列模型将在更多的领域得到应用和优化，为用户提供更加智能、高效的信息服务。同时，Qwen 团队也在持续探索和优化，计划通过对 Qwen 基础模型的不断改进，提升文本嵌入和重排序模型的训练效率，进一步改善在各种场景下的部署性能。此外，还将致力于扩展多模态表示系统，建立跨模态语义理解能力，为未来的人工智能应用开辟更广阔的空间。

希望这篇文章对你有所帮助！如果你还有其他问题或需要进一步的解释，欢迎随时提问。

RoPE：相对位置编码的旋转革命——原理、演进与大模型应用全景大千AI助手人工智能 Python #OTHER 人工智能深度学习大模型算法 RoPE 位置编码相对位置
“以复数旋转解锁位置关系的本质表达，让Transformer突破长度藩篱”旋转位置编码（RotaryPositionEmbedding,RoPE）是由JianlinSu等研究者于2021年提出的突破性位置编码方法，通过复数空间中的旋转操作将相对位置信息融入Transformer的自注意力机制，解决了传统位置编码在长序列建模中的外推瓶颈。该方法是当前主流大模型（如LLaMA、GPT-NeoX）的核心
RAG、Function Call、MCP技术笔记大佐不会说日语～面试笔记篇笔记
核心概念理解这三种技术都是为了增强大模型能力的重要手段，但各有侧重点和应用场景。RAG（检索增强生成）RAG本质上是为大模型外接一个动态知识库。当模型需要回答问题时，先从知识库中检索相关信息，再结合检索结果生成答案。核心原理：将文档内容进行向量化存储（通常使用Embedding模型）用户提问时，将问题也向量化通过相似度计算（如欧氏距离、余弦相似度）找到最相关的文档片段将检索到的内容作为上下文传给大
RAG面试内容整理-3. 向量检索原理与常用库（ANN、FAISS、Milvus 等）不务正业的猿面试 LangChain AI 面试职场和发展大模型 RAG AI 人工智能算法
向量检索利用向量空间的相似度来查找相关内容，是近年来兴起的检索技术核心。其基础是在语义嵌入（embedding）模型的支持下，将文本、图像等数据表示为高维向量，以便通过向量相似度（如余弦相似度或欧氏距离）找到内容上的邻近项。由于直接精确计算所有向量之间的距离在大规模下计算开销巨大，实际系统通常采用近似最近邻搜索（ApproximateNearestNeighbor,ANN）算法，在保证结果精度接近
Pytorch实现细节解析：Transformer模型的Encoder与Decoder逐行代码讲解 lazycatlove pytorch transformer 人工智能
文章目录摘要一、Transformer1.1为什么要使用attention1.2Transformer的优点二、Transformer模型Encoder和Decoder原理讲解与其Pytorch逐行实现2.1wordembedding2.2单词索引构成源句子和目标句子2.3构建positionembedding2.4构造encoder的self-attentionmask2.5构造intra-at
PyTorch中的词嵌入层(nn.Embedding)详解与实践指南慕婉0307 自然语言处理 pytorch embedding 人工智能
一、词嵌入(WordEmbedding)简介词嵌入是自然语言处理(NLP)中的一项核心技术，它将离散的词语映射到连续的向量空间中。通过词嵌入，语义相似的词语在向量空间中的位置也会相近。为什么需要词嵌入？解决维度灾难：传统one-hot编码维度等于词汇表大小，而词嵌入维度可自定义捕捉语义关系：通过向量空间中的距离反映词语间的语义关系迁移学习：预训练的词嵌入可以在不同任务间共享二、PyTorch中的n
Python----大模型（ RAG的向量化（embedding））蹦蹦跳跳真可爱589 Python 大模型 python embedding 开发语言人工智能
一、向量化向量化是将非结构化数据（如文本、图像等）转化为数字表示的一种过程。在RAG中，通常会使用预训练的Transformer模型（如BERT、RoBERTa等）将文本表示为高维的向量。这些向量能够捕捉到数据的语义信息，从而在向量空间中表示相似性。两段相似的文本在向量空间中将非常接近。快速检索：向量化将文本转换为向量后，可以通过向量相似度算法（如余弦相似度）快速检索与查询相关的信息。语义理解：通
BERT模型架构大多_C bert 人工智能深度学习
BertModel((embeddings):BertEmbeddings((word_embeddings):Embedding(30522,768,padding_idx=0)(position_embeddings):Embedding(512,768)(token_type_embeddings):Embedding(2,768)(LayerNorm):LayerNorm((768,),e
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
【速通RAG实战：数据库】6.RAG向量数据库原理无心水速通 RAG 实战！解锁 AI 2.0 高薪密码速通RAG实战 RAG快速开发实战 RAG RAG向量数据库相似度 FAISS Chroma
在RAG（检索增强生成）系统中，向量数据库扮演着至关重要的角色，它负责存储文本经过Embedding处理后的向量表示，并能高效地进行向量检索，以找出与查询向量最相似的文档。1.向量数据库原理1.向量表示在RAG系统里，文本首先会通过Embedding模型（如OpenAIEmbeddings、SentenceTransformers等）转化为固定维度的向量。这些向量能够捕捉文本的语义信息，使得语义相
打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
Go-Redis × 向量检索实战用 HNSW 在 Redis 中索引与查询文本 Embedding（Hash & JSON 双版本） Hello.Reader 数据库运维缓存技术 golang redis embedding
1.场景与思路痛点：把“文本内容”转成向量后，如何在本地Redis里做近似向量搜索（KNN），而不依赖外部向量数据库？方案：利用HuggingFace模型sentence-transformers/all-MiniLM-L6-v2生成384维Float32向量；借助RediSearch的HNSW索引能力，在Hash或JSON文档里存储&查询向量；用go-redisv9的高阶API（FTCreate
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Ollama平台里最流行的embedding模型： nomic-embed-text 模型介绍和实践 skywalk8163 人工智能 embedding 人工智能服务器
nomic-embed-text模型介绍nomic-embed-text是一个基于SentenceTransformers库的句子嵌入模型，专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色，特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入，这些嵌入在语义上非常接近，从而在相似度计算和分类任务中表现优异。之所以选用这个模型，是因为在Ollama网站查找这个模型，发现
2025年的RAG技术发展趋势与演进码农Q！云计算人工智能 ai agi 自然语言处理语言模型
本文将分享作为大模型应用创业者的经历与观察，讨论RAG技术和市场环境在2024年的变化。一、RAG技术的演进RAG（检索增强生成）由“检索”和“大模型生成”两部分组成，而检索之前的索引创建（如chunking、embedding等）是核心基础。我们早在2021年便通过Java技术栈实现了RAG的“RA”部分。2023年中，RAG概念突然走红，并迅速在企业应用中显示出更强的实用性。1.主流架构的变化
大模型之Spring AI实战系列（三十二）：Spring Boot + DeepSeek 实战指南：工具函数（Function Call）实战应用
系列篇章No.文章1大模型之SpringAI实战系列（一）：基础认知篇-开启智能应用开发之旅2大模型之SpringAI实战系列（二）：SpringBoot+OpenAI打造聊天应用全攻略3大模型之SpringAI实战系列（三）：SpringBoot+OpenAI实现聊天应用上下文记忆功能4大模型之SpringAI实战系列（四）：SpringBoot+OpenAI使用OpenAIEmbedding实
OpenSearch 向量搜索与Qwen3-Embedding 集成示例 ZHOU_CAMP RAG 数据库 docker RAG opensearch agent
本项目演示了如何将OpenSearch的k-NN(k-NearestNeighbors)向量搜索功能与OpenAI的高级文本嵌入模型（如Qwen3-Embedding）相结合，以实现强大的语义搜索。核心概念文本嵌入(TextEmbedding):将文本（单词、句子、段落）转换为一个高维的数字向量。语义上相似的文本在向量空间中的距离会更近。Qwen3-Embedding:我们调用Qwen3-Embe
文献分享: BGE-M3——打通三种方式的嵌入模型
文章目录1.\textbf{1.}1.背景与导论1.1.\textbf{1.1.}1.1.研究背景1.2.\textbf{1.2.}1.2.本文的研究1.3.\textbf{1.3.}1.3.有关工作2.M3-Embedding\textbf{2.M3-Embedding}2.M3-Embedding2.1.\textbf{2.1.}2.1.模型核心:混合检索方式2.1.1.\textbf{2.1
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
SVN介绍（三）--SVN启动方式小蘑菇二号 SVN 快速入门 SVN
目录1.StandaloneServerMode（独立服务器模式）2.ApacheHTTPServerMode（与Apache结合模式）3.EmbeddinginApplicationMode（嵌入应用程序模式）4.FileSystemMode（文件系统模式）选择合适的模式Subversion（SVN）可以以不同的方式启动其服务器组件，以适应不同的部署需求。以下是几种常见的SVN服务器启动模式及其
【Torch】nn.Embedding算法详解油泼辣子多加深度学习 embedding 算法
1.定义nn.Embedding是PyTorch中的查表式嵌入层（lookup‐table），用于将离散的整数索引（如词ID、实体ID、离散特征类别等）映射到一个连续的、可训练的低维向量空间。它通过维护一个形状为(num_embeddings,embedding_dim)的权重矩阵，实现高效的“索引→向量”转换。2.输入与输出输入类型：整型张量（torch.long或torch.int64），必须
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
百度7天GNN学习-图与图学习中静静喜欢大白 pgl
目录1链接预测分析图学习的主要任务链接预测（Linkprediction）1.相似度分数2.性能指标(Performancemetrics)完整代码输出2节点标记预测分析完整代码输出3图嵌入图嵌入（GraphEmbedding）1.节点嵌入(NodeEmbedding)2.边嵌入(EdgeEmbedding)3.图嵌入(GraphEmbedding)完整代码输出小结小结参考1链接预测分析图学习的
从0开始，手搓一个ViT 星光银河学习 python 深度学习机器学习学习神经网络人工智能 transformer
importtorchimporttorch.nnasnnimporttorch.nn.functionalasFclassPatchEmbedding(nn.Module):def__init__(self,img_size,patch_size,in_chans,embed_dim):super().__init__()assertimg_size%patch_size==0,"Imagedi
基于昇腾910B部署Qwen3-embedding-8B模型（通过vllm 推理引擎部署）萌新--加油 embedding 人工智能经验分享
目前基于知识库搭建，会涉及到embedding和rerank模型，目前阿里通义千问Qwen3-embedding-8B模型在网上测评效果还不错，本文基于vllm部署Qwen3-embedding-8B模型，使用的国产化算力910B2-64G单卡资源。1、环境要求：软件支持版本CANN>=8.1.RC1torch-npu>=2.5.1torch>=2.5.1Python>=3.9,<3.122、to
Qwen3 Embedding 结构-加载-训练看透模型设计哲学
看透一个顶级AI句向量模型的设计秘密，从文件结构到加载原理，再到其背后的训练哲学。1Qwen3-Embedding模型结构拆解说明：目录包含了运行一个基于Transformer的句向量模型所需的所有组件文件类别核心文件作用核心模型model.safetensors,config.jsonmodel.safetensors存储了模型所有训练好的权重分词器tokenizer.json,vocab.js
本地部署Jina-CLIP v2:多语言多模态文本图像向量模型（包含一些踩坑记录和技巧）令令小宁 jina 语言模型 python
JinaCLIPv2：Jina-CLIP-v2是一个全新的通用多语言多模态向量模型，该模型基于jina-clip-v1和jina-embeddings-3构建，实现了一些关键改进。关于Jina-CLIP-v2的更多介绍点此可了解模型特点模型开源链接：https://huggingface.co/jinaai/jina-clip-v2在它的开源链接的介绍中，我们可以得知，Jina-CLIP-v2的参
Llama改进之——RoPE旋转位置编码愤怒的可乐 NLP项目实战 #LLaMA RoPE 旋转位置编码
引言旋转位置编码(RotaryPositionEmbedding,RoPE)将绝对相对位置依赖纳入自注意力机制中，以增强Transformer架构的性能。目前很火的大模型LLaMA、QWen等都应用了旋转位置编码。之前在[论文笔记]ROFORMER中对旋转位置编码的原始论文进行了解析，重点推导了旋转位置编码的公式，本文侧重实现，同时尽量简化数学上的推理，详细推理可见最后的参考文章。复数与极坐标复数
从0实现llama3 讨厌编程但喜欢LLM的学院派人工智能 python 开发语言深度学习机器学习 pytorch
分享一下从0实现llama的过程流程如下：word-->embeddinglayer-->n*decoderlayer-->finallinearlayer-->output分词器在embedding之前，需要进行分词，将句子分成单词。llama3采用了基于BPE算法的分词器。这个链接实现了一个非常简洁的BPE分词器简易分词器实现BPE分词器（选看）1)训练tokenizer词汇表并合并给定文本，
【Rust日报】Rust稳定2024版本将于 2025年2月20日发布
fastembed-rs-AI嵌入库FastEmbed的Rust实现,提供了快速的文本嵌入、图像嵌入和候选项重新排序功能。它具有以下主要特性:支持同步使用,无需依赖Tokio。使用@pykeio/ort进行高性能的ONNX推理。使用@huggingface/tokenizers进行快速编码。支持使用@rayon-rs/rayon进行批量嵌入生成和并行计算。默认模型是FlagEmbedding,在M
Advanced RAG：下一代检索增强生成技术详解北辰alk AI 人工智能
文章目录一、核心演进维度二、关键技术组件1.智能检索子系统2.动态知识管理3.生成控制器三、核心增强技术1.递归检索(RecursiveRetrieval)2.假设性检索(HypotheticalDocumentEmbedding)3.自适应分块(AdaptiveChunking)四、生产级架构设计完整系统架构关键优化点五、典型应用场景1.专业领域问答系统2.企业知识中枢3.实时决策支持六、评估指
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

深入解析 Qwen3-Embedding 和 Qwen3-Reranker：原理、应用与代码示例