NtK11KGXVkk

Spring AI之向量数据库

这里写自定义目录标题

- API 概述
- - 数据插入与向量嵌入
  - 相似性搜索参数
- 模式初始化
- 批处理策略
- - 核心接口定义
  - - 默认实现：TokenCountBatchingStrategy
    - 内部机制与扩展性
  - 自定义批处理策略
- VectorStore 实现
- 示例用法
- - 数据加载到向量存储
  - 相似性搜索与上下文注入
  - 关键技术点
- 元数据过滤器
- - 过滤字符串（Filter String）
  - Filter.Expression 构建器
- 从向量存储中删除文档
- - 按文档ID删除
  - 按过滤表达式删除
  - 按字符串过滤表达式删除
  - 删除操作的错误处理
  - 文档版本控制场景
  - 性能优化建议

向量数据库是一种在人工智能应用中发挥关键作用的专用数据库类型。
在向量数据库中，查询方式与传统关系型数据库存在显著差异。它们并非进行精确匹配，而是执行相似性搜索。当以向量作为查询输入时，向量数据库会返回与查询向量"相似"的向量集合。关于这种相似性在高层级的计算方式，详见《向量相似性》章节的说明。

向量数据库用于将数据与人工智能模型进行整合。其使用流程的第一步是将数据加载到向量数据库中。当需要向AI模型发送用户查询时，系统会首先检索一组相似文档。这些文档将作为用户问题的上下文信息，与用户查询一起被发送至AI模型。这种技术被称为检索增强生成（Retrieval Augmented Generation, RAG）。

后续章节将介绍Spring AI框架中用于操作多种向量数据库实现的接口规范，以及相关高级用法示例。
最后一节旨在解析向量数据库中相似性搜索技术的底层实现原理。

API 概述

本节作为 Spring AI 框架中 VectorStore 接口及其关联类的指南。
Spring AI 通过 VectorStore 接口提供了与向量数据库交互的抽象化 API。
以下是 VectorStore 接口的定义：

public interface VectorStore extends DocumentWriter {

    default String getName() {
        return this.getClass().getSimpleName();
    }

    void add(List<Document> documents);

    void delete(List<String> idList);

    void delete(Filter.Expression filterExpression);

    default void delete(String filterExpression) { ... };

    List<Document> similaritySearch(String query);

    List<Document> similaritySearch(SearchRequest request);

    default <T> Optional<T> getNativeClient() {
        return Optional.empty();
    }
}

以及相关的 SearchRequest 构建器：

public class SearchRequest {

    public static final double SIMILARITY_THRESHOLD_ACCEPT_ALL = 0.0;
    public static final int DEFAULT_TOP_K = 4;

    private String query = "";
    private int topK = DEFAULT_TOP_K;
    private double similarityThreshold = SIMILARITY_THRESHOLD_ACCEPT_ALL;
    @Nullable
    private Filter.Expression filterExpression;

    public static Builder from(SearchRequest originalSearchRequest) {
        return builder().query(originalSearchRequest.getQuery())
            .topK(originalSearchRequest.getTopK())
            .similarityThreshold(originalSearchRequest.getSimilarityThreshold())
            .filterExpression(originalSearchRequest.getFilterExpression());
    }

    public static class Builder {
        private final SearchRequest searchRequest = new SearchRequest();

        public Builder query(String query) {
            Assert.notNull(query, "查询内容不能为空。");
            this.searchRequest.query = query;
            return this;
        }

        public Builder topK(int topK) {
            Assert.isTrue(topK >= 0, "TopK 必须为非负数。");
            this.searchRequest.topK = topK;
            return this;
        }

        public Builder similarityThreshold(double threshold) {
            Assert.isTrue(threshold >= 0 && threshold <= 1, "相似度阈值必须在 [0,1] 范围内。");
            this.searchRequest.similarityThreshold = threshold;
            return this;
        }

        public Builder similarityThresholdAll() {
            this.searchRequest.similarityThreshold = 0.0;
            return this;
        }

        public Builder filterExpression(@Nullable Filter.Expression expression) {
            this.searchRequest.filterExpression = expression;
            return this;
        }

        public Builder filterExpression(@Nullable String textExpression) {
            this.searchRequest.filterExpression = (textExpression != null)
                ? new FilterExpressionTextParser().parse(textExpression) : null;
            return this;
        }

        public SearchRequest build() {
            return this.searchRequest;
        }
    }

    public String getQuery() {...}
    public int getTopK() {...}
    public double getSimilarityThreshold() {...}
    public Filter.Expression getFilterExpression() {...}
}

数据插入与向量嵌入

要向向量数据库插入数据，需将其封装在 Document 对象中。
Document 类封装了来自数据源（如 PDF 或 Word 文档）的内容，包含以字符串形式表示的文本，以及以键值对形式存储的元数据（如文件名等）。

插入向量数据库时，文本内容会通过嵌入模型（如 Word2Vec、GLoVE、BERT 或 OpenAI 的 text-embedding-ada-002）转换为数值数组（float[]），即向量嵌入（vector embeddings）。
向量数据库的职责是存储这些嵌入并向其提供相似性搜索功能，但其本身不生成嵌入。生成向量嵌入需使用 EmbeddingModel 。

相似性搜索参数

接口中的 similaritySearch 方法支持通过以下参数优化检索结果：

k （topK）
指定返回的相似文档最大数量（整数）。此参数通常称为 Top K 搜索或 K 近邻（KNN）。
threshold （相似度阈值）
范围为 0 到 1 的浮点值，数值越接近 1 表示相似度越高。例如，默认阈值 0.75 仅返回相似度高于此值的文档。
Filter.Expression
用于传递类似 SQL WHERE 子句的领域特定语言（DSL）表达式，但仅作用于文档的元数据键值对。
示例：若元数据包含 country、year 和 isActive，可使用表达式 country == ‘UK’ && year >= 2020 && isActive == true。
filterExpression （字符串形式的过滤表达式）
基于 ANTLR4 的外部 DSL，接受字符串形式的过滤表达式。

更多关于 Filter.Expression 的信息，请参考元数据过滤器章节。

模式初始化

某些向量存储需要先初始化后端模式后才能使用。默认情况下，系统不会自动完成此初始化操作。您需要通过以下方式主动启用：

在构造函数中传递一个布尔值参数，或
如果使用 Spring Boot，在 application.properties 或 application.yml 中将对应的 initialize-schema 属性设置为 true。

批处理策略

在处理向量存储时，通常需要嵌入大量文档。尽管一次性嵌入所有文档看似直接，但这种方法可能导致问题。嵌入模型以令牌（token）为单位处理文本，并存在最大令牌限制（即上下文窗口大小）。单次嵌入请求若超出此限制，可能引发错误或截断嵌入结果。

为解决令牌限制问题，Spring AI 实现了批处理策略。该策略将大量文档拆分为较小批次，确保每个批次的令牌数不超过嵌入模型的最大上下文窗口限制。批处理不仅规避了令牌限制，还能提升性能并更高效地利用 API 速率限制。

Spring AI 通过 BatchingStrategy 接口提供此功能，支持基于令牌数对文档进行分批处理。

核心接口定义

BatchingStrategy 接口定义如下：

public interface BatchingStrategy {
    List<List<Document>> batch(List<Document> documents);
}

该接口定义了一个 batch 方法，接收文档列表并返回分批后的文档列表。

默认实现：TokenCountBatchingStrategy

Spring AI 提供了默认实现 TokenCountBatchingStrategy，该策略根据文档的令牌数进行分批，确保每批不超过最大输入令牌限制。

核心特性：

默认使用 OpenAI 的最大输入令牌数（8191）作为上限。
包含保留百分比（默认 10%），为潜在开销提供缓冲。
实际最大输入令牌数计算公式：
actualMaxInputTokenCount = originalMaxInputTokenCount * (1 - RESERVE_PERCENTAGE)
若单个文档超出限制，将抛出异常。
自定义配置示例：
可通过 Spring Boot 配置类定义自定义参数：

@Configuration
public class EmbeddingConfig {
    @Bean
    public BatchingStrategy customTokenCountBatchingStrategy() {
        return new TokenCountBatchingStrategy(
            EncodingType.CL100K_BASE,  // 指定编码类型
            8000,                      // 最大输入令牌数
            0.1                        // 保留百分比
        );
    }
}

参数说明：

EncodingType.CL100K_BASE：用于令牌计数的编码类型，确保与 JTokkitTokenCountEstimator 兼容。
8000：需小于等于嵌入模型的最大上下文窗口大小。
0.1：保留 10% 的令牌数作为缓冲。

内部机制与扩展性

令牌计数估计器：
TokenCountBatchingStrategy 内部使用 JTokkitTokenCountEstimator 估算令牌数，支持通过 TokenCountEstimator 接口自定义实现。
示例：

TokenCountEstimator customEstimator = new YourCustomTokenCountEstimator();
TokenCountBatchingStrategy strategy = new TokenCountBatchingStrategy(
    customEstimator,
    8000,    // 最大输入令牌数
    0.1,     // 保留百分比
    Document.DEFAULT_CONTENT_FORMATTER,
    MetadataMode.NONE
);

内容与元数据处理
默认使用 Document.DEFAULT_CONTENT_FORMATTER 格式化内容，MetadataMode.NONE 忽略元数据。可通过完整构造函数自定义。

自定义批处理策略

若需完全自定义批处理逻辑，可通过实现 BatchingStrategy 接口：

@Configuration
public class EmbeddingConfig {
    @Bean
    public BatchingStrategy customBatchingStrategy() {
        return new CustomBatchingStrategy(); // 自定义实现
    }
}

此自定义策略将自动被 Spring AI 的 EmbeddingModel 实现使用。
注意事项

支持的向量存储：目前 SAP Hana 向量存储未配置批处理支持。
性能优化：合理设置 maxInputTokenCount 和 reservePercentage 可平衡吞吐量与稳定性。

VectorStore 实现

以下是 VectorStore 接口的可用实现：

Azure 向量搜索
Apache Cassandra
Chroma 向量存储
Elasticsearch 向量存储
GemFire 向量存储
MariaDB 向量存储
Milvus 向量存储
MongoDB Atlas
Neo4j 向量存储
OpenSearch 向量存储
Oracle 向量存储
PPostgreSQL/PGVector 向量存储。
Pinecone 向量存储
Qdrant 向量存储
Redis 向量存储
SAP HANA 向量存储
Typesense 向量存储
Weaviate 向量存储
SimpleVectorStore - 简单的持久化向量存储实现，适合教育用途。

未来版本可能会支持更多实现。
如果需要 Spring AI 支持您的向量数据库，可在 GitHub 提交问题（issue）或直接通过拉取请求（pull request）贡献实现代码。

示例用法

要计算向量数据库的嵌入（embeddings），需选择与所使用的高层级 AI 模型相匹配的嵌入模型。
例如，使用 OpenAI 的 ChatGPT 时，需选用 OpenAiEmbeddingModel 及名为 text-embedding-ada-002 的模型。
Spring Boot 的 OpenAI starter 会通过自动配置，在 Spring 应用上下文中提供一个 EmbeddingModel 实现，用于依赖注入。

数据加载到向量存储

将数据加载到向量存储的操作通常以批处理模式完成：

将数据加载到 Spring AI 的 Document 类中；
调用 save 方法存储。

示例代码：

@Autowired
VectorStore vectorStore;

void load(String sourceFile) {
    // 使用 JsonReader 加载 JSON 文件的指定字段（如 price、name 等）
    JsonReader jsonReader = new JsonReader(
        new FileSystemResource(sourceFile),
        "price", "name", "shortDescription", "description", "tags"
    );
    List<Document> documents = jsonReader.get();
    // 调用 VectorStore.add() 存储文档
    this.vectorStore.add(documents); // [[4]]
}

过程说明：

JsonReader 将 JSON 文件拆分为小块（如按字段分割），并封装为 Document 对象；
VectorStore 实现会自动计算嵌入（通过 EmbeddingModel），并将 JSON 内容与嵌入向量一并存储到数据库中。

相似性搜索与上下文注入

当用户提问传入 AI 模型时，流程如下：

执行相似性搜索：

String question = <用户问题>;
List<Document> similarDocuments = store.similaritySearch(question);

参数调优：
- topK：指定返回的相似文档数量（如默认 4 个）；
- similarityThreshold：设置相似度阈值（范围 0-1，值越大匹配越严格）。
上下文注入：
检索到的相似文档会被“填充”到 AI 模型的输入提示（prompt）中，作为用户问题的上下文。

关键技术点

批处理策略：若文档量较大，需通过 TokenCountBatchingStrategy 分批处理，避免超出嵌入模型的上下文窗口限制（如 OpenAI 的 8191 令牌上限）。
元数据过滤：可通过 Filter.Expression 对元数据进行筛选（如 country == ‘UK’）。

元数据过滤器

本节描述可用于对查询结果进行过滤的多种方式。

过滤字符串（Filter String）

您可以通过 similaritySearch 方法的重载形式，传入类似 SQL 语法的字符串表达式作为过滤条件。
示例：

"country == 'BG'"                // 等值过滤
"genre == 'drama' && year >= 2020" // 组合条件
"genre in ['comedy', 'documentary', 'drama']" // 枚举过滤

Filter.Expression 构建器

您可以通过 FilterExpressionBuilder 创建 Filter.Expression 实例，以构建链式 API 表达式。
基础示例：

FilterExpressionBuilder b = new FilterExpressionBuilder();
Expression expression = b.eq("country", "BG").build(); // 等于条件

支持的操作符：

比较操作符：
EQUALS（==）、GT（>）、GE（>=）、LT（<）、LE（<=）、NE（!=）
组合操作符：
AND（&& 或 and）、OR（|| 或 or）
集合操作符：
IN（包含）、NIN（不包含）、NOT（取反）

复杂表达式示例：

// 组合条件：genre 为 'drama' 且年份 ≥ 2020
Expression exp = b.and(b.eq("genre", "drama"), b.gte("year", 2020)).build();

技术细节

预过滤优化：部分向量数据库（如 LanceDB）会在向量搜索前应用元数据过滤，以缩小检索范围并降低延迟。
嵌入模型兼容性：过滤条件仅作用于文档元数据，不影响嵌入向量的计算。

从向量存储中删除文档

向量存储接口（VectorStore）提供了多种删除文档的方法，支持通过文档ID列表或过滤表达式删除数据。

按文档ID删除

最简单的删除方式是提供文档ID列表：

void delete(List<String> idList);

此方法会删除所有ID与列表匹配的文档。若列表中存在不存在的ID，将被忽略。
示例代码：

// 创建并添加文档
Document document = new Document("The World is Big",
    Map.of("country", "Netherlands")); // 元数据包含国家信息
vectorStore.add(List.of(document));

// 按ID删除文档
vectorStore.delete(List.of(document.getId()));

按过滤表达式删除

对于复杂删除条件，可使用 Filter.Expression 对象定义删除规则：

void delete(Filter.Expression filterExpression);

此方法适用于基于元数据属性删除文档，例如按国家、年份等条件过滤。
示例代码：

// 创建不同元数据的测试文档
Document bgDocument = new Document("The World is Big",
    Map.of("country", "Bulgaria")); // 保加利亚文档
Document nlDocument = new Document("The World is Big",
    Map.of("country", "Netherlands")); // 荷兰文档

// 添加文档到存储
vectorStore.add(List.of(bgDocument, nlDocument));

// 使用过滤表达式删除保加利亚文档
Filter.Expression filterExpression = new Filter.Expression(
    Filter.ExpressionType.EQ, // 等值操作符
    new Filter.Key("country"), // 元数据键
    new Filter.Value("Bulgaria") // 目标值
);
vectorStore.delete(filterExpression); // [[5]][[8]]

// 验证删除结果
SearchRequest request = SearchRequest.builder()
    .query("World")
    .filterExpression("country == 'Bulgaria'") // 过滤条件
    .build();
List<Document> results = vectorStore.similaritySearch(request);
// 结果为空，因Bulgaria文档已被删除

按字符串过滤表达式删除

为简化操作，支持直接传递字符串形式的过滤表达式：

void delete(String filterExpression);

此方法内部将字符串解析为 Filter.Expression 对象，适用于动态生成的过滤条件。
示例代码：

// 添加文档
vectorStore.add(List.of(bgDocument, nlDocument));

// 使用字符串过滤表达式删除保加利亚文档
vectorStore.delete("country == 'Bulgaria'"); // [[8]]

// 验证剩余文档
SearchRequest request = SearchRequest.builder()
    .query("World")
    .topK(5)
    .build();
List<Document> results = vectorStore.similaritySearch(request);
// 仅返回荷兰文档

删除操作的错误处理

所有删除方法可能因错误抛出异常，建议使用 try-catch 块包裹操作：

try {
    vectorStore.delete("country == 'Bulgaria'");
} catch (Exception e) {
    logger.error("无效的过滤表达式", e); // [[7]]
}

文档版本控制场景

典型用例是管理文档版本，例如替换旧版本文档：
实现步骤：

添加初始版本：

Document documentV1 = new Document(
    "AI与机器学习最佳实践",
    Map.of(
        "docId", "AIML-001",
        "version", "1.0",
        "lastUpdated", "2024-01-01"
    )
);
vectorStore.add(List.of(documentV1));

删除旧版本并添加新版本：

// 使用过滤表达式删除旧版本
Filter.Expression deleteOldVersion = new Filter.Expression(
    Filter.ExpressionType.AND,
    Arrays.asList(
        new Filter.Expression(Filter.ExpressionType.EQ, "docId", "AIML-001"),
        new Filter.Expression(Filter.ExpressionType.EQ, "version", "1.0")
    )
);
vectorStore.delete(deleteOldVersion); // [[5]][[8]]

// 添加新版本文档
Document documentV2 = new Document(
    "AI与机器学习最佳实践 - 更新版",
    Map.of(
        "docId", "AIML-001",
        "version", "2.0",
        "lastUpdated", "2024-02-01"
    )
);
vectorStore.add(List.of(documentV2));

// 验证仅保留新版本
SearchRequest request = SearchRequest.builder()
    .query("AI与机器学习")
    .filterExpression("docId == 'AIML-001'")
    .build();
List<Document> results = vectorStore.similaritySearch(request);
// results 仅包含版本2.0的文档

性能优化建议

按ID删除：若已知具体ID列表，此方式速度更快。
过滤表达式删除：需扫描索引匹配文档，性能依赖具体向量存储实现。
批量删除：避免单次删除大量文档，建议分批处理。

SpringMVC执行流程（原理），通俗易懂国服冰 SpringMVC spring mvc
SpringMVC执行流程（原理），通俗易懂一、图解SpringMVC流程二、进一步理解Springmvc的执行流程1、导入依赖2、建立展示的视图3、web.xml4、spring配置文件springmvc-servlet5、Controller6、tomcat配置7、访问的url8、视图页面一、图解SpringMVC流程图为SpringMVC的一个较完整的流程图，实线表示SpringMVC框架提
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
2018-09-27 aop相关蒋超_58dc
1.静态织入，需要使用aspectj专用的compilermaven工程可以采用：https://www.mojohaus.org/aspectj-maven-plugin/2.动态织入，配合spring，创建代理来执行3.
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
[spring6: Mvc-网关]-源码解析
推荐阅读：[spring6:Mvc-函数式编程]-源码解析GatewayServerMvcAutoConfiguration@AutoConfiguration(after={HttpClientAutoConfiguration.class,RestTemplateAutoConfiguration.class,RestClientAutoConfiguration.class,FilterAu
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多