TracyCoder123

ElasticSearch深入解析（八）：索引设置、索引别名、索引模板

一、索引的动态设置、静态设置

索引设置包含两部分核心内容：
- 静态设置(static index settings)，只允许在创建索引时或者针对已关闭的索引进行设置。
- 指动态设置(dynamic index settings)，可以借助更新设置(update settings)的方式进行动态更新，更新后立即生效。

1. 静态设置

静态设置实战场景举例如下：
设置主分片大小的参数是index.number_of_shards，只在创建索引时生效，不支持动态修改。

默认主分片大小为1，且每个索引的分片数量上限默认为1024。此限制是一个安全限制，可防止索引分片数过多导致集群不稳定。

如果在业务层面扩充节点后确实需要扩展主分片数，该怎么办？
答案：在非业务核心时间通过reindex操作迁移实现。

2. 动态设置

动态设置的实战场景举例如下：

设置副本数参数为index.number_of_replicas，可以动态修改：

PUT news_index/_settings
{
	"number_of_replicas":3
}

设置刷新频率参数为index.refresh_interval，可以动态修改：

PUT news_index/_settings
{
	"refresh_interval":"1s"
}

默认刷新频率参数值为1s，即每秒刷新一次。这1s决定了Elasticsearch是近实时的搜索引擎，而非准实时搜索引擎。如果业务层面对实时性的要求不高，可以考虑将该值调大。因为如果采用1s，则每秒都会生成一个新的分段（关于分段的概念可以参考最后一章），会影响写入性能。

max_result_window是Elasticsearch中的一个设置参数，用于控制搜索结果的最大窗口的大小：

默认情况下，max_result_window的值为10000，这意味着在分页搜索时最多可以返回10000条数据。如果每页可显示10条数据，那么最多可以翻到1000页。在某些情况下，可能需要处理比默认值更大的数据集。

在这种情况下，可以通过更新索引设置来动态修改max_result_window的值：

PUT news_index/_settings
{
	"max_result_window":50000
}

上述命令将max_result_window的值设置为50000。此时如果每页显示10条数据，则可以最多翻到5000页。

增大max_result_window的值可能会对Elasticsearch集群的性能产生影响，尤其是在处理大量数据时。因此，在根据实际需求调整此参数时，要权衡性能和查询范围之间的关系。如果需要遍历大量数据，则建议使用scroll API或search_after参数，以更高效地进行处理。

在 Elasticsearch 中，max_result_window参数（默认值为 10000）主要限制的是基于from + size的深度分页查询（即通过from指定偏移量，size指定每页大小）。这种查询方式在偏移量（from）较大时，会导致 Elasticsearch 在每个分片上生成大量中间结果并合并，消耗大量内存和 CPU，甚至引发 OOM（内存溢出）。
而 scroll API 和 search_after 这两种分页方式，设计上避免了max_result_window的直接限制。

二、索引别名

索引别名常见的使用场景：
- 当需要定期创建新索引（如日志按天 / 月分割），同时保持应用端无需感知索引名称变化时，通过别名指向 “当前有效索引”，实现无缝切换。
- 索引重建或结构升级：旧索引 users_v1 需升级到 users_v2（如新增字段、调整映射），先通过别名 users 指向 users_v1，应用正常访问，重建完成后，通过原子操作切换别名指向 users_v2，实现无感知迁移。

索引别名只是物理索引的软链接的名称而已，一个索引可以创建多个别名，一个别名也可以指向多个索引。

实战中，很多工程师在开发中后期才发现索引别名的妙处。正如前文所说，别名能进行高效的索引管理，能进行索引数据修改或更新操作并确保用户无感知。

示例场景：
线上索引 users_v1 需要新增一个分词器为 ik_max_word 的字段 address，但直接修改映射会导致集群分片重建，且旧数据无法应用新分词器（需重建索引）。
传统方案（无别名）的痛点：

重建新索引 users_v2 并迁移数据，需修改所有客户端代码/配置中的索引名，易遗漏导致线上故障；
切换期间需停机或双写，用户体验差。

别名实现无感知升级（步骤）：

创建新索引并绑定临时别名：

PUT /users_v2
{
  "mappings": {
    "properties": {
      "address": { "type": "text", "analyzer": "ik_max_word" }
    }
  }
}
POST /_aliases
{
  "actions": [
    { "add": { "index": "users_v2", "alias": "users_tmp" } }
  ]
}

开发/测试环境通过 users_tmp 验证新索引逻辑，不影响线上 users_v1。

生产环境双写验证：
- 应用端同时写入 users_v1 和 users_v2（通过别名解耦，代码无需硬编码索引名），
- 读取时通过别名 users 暂指向 users_v1，确保线上流量无影响。

原子切换别名指向：

POST /_aliases
{
  "actions": [
    { "remove": { "index": "users_v1", "alias": "users" } },
    { "add": { "index": "users_v2", "alias": "users" } }
    // 可同时删除旧索引（需确保数据迁移完成）
  ]
}

切换瞬间完成，客户端无感知，无需重启服务或修改配置。

核心价值：
风险隔离：通过临时别名 users_tmp 验证新索引，避免直接操作线上索引；
零停机迁移：利用别名的原子操作，实现“热切换”，用户请求始终路由到有效索引。

从别名检索：

在 Elasticsearch 中，检索时使用索引别名与使用真实索引名的操作完全一致，别名会被透明解析为实际指向的索引（单个或多个）。

# 简单查询
GET /my_alias/_search
{
  "query": { "match_all": {} }
}

# 带过滤的查询
GET /my_alias/_search
{
  "query": { "term": { "status": "active" } }
}

若别名指向多个索引（如 logs_2025_q1 指向 logs-2025-01、logs-2025-02、logs-2025-03），检索时会同时查询所有关联索引：

GET /logs_2025_q1/_search
{
  "query": { "range": { "timestamp": { "gte": "2025-01-01" } } }
}

等价于 GET /logs-2025-01,logs-2025-02,logs-2025-03/_search，但别名简化了索引列表的维护。

别名支持通配符模式（如 logs-*），检索时自动匹配所有符合模式的索引：

# 创建别名匹配2025年4月的所有日志索引
POST /_aliases
{
  "actions": [
    { "add": { "index": "logs-2025-04*", "alias": "april_logs" } }
  ]
}

# 检索时使用别名
GET /april_logs/_search
{ "query": { "term": { "service": "user-center" } } }

避免在 DSL 中硬编码索引模式（如 logs-2025-04*），通过别名统一管理匹配规则。

三、索引模板

两个常见的业务场景问题：
- 问题1：数据量非常大，需要进行索引生命周期管理，具体要按日期划分索引，且要求多个索引的Mapping一致，而每次手动创建或者脚本创建都很麻烦，怎么办？
- 问题2：实际业务中应用了多个索引，想让这些索引中相同名字的字段类型完全一致，以便实现跨索引检索，怎么办？

我们会发现传统方式不能解决多索引的快速定义和高效管理等问题。因此，索引模板应运而生。

1. 索引模板的定义

Elasticsearch 7.8及之后版本支持两种定义模板的方式，可简记为普通模板定义方式和组件模板新增/创建方式。

普通模板定义方式如下所示：

PUT _index_template/  # 模板名称（唯一）
{
  "index_patterns": ["logs-*", "metrics-*"],  # 匹配的索引名模式（支持通配符）
  "priority": 100,                            # 模板优先级（高优先级覆盖低优先级）
  "template": {                               # 新索引的配置内容
    "settings": {                             # 索引设置（分片、副本、刷新间隔等）
      "number_of_shards": 3,
      "number_of_replicas": 1,
      "refresh_interval": "30s"
    },
    "mappings": {                             # 字段映射（类型、分词器、动态模板等）
      "dynamic": "strict",                     # 严格模式（禁止自动添加未定义字段）
      "properties": {
        "@timestamp": { "type": "date" },      # 时间字段（必选，用于时序数据）
        "message": { 
          "type": "text", 
          "analyzer": "ik_max_word",            # 中文分词器（需提前安装）
          "fields": { "keyword": { "type": "keyword" } }  # 同时存储keyword子字段
        }
      }
    },
    "aliases": {                              # 为新索引自动绑定别名
      "current_logs": {}                       # 别名指向新索引（无额外配置）
    }
  },
  "composed_of": ["ilm_policy_template"]      # 组合其他组件模板（可选，8.x+ 支持）
}

而组件模板的核心在于将原有普通模板定义的mappings、settings等以组件的方式分隔，以便最小化更新模板。

组件模板定义方式如下所示：

由上可知，模板名称为mydata_template，包含两个核心组件——component_mapping_template、component_settings_template。component_mapping_template组件模板实现了映射的定义，component_settings_template实现了设置和别名的定义。

当业务层面需要更新映射时，只需要更新component_mapping_template组件模板即可，改动范围更小、操作更精细化。

2. 索引模板应用的常见问题

模板和索引在应用上的区别是什么？

索引针对的是单一索引，类似MySQL中的一个表。而模板针对一个或多个索引，或者说是针对具有相同表结构的一类索引。

如果想更新映射，那么可以通过更新模板来实现吗？

首先需要建立这样一个认知前提：一旦创建了映射，除几个特定的类型以外，其他类型都不支持更新，除非进行reindex操作。

所以，一旦创建了索引，对索引模板的更新将不会影响该索引。

更新模板仅适用于新创建的索引。更新为动态模板仅会影响索引中的新字段。

附

分段

在Elasticsearch（基于Lucene实现）中，“分段”（Segment）是底层存储和处理数据的基本单元，本质上是一个不可变的倒排索引文件。以下是具体解释：

分段的本质与作用

倒排索引载体：每个分段存储一组文档的倒排索引（关键词到文档的映射），是Lucene实现快速搜索的核心数据结构。
独立搜索单元：分段一旦生成就不可修改，可独立被搜索，多个分段的搜索结果会在查询时合并。
写入过程的中间产物：文档写入时不会直接写入磁盘上的主索引，而是先存入内存缓冲区，通过定期刷新（refresh）生成新分段。

分段与“近实时”机制的关系

默认1秒刷新（refresh_interval）：
Elasticsearch默认每1秒将内存缓冲区中的文档写入一个新分段（并开放搜索），这使得数据在写入后1秒内可见，实现“近实时”（Near Real-Time）。
- 若调大该值（如30s），则每30秒生成一个分段，数据可见延迟增加，但减少分段生成频率。
“准实时”与“近实时”的区别：
- 准实时：数据可见延迟较长（如分钟级），分段生成频率低。
- 近实时：通过高频刷新（1秒）缩短延迟，但代价是分段数量增加。

分段对写入性能的影响

频繁生成分段的代价：
每次refresh会：
1. 将内存数据写入分段文件（磁盘I/O）；
2. 生成新的分段元数据（如文件句柄、索引结构）；
3. 可能触发后续的分段合并（merge）操作（长期分段过多时，Elasticsearch会自动合并小分段为大分段，减少搜索时的开销）。
  这些操作在高写入负载下会消耗CPU、磁盘I/O和内存资源，降低写入吞吐量。
调大刷新间隔的优势：
减少分段生成频率，降低I/O和元数据管理开销，提升写入性能，适合对实时性要求不高的场景（如日志分析、离线报表）。

分段的生命周期

生成：通过refresh操作将内存数据写入新分段（默认1秒一次）。
存在：分段不可变，可被搜索，直到被合并或删除。
合并：Elasticsearch后台定期合并小分段为大分段，减少分段数量，提升搜索效率（合并过程会释放旧分段资源）。
删除：当文档被删除时，分段不会立即修改，而是记录“删除标记”，合并时才真正移除被删除的文档。

Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
elasticsearch启动时遇到的错误max virtual memory areas vm.max_map_count [65530\] is too low, increase to a... Hello小五
maxvirtualmemoryareasvm.max_map_count[65530]istoolow,increasetoatleast[262144]elasticsearch启动时遇到的错误问题翻译过来就是：elasticsearch用户拥有的内存权限太小，至少需要262144；在宿主机/etc/sysctl.conf文件最后添加一行vm.max_map_count=262144执行命令s
Hive详解
一：Hive的历史价值1，Hive是Hadoop上的KillerApplication，Hive是Hadoop上的数据仓库，Hive同时兼具有数据仓库中的存储引擎和查询引擎的作用；而SparkSQL是一个更加出色和高级的查询引擎，所以在现在企业级应用中SparkSQL+Hive成为了业界使用大数据最为高效和流行的趋势。2，Hive是Facebook的推出，主要是为了让不动Java代码编程的人员也能
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
Hive与Hudi集成：增量大数据处理方案 AI大数据智能洞察大数据与AI人工智能大数据AI应用 hive hadoop 数据仓库 ai
Hive与Hudi集成：增量大数据处理方案关键词：Hive、Hudi、增量大数据处理、数据集成、数据湖摘要：本文主要探讨了Hive与Hudi集成的增量大数据处理方案。我们将深入了解Hive和Hudi的核心概念，剖析它们之间的关系，详细阐述集成的算法原理与操作步骤，通过实际项目案例展示如何进行开发环境搭建、代码实现与解读。同时，会介绍该集成方案的实际应用场景、相关工具和资源，探讨未来发展趋势与挑战。
DevOps CI/CD流水线配置实战：GitHub Actions与Jenkins详细教程火烧屁屁lo devops ci/cd github
现代软件开发中，持续集成与持续交付（CI/CD）是DevOps核心实践。通过自动化构建、测试和部署流程，团队能够快速交付高质量软件。本文将深入探讨两种主流工具（GitHubActions和Jenkins）的配置方法，并提供完整代码示例。GitHubActions配置指南GitHubActions是GitHub原生的CI/CD工具，直接集成在代码仓库中。以下为典型工作流配置：创建基础工作流文件在项目
常见的Bug管理工具有哪些？（如JIRA、Bugzilla、禅道等）海姐软件测试缺陷管理 bug jira
一、主流Bug管理工具分类及特点1.商业/企业级工具JIRA（Atlassian）特点：高度可定制，支持敏捷开发，集成CI/CD（如Jenkins）、Confluence等。适用场景：中大型团队，需复杂工作流和扩展生态。费用：按用户数收费，提供云版和本地部署。MantisBT特点：开源但支持商业服务，轻量级，适合中小团队。亮点：支持邮件通知、自定义字段。部署：需自建服务器（PHP+MySQL）。T
获取三网实时访客---无忧获客大数据无牛_abc3
很多传统行业的公司与企业对于运营商大数据的理解还是很基础的，大多数都是在买资源程度的认识。一些敢于尝试运营商大数据获客的传统企业自然会受益颇多。运营商大数据所提供的获客服务也非常简单，就是将自身的用户数据资源、针对不同的企业去制定有个性化需求的获客标准，运营商大数据根据不同的企业，和行业去进行精准客户的部署和分配，让相关合作的企业通过运营商提供的CRM平台进行一个有效的触达。运营商大数据已经在全国
elasticsearch vm.max_map_count small瓜瓜
maxvirtualmemoryareasvm.max_map_count[65530]istoolow,increasetoatleast[262144]elasticsearch启动时遇到的错误问题翻译过来就是：elasticsearch用户拥有的内存权限太小，至少需要262144解决：切换到root用户执行命令：sysctl-wvm.max_map_count=262144查看结果：sysc
DeepSeek在大数据领域正掀起一场深刻的变革智海观潮 AI 大数据 deepseek AI
随着人工智能技术的飞速发展，DeepSeek作为一款行业领先的开源大模型，正在大数据领域掀起一场深刻的变革。其强大的数据处理和分析能力，为各行业带来了新的机遇和变革，推动数据与业务的深度融合。以下是DeepSeek在大数据领域的一些典型的潜在应用：1.加速数据处理与分析流程在传统的大数据应用中，数据收集、预处理和分析往往是一个繁琐且耗时的工程。DeepSeek凭借其高效的算法和强大的计算能力，极大
IoTDB智能分析节点AINode：时序数据分析的新引擎时序数据说 iotdb 数据分析数据挖掘时序数据库数据库大数据 ai
在大数据与物联网的驱动下，时序数据处理需求激增，如何高效存储、管理并实时分析海量时序数据成为技术挑战。作为专为时序数据设计的数据库，IoTDB通过引入智能分析节点（AINode），将机器学习能力原生集成到数据库中，实现了“数据存储-分析-决策”的一体化闭环。本文将深入解析AINode的核心功能、技术优势及实际应用场景。AINode：IoTDB的智能分析引擎AINode是IoTDB推出的第三种内生节
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
《剑指offer》-算法篇-排序小新学习屋数据结构与算法算法 leetcode 职场和发展数据结构与算法
题目最小的K个数数组中的逆序对代码实现最小的K个数题目描述：输入n个整数，找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字，则最小的4个数字是1,2,3,4,。思路：按照各种排序算法，找到排序结果的前K个数。思路1：最简单的方案，对数组进行排序，取最小的k个思路2：借鉴快速排序的思想，找partition的基准点povit，比较povit和k值的大小思路3:大数据处理的思想，
ZooKeeper在Hadoop中的协同应用：从NameNode选主到分布式锁实现码字的字节 hadoop布道师分布式 zookeeper hadoop 分布式锁
Hadoop与ZooKeeper概述Hadoop与ZooKeeper在大数据生态系统中的核心位置和交互关系Hadoop的架构与核心组件作为大数据处理的基石，Hadoop生态系统由多个关键组件构成。其核心架构主要包含HDFS（HadoopDistributedFileSystem）和YARN（YetAnotherResourceNegotiator）两大模块。HDFS采用主从架构设计，由NameNo
优查查PROB版本使用介绍，优查查官网查询入口无忧达人
优查查最新版本PROB版本上线，优查查PROB版本的查询报告更全面，同时价格还是以前的价格，优查查大数据信用查询一次的价格是30，当然这个价格只限本文介绍的渠道，渠道我会放在文末，大家自行获取即可。优查查使用起来非常的流程，可以快速查询出来我们自身有没有信用稳定，优查查官网查询入口，每个人都可以使用优查查一键查询自己的信用，只能查询自己的信用，别人的信用是查询不了的。优查查使用入口放在文末了，划到
Elasticsearch创建快照与快照恢复写bug的羊羊 elasticsearch elasticsearch 大数据
使用了kibana进行请求发送1.旧es创建快照1.查看elasticsearch.yml配置的仓库路径，没有添加上,重启espath.repo:["E:/develop/elasticsearch-7.9.3/backups"]2.注册仓库，如仓库名backup1PUT/_snapshot/backup1{"type":"fs","settings":{"location":"backup1"}
贝融助手要交68块钱查询是合理吗？其实是很多人搞错查询渠道了无忧达人
我们都知道查询信用的平台都是需要收费，具体的收费每个平台都是不一样的，目前行业中收费基本上都是在30-100，其中大平台的收费会低一些，因为体量大可以降低自身的营业成本，这个原理和其它行业一样。贝融助手查询大数据信用收费是30（本文介绍的渠道），这个价格得益于贝融助手平台的体量，已经把价格做的非常低了，像信用行业大平台的价格基本上都是趋于行业的平均值，太高了太低了都不是正常值。贝融助手查询入口放在
深度评测：拼多多官方返利APP vs 其他返利平台，谁更胜一筹？日常购物技巧呀
购物新宠儿！拼多多官方返利APP，引领智能返利新时代。随着科技的不断发展智能化已经成为了各个领域的发展趋势。在返利领域也不例外拼多多官方返利app凭借其强大的智能技术和创新能力正引领着智能返利新时代。这款app通过大数据分析用户行为习惯精准推送符合用户需求的商品和优惠信息。让你在享受智能化服务的同时也能获得更加精准的返利回报。在繁多的返利app中，高省app凭借其独特的优势脱颖而出，成为众多用户的
链表也能整容？聊聊‘重排链表’的那些小技巧与深层逻辑 Echo_Wish LeetCode极客营链表数据结构
“链表也能整容？聊聊‘重排链表’的那些小技巧与深层逻辑”今天我们不聊大数据，不聊AI，咱回归算法的“原点”——链表。别看它简单，里面的很多技巧在面试、在工程开发里都能救你一命。今天我就带你聊聊重排链表（ReorderList），以及它背后的思路和一些值得深挖的细节。1.先说说“重排链表”到底是啥？简单来说：给你一个单链表，比如：1->2->3->4->5要求你把它重新排列成：1->5->2->4-
朋友圈点赞也能造假？社交媒体数据欺诈识别的那些事
“朋友圈点赞也能造假？社交媒体数据欺诈识别的那些事”咱们先聊个现实点的：你刷朋友圈、微博、抖音的时候，有没有发现一些账号的点赞数、评论数特别整齐划一？要么都是那种无意义的“支持”“666”，要么一夜之间视频播放量暴涨，看着就不太对劲。其实，这背后很可能就是数据欺诈，而且这种现象在社交媒体上特别常见。作为一个做大数据分析的人，我最直观的感受就是：社交媒体上的数据从来不是完全干净的，里面水分多得很。如
常见的未授权访问如：Redis,MongoDb,Memcached,Jenkins,Jupyter NoteBook,Elasticsearch,Kibana等二十四个靶场复现终焉暴龙王安全网络 web安全
前言这这篇文章中我会记录24种常见的未授权访问漏洞的靶场复现，如果有错误，欢迎大家指正。在本文中，漏洞复现的靶场完全是靠自己搭建的vulhub-master以及一系列的靶场以及fofa搜索，如果之前没有用过vulhub-master靶场，请先搭建好vulhub-master靶场并且安装docker和docker-compose。另外，其中一些涉及到敏感信息的漏洞复现我就不截图了，大家切记要树立好法
Go-Elasticsearch v9 从入门到进阶 REST API 与 Typed API 双剑合璧 Hello.Reader golang 检索搜索引擎 golang elasticsearch jenkins
1、环境要求与安装项目说明Go版本1.21及以上（推荐使用近期版本1.23+）安装命令bash\ngogetgithub.com/elastic/go-elasticsearch/v9@latest\n版本对齐客户端主版本需与集群主版本一致（例如v9对ES9.x）2、快速连接Elasticsearch2.1低级API（本地9200端口）es,err:=elasticsearch.NewDefaul
好用的酒店预订软件有哪些？酒店预订哪个软件便宜好项目高省
哪个酒店预订App更省钱？想要预订酒店却担心价格过高？试试这些超值的酒店预订App吧！【美团】：专注于三四线城市，性价比超高！经济型酒店最受欢迎，但用户忠诚度稍低。【飞猪】：阿里旗下平台，依托强大系统和大数据。受年轻人喜爱，但产品同质化较突出，需注意商家管控和用户纠纷解决。要领取优惠券，我们需要使用APP或者登录官方网站。在进入APP后，我们可以通过以下几种途径来获取内部优惠券。一、直返直返的口号
Go-Elasticsearch v9 安装与版本兼容性 Hello.Reader 搜索引擎检索 golang golang elasticsearch jenkins
1、安装方式速查场景命令/代码片段说明最快体验bash\n#建议直接拉取最新版\ngogetgithub.com/elastic/go-elasticsearch/v9@latest\n在现有项目中立刻添加依赖显式锁定版本go\nrequiregithub.com/elastic/go-elasticsearch/v9v9.0.0\n在go.mod中写死具体版本，便于团队一致性源码克隆bash\n
大数据量查询计算引发数据库CPU告警问题复盘懒虫虫~ 业务解决方案大表治理
大数据量查询计算引发数据库CPU告警问题复盘一、背景二、根因分析三、解决方案方案1：多线程+缓存方案2：利用中间表+缓存四、总结一、背景2025年7月份某天，CDP系统每天不定时推送我们的Portal服务，生产环境运营看板会展示统计数据，发现接口响应缓慢，随之而来数据库监控告警，发现数据库CPU达到了80%。由于表数据量大，计算统计复杂，多线程使用不当，导致数据库服务器爆表。其中A表数据量达到1亿
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本