地瓜伯伯

深入理解Elasticsearch的索引映射(mapping)

当我们谈论Elasticsearch时，索引映射是一个核心概念，它定义了如何存储和检索数据。在Elasticsearch 7.6及更高版本中，映射提供了一系列强大的功能，使您能够精确地控制数据的结构和行为。本文将详细介绍映射的关键属性、用途以及如何正确设置和优化它。

一、映射基础

在Elasticsearch中，映射类似于关系型数据库中的表结构定义。它描述了索引中字段的类型、如何索引这些字段以及如何处理这些字段的查询。每个索引都有一个与之关联的映射类型，尽管在Elasticsearch 7.x中，每个索引只能有一个映射类型（与之前版本中的多个映射类型不同）。

映射定义包括字段的数据类型（如text、keyword、integer、date等），这些类型决定了字段如何被索引和搜索。此外，映射还可以包含其他设置，如字段是否应存储原始值、是否应创建doc values以便于排序和聚合等。

二、关键属性与用途

1. 字段类型：

选择合适的字段类型对于优化存储和查询性能至关重要。例如，对于全文搜索，应使用text类型；对于精确值搜索、排序和聚合，应使用keyword类型。
在Elasticsearch中，字段类型是映射定义的核心部分，它决定了字段如何被索引和如何在查询中被使用。以下是Elasticsearch中一些常见的字段类型及其用途的详细介绍：

1.1 text 类型：

用途：用于全文搜索，即当需要对字段内容进行分词、建立倒排索引，并执行相关度评分查询时，应使用text类型。
特点：text类型的字段在索引前会经过分析器（analyzer）处理，将其拆分成单独的词项（term），并建立倒排索引。这使得text字段可以高效地执行全文搜索查询。

1.2 keyword 类型：

用途：用于精确值搜索，如标签、邮箱地址、主机名、状态码、邮政编码或任何其他需要精确匹配的字段。
特点：keyword类型的字段不会被分析器处理，而是将整个字段值作为单个词项索引。因此，它们只能用于精确匹配查询，如term查询。此外，keyword字段通常用于排序、聚合和脚本计算。

1.3 数值类型：如`integer`、`long`、`float`、`double`等。

用途：用于存储数字数据，如价格、数量、评分等。
特点：数值类型的字段可以执行范围查询、排序和聚合操作。它们按原样存储，不会经过分析器处理。

1.4 date 类型：

用途：用于存储日期和时间数据。
特点：date类型的字段可以接受多种日期格式，并可以将其转换为内部格式（UTC毫秒时间戳）进行存储。这使得它们可以执行范围查询、排序和基于时间的聚合操作。

1.5 boolean 类型：

用途：用于存储布尔值（true/false）。
特点：boolean类型的字段可以接受true、false或缺失值。它们通常用于过滤查询，如term查询。

1.6 geo 类型：如`geo_point`、`geo_shape`等。

用途：用于存储地理位置数据，如经纬度坐标或复杂地理形状。
特点：geo类型的字段可以执行地理位置相关的查询，如距离计算、区域搜索等。它们通常与地图可视化工具结合使用。

1.7 nested 类型：

用途：用于存储嵌套结构的JSON对象数组。
特点：nested类型的字段允许您保持数组中对象的独立性，使得可以对嵌套对象执行精确查询和聚合操作。这对于处理具有复杂结构的JSON数据非常有用。

除了上述常见类型外，Elasticsearch还支持其他更专业的字段类型，如ip类型用于存储IP地址，join类型用于父子关系建模等。正确选择字段类型对于优化存储空间和查询性能至关重要。因此，在创建索引映射时，应根据数据的特性和查询需求仔细选择合适的字段类型。

2. 索引选项：

在Elasticsearch中，索引选项是映射定义中的一个重要部分，它决定了字段如何被索引以及索引的哪些属性应该被存储。这些选项可以帮助您优化存储空间和查询性能，同时提供灵活的搜索功能。

以下是Elasticsearch中一些常见的索引选项及其详细介绍：

2.1 index：

用途：此选项用于控制字段是否被索引。如果设置为true，则字段将被索引并可搜索。如果设置为false，则字段不会被索引，但仍然可以存储在_source字段中。
默认值：通常为true，但具体取决于字段类型和其他设置。

2.2 store：

用途：此选项确定是否应在索引中单独存储字段的原始值。如果设置为true，则可以在不检索整个_source字段的情况下检索该字段的值。这可以提高某些查询的性能，但会增加索引的存储需求。
默认值：通常为false，因为Elasticsearch默认存储整个文档的JSON源，并且可以通过_source字段检索任何字段。

2.3 doc_values：

用途：doc_values是一个在磁盘上以列式存储的字段值的副本，用于排序、聚合和脚本计算。对于需要频繁进行这些操作的字段，启用doc_values可以显著提高性能。
默认值：大多数字段类型默认启用doc_values，但某些类型（如text）默认不启用，因为它们通常不用于排序和聚合。

2.4 fielddata：

用途：fielddata是用于在内存中存储字段值的数据结构，主要用于对text字段进行排序和聚合。然而，由于text字段通常包含大量数据且分词后会产生很多词项，启用fielddata可能会导致大量内存消耗。因此，默认情况下禁用text字段的fielddata。
默认值：对于text字段，默认禁用fielddata。如果需要对这些字段进行排序或聚合，建议使用keyword类型的多字段或重新索引数据以使用适当的字段类型。

2.5 norms：

用途：norms存储了字段长度的归一化因子和索引时词项的权重，用于评分计算。禁用norms可以节省磁盘空间，但会导致无法执行基于词频和文档长度的相关性评分。
默认值：大多数字段类型默认启用norms，但对于不需要评分计算的字段（如用于过滤的字段），可以禁用以节省空间。

2.6 analyzer 和 search_analyzer：

用途：这些选项用于指定在索引和搜索时应用于字段的分析器。分析器负责将文本拆分为词项并转换为小写（可选），以便进行索引和搜索。analyzer用于索引和搜索，而search_analyzer仅用于搜索（如果未指定，则使用analyzer的设置）。
默认值：如果未指定，则使用默认的分析器（通常是标准分析器）。但是，对于不同类型的字段和数据，选择适当的分析器非常重要。

2.7 null_value：

用途：此选项允许您为字段指定一个默认值，当字段在文档中为null或缺失时，Elasticsearch将使用这个默认值。这对于在索引时处理空值非常有用，可以确保查询和聚合的一致性。
默认值：无默认值。您需要显式地为字段指定一个null_value。
注意事项：null_value必须是与字段类型相匹配的值。例如，对于keyword类型的字段，null_value可以是一个字符串；对于数值类型的字段，它必须是一个数字。

我们创建一个索引的映射，其中包含一个字段并使用null_value参数：

PUT /my_index
{
  "mappings": {
    "properties": {
      "user_age": {
        "type": "integer",
        "null_value": -1 // 当user_age字段的值为null或缺失时，将其设置为默认值-1
      }
    }
  }
}

接下来，我们可以通过向该索引添加文档来测试null_value的行为。我们将添加两个文档，一个包含user_age字段的值，另一个不包含该字段或将其设置为null：

// 添加一个包含user_age字段值的文档
POST /my_index/_doc/1
{
  "user_age": 30
}

// 添加一个不包含user_age字段或将其设置为null的文档
POST /my_index/_doc/2
{
  "user_age": null // 或者完全省略"user_age"字段也会触发null_value的使用
}

现在，如果我们执行一个查询来检索这两个文档，并查看user_age字段的值，我们将看到第一个文档中的user_age值为30，而第二个文档中的user_age值将被替换为我们在映射中指定的null_value，即-1。

下面是一个简单的查询示例：

GET /my_index/_search
{
  "query": {
    "match_all": {} // 匹配所有文档
  }
}

在查询结果中，你将看到类似于以下的输出（仅包含相关字段）：

{
  "hits": {
    "hits": [
      {
        "_id": "1",
        "_source": {
          "user_age": 30 // 第一个文档的user_age字段值为30
        }
      },
      {
        "_id": "2",
        "_source": {
          "user_age": -1 // 第二个文档的user_age字段被替换为null_value指定的默认值-1
        }
      }
    ]
  }
}

使用null_value需要谨慎。虽然它可以为缺失或null字段提供默认值，但它可能会引入歧义或误导性数据。确保你了解使用null_value的潜在影响，并根据你的业务需求和数据模型做出决策。在某些情况下，更好的做法是在应用程序层面处理null值，而不是依赖Elasticsearch的null_value功能。

2.8 format：

用途：主要用于日期字段，指定日期的格式。这告诉Elasticsearch如何解析和格式化日期字段的值。
默认值：无默认值，必须为日期字段显式指定格式，除非使用默认的日期格式。
注意事项：确保指定的格式与您的日期数据匹配，否则Elasticsearch可能无法正确解析日期。

2.9 ignore_above：

用途：对于keyword类型的字段，此选项指定了一个字符数限制。如果字段值的字符数超过此限制，则该字段不会被索引。这有助于防止非常大的字段值消耗过多的索引空间。
默认值：无默认值，需要显式设置。

2.10 eager_global_ordinals：

用途：此选项用于控制是否预先加载字段的全局序数（global ordinals）。全局序数用于加速聚合和排序操作。如果设置为true，则全局序数将在索引刷新时计算并加载到内存中。
默认值：通常为false，因为预先加载全局序数会增加索引的刷新时间和内存使用量。但在需要高频聚合的场景下，将其设置为true可能会提高性能。

2.11 meta：

用途：此选项允许您在字段定义中包含任意的元数据。这些元数据不会用于索引或搜索，但可以在检索字段信息时返回。这对于存储与字段相关的额外信息（如描述、标签等）非常有用。
默认值：无默认值。您可以根据需要添加任意数量和类型的元数据。

2.12 copy_to：

用途：此选项允许您将字段的内容复制到其他字段中。这在您希望在不更改查询逻辑的情况下对多个字段进行搜索时非常有用。例如，您可以将一个字段的内容复制到另一个用于全文搜索的字段中。
默认值：无默认值。您需要显式指定要复制到的字段名。

请注意，不是所有的索引选项都适用于所有字段类型。在选择和配置索引选项时，请务必参考Elasticsearch的官方文档以了解每个选项的适用性和限制。索引选项的设置应根据字段的具体用途和查询需求进行配置。不正确的设置可能会导致性能下降、存储空间浪费或无法满足搜索需求。因此，在创建或更新索引映射时，请仔细考虑每个字段的索引选项。

以下是一个mapping示例：

PUT /test_index
{
  "settings": {
    "index": {
      "number_of_shards": 1,
      "number_of_replicas": 1
    },
    "analysis": {
      "analyzer": {
        "my_custom_analyzer": { // 自定义分析器，用于索引时处理文本
          "type": "standard",
          "stopwords": ["and", "the"] // 停用词列表
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "title": {
        "type": "text", // 文本字段类型
        "analyzer": "my_custom_analyzer", // 使用自定义分析器进行索引
        "search_analyzer": "standard", // 使用标准分析器进行搜索
        "fields": {
          "keyword": {
            "type": "keyword" // 子字段，用于精确匹配
          }
        }
      },
      "content": {
        "type": "text", // 文本字段类型
        "fielddata": true, // 启用fielddata以支持排序和聚合（注意：这可能会消耗大量内存）
        "fields": {
          "raw": {
            "type": "keyword" // 子字段，用于精确匹配原始内容
          }
        }
      },
      "date_published": {
        "type": "date", // 日期字段类型
        "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis" // 支持的日期格式列表
      },
      "is_published": {
        "type": "boolean" // 布尔字段类型
      },
      "price": {
        "type": "float" // 浮点数字段类型
      },
      "stock_count": {
        "type": "integer", // 整数字段类型
        "doc_values": false, // 禁用doc_values以减少磁盘使用（注意：这可能会影响性能）
        "ignore_above": 1000 // 忽略大于1000的值
      },
      "product_tags": {
        "type": "keyword", // 关键字字段类型
        "norms": false, // 禁用norms以减少磁盘使用（注意：这可能会影响相关性评分）
        "eager_global_ordinals": true // 启用以加速聚合和排序操作（注意：可能会增加内存消耗）
      },
      "description": {
        "type": "text", // 文本字段类型
        "index": false, // 设置为不可索引
        "store": true // 存储原始值（注意：这会增加存储需求）
      },
      "meta_data": {
        "type": "object", // 对象字段类型（可以包含任意JSON对象）
        "enabled": false // 禁用该字段（注意：这意味着它不会被索引或搜索）
      },
      "all_fields": {
        "type": "text", // 文本字段类型（用于将所有内容复制到一个字段中）
        "copy_to": ["title", "content"] // 将内容复制到title和content字段中（注意：这会增加索引大小）
      }
    }
  }
}

请注意，在注释中提到了某些选项可能带来的性能或存储影响。在实际应用中，您应该根据您的具体需求和资源限制来仔细选择这些选项。此外，随着Elasticsearch版本的变化，某些选项的行为和默认值可能会发生变化，因此请务必查阅与您正在使用的Elasticsearch版本相对应的官方文档。

3. 多字段：

多字段（Multi-fields）是一种允许您在同一个字段上定义多种不同索引和搜索方式的功能。通过为字段定义多个子字段，每个子字段可以有不同的映射类型和分析器设置，以满足不同的搜索和索引需求。例如，您可以将一个字段同时定义为text和keyword类型，以便同时支持全文搜索和精确匹配。

多字段在Elasticsearch的映射定义中非常灵活，并且可以用于多种场景。以下是多字段的一些常见用法和示例：

不同分析器：您可以为同一个文本字段定义多个子字段，并为每个子字段指定不同的分析器。例如，一个字段可以使用标准分析器进行全文搜索，而另一个子字段可以使用关键字分析器进行精确匹配。
不同数据类型：除了文本类型外，您还可以为数字、日期等类型的字段定义多字段。例如，一个日期字段可以有一个子字段用于日期范围搜索，而另一个子字段可以将其存储为字符串以支持更复杂的文本匹配。
多语言支持：如果您的应用程序需要支持多种语言，您可以为每种语言定义一个子字段，并为每个子字段指定适当的语言分析器。
自定义搜索逻辑：通过定义多个子字段，您可以实现更复杂的搜索逻辑。例如，您可以有一个子字段用于全文搜索，另一个子字段用于实现拼音搜索或前缀搜索。

请注意，多字段不会增加原始文档中的字段数量或更改其结构。它们只是在索引时根据映射定义生成额外的索引项，并在搜索时提供不同的搜索选项。因此，多字段是一种在不修改原始数据的情况下增强搜索功能的强大工具。

4. 元字段：

虽然Elasticsearch提供了一些特殊的元字段（如_source和_field_names），但在7.x版本中已弃用了_all字段。因此，如果需要跨多个字段进行搜索，请使用multi_match查询。

5. 动态映射：

当向Elasticsearch索引中插入未在映射中明确定义的字段时，动态映射会自动推断字段的类型。虽然这提供了灵活性，但在生产环境中建议谨慎使用，并考虑关闭此功能或为其配置严格的规则。

6. 分析器与Normalizer：

对于text类型的字段，分析器定义了如何将文本拆分为词项。Elasticsearch提供了许多内置的分析器，并支持自定义分析器以满足特定需求。Normalizer则主要用于keyword字段的文本转换，如小写化或去除重音符号等。

三、设置与优化建议

明确定义字段类型：避免使用动态映射带来的不确定性，明确指定每个字段的类型和索引选项。这将确保数据的准确性和一致性，并提高查询性能。
利用多字段进行灵活搜索：通过使用多字段功能，您可以为同一个数据字段创建不同类型的索引，以满足不同的搜索需求。例如，您可以同时支持全文搜索、精确匹配和排序/聚合操作。
合理配置分析器和Normalizer：根据您的数据和查询需求选择合适的分析器和Normalizer。这将确保文本被正确地处理和索引，从而提高搜索准确性和性能。
监控和调整索引性能：定期使用Elasticsearch提供的监控工具检查索引的性能和资源使用情况。如果发现性能瓶颈或资源浪费，及时调整映射设置或优化查询语句。
测试与验证：在生产环境中应用映射更改之前，始终在测试环境中进行测试和验证。确保更改不会导致意外的行为或性能下降，并确保数据的完整性和准确性得到维护。

四、结论

通过深入了解Elasticsearch 7.6+的索引映射功能，您可以更好地控制数据的存储和检索方式。正确设置和优化映射将有助于提高查询性能、减少资源消耗并确保数据的准确性和一致性。随着Elasticsearch的不断发展和改进，掌握这些映射技巧将使您能够充分利用这个强大搜索引擎的潜力。

你可能感兴趣的:(DB,elasticsearch,java)

移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
微信公众号回调java_处理微信公众号消息回调 weixin_39607620 微信公众号回调java
1、背景在上一节中，咱们知道如何接入微信公众号，可是以后公众号会与咱们进行交互，那么微信公众号如何通知到咱们本身的服务器呢？咱们知道咱们接入的时候提供的url是GET/mp/entry，那么公众号以后产生的事件将会以POST/mp/entry发送到咱们本身的服务器上。html2、代码实现，此处仍是使用weixin-java-mp这个框架实现一、引入weixin-java-mpcom.github.
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Java8 Stream流的sorted()的排序【正序、倒序、多字段排序】 Tony666688888 java windows 开发语言
针对集合排序，java8可以用Stream流的sorted()进行排序。示例Bean以下我们会使用这个Bean来做示例。publicclassOrder{privateStringweight;privateDoubleprice;privateStringdateStr;//忽略getter、setter、构造方法、toString}字段排序首先是比较器Comparator，形式如下：Compa
用代码生成艺术字：设计个性化海报的秘密
本文围绕“用代码生成艺术字：设计个性化海报的秘密”展开，先概述代码生成艺术字在海报设计中的独特价值，接着介绍常用的代码工具（如HTML、CSS、JavaScript等），详细阐述从构思到实现的完整流程，包括字体样式设计、动态效果添加等，还分享了提升艺术字质感的技巧及实际案例。最后总结代码生成艺术字的优势，为设计师提供打造个性化海报的实用指南，助力提升海报设计的独特性与吸引力，符合搜索引擎SEO标准
java实习生40多天有感别拿爱情当饭吃
从5月15日开始，我开始第一步步入社会，我今年大三，在一家上市互联网公司做一名实习生，主要做java后端开发。开始的时候，觉得公司的环境挺不错的，不过因为公司在CBD，所以隔壁的午饭和晚饭都要20+RMB，而且还吃不饱，这让我感觉挺郁闷的。一到下午，我就会犯困（因为饿）。因此，我又不得不买一些干粮在公司屯着。关于技术，有一个比较大的项目在需求调研当中，我们做实习生，就是辅助项目经理，测试功能，并且
大学生入门：初识方法及其易踩坑的点
在java学习过程中，我们不难发现有很多重复使用的功能代码块，每次使用如果都要重新写一遍，岂不是很麻烦，就算是“cv”大法，感觉也不是很方便，那么，有什么办法可以解决这个问题呢？方法！java中，一段可重用的，用于执行特定功能的代码块叫做方法，它可以接收参数、返回结果，并且可以被多次使用。一、方法的基本结构[修饰符]返回值类型方法名([参数列表])[throws异常类型]{//方法体}[throw
[Ljava.lang.Object; cannot be cast to [Ljava.lang.String; 这些不会的
解释：这个错误是很常见的错误，错误的提示已经很清楚了就是java的Object数组不能转换成为String[]数组，这就说明你要转换的数组它本身是Object类型的数组，但是你却非要把它转换为String类的数组，这当然是错误的。示例：[java]viewplaincopypackagecom.dada;importjava.util.ArrayList;importjava.util.List;
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
安装器处点击“打开” 钦_79f7
问题描述：安装系统SD卡里面的apk或者原有的程序更新版本或者通过ADB安装apk的时候，会遇到升级安装成功之后的一个选择——“打开”和“完成”，点击完成没有问题，但是，如果点击了"打开"，然后按Home键，从应用程序列表里面选择应用程序图标进入或者点击桌面启动图标，这个时候就会重新启动了一个应用程序，之后的操作就会出现混乱等问题。原因分析：参考底部相关资料链接解决方案：在launcherActi
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
【免费下载】 Aspose for Java：解锁无水印、无限制的文档处理能力房征劲Kendall
AsposeforJava：解锁无水印、无限制的文档处理能力【下载地址】AsposeforJava-去除水印和数量限制AsposeforJava-去除水印和数量限制Aspose是一个著名的文档处理库，专为Java应用程序设计，支持多种文档格式的操作，如Word、Excel、PDF等项目地址:https://gitcode.com/open-source-toolkit/56c82项目介绍在现代企业
微服务日志追踪，Skywalking接入TraceId功能 Victor刘微服务 skywalking java
文章目录一、借助skywalking追加traceIdlogbacklog4j2效果二、让skywalking显示日志内容版本差异logback配置文件log4j2配置文件一、借助skywalking追加traceId背景：在微服务或多副本中难以观察一个链路的日志，需要通过唯一traceId标识来查找，下面介绍Skywalking-traceId在Java中的配置方法。介绍两种java日志的配置方
【Java Web实战】从零到一打造企业级网上购书网站系统 | 完整开发实录（三）笙囧同学 java 前端状态模式
核心功能设计用户管理系统用户管理是整个系统的基础，我设计了完整的用户生命周期管理：用户注册流程验证失败验证通过验证失败验证通过用户名已存在用户名可用失败成功用户访问注册页面填写注册信息前端表单验证显示错误提示提交到后端后端数据验证返回错误信息用户名唯一性检查提示用户名重复密码加密处理保存用户信息保存成功?显示系统错误注册成功跳转登录页面登录认证机制深度解析我实现了一套企业级的多层次安全认证机制：认
Spring Boot 2整合Druid的两种方式玩代码 spring boot 后端 java Druid
一、自定义整合Druid（非Starter方式）适用于需要完全手动控制配置的场景添加依赖（pom.xml）com.alibabadruid1.2.8org.springframework.bootspring-boot-starter-jdbc创建配置类@ConfigurationpublicclassDruidConfig{@Bean@ConfigurationProperties(prefix
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl