他叫阿来

Elasticsearch查询

文章目录

- 概要
- 一、Query DSL
- - 1.1 查询所有(match_all query)
  - 1.2 全文检索(full-text query)
  - 1.3 短语搜索(match phrase query)
  - 1.4 query string查询
  - 1.5 多字段匹配搜索(multi match query)
- 二、词条级搜索
- - 2.1 词条搜索(term query)
  - 2.2 词条集合搜索(terms query)
  - 2.3 范围查询(range query)
  - 2.4 不为空查询(exists query)
  - 2.5 词项前缀搜索(prefix query)
  - 2.6 通配符搜索(wildcard query)
  - 2.7 正则匹配(regexp query)
- 三、复合搜索(compound query)
- - 3.1 constant_score query
  - 3.2 布尔搜索(bool query)
- 四、排序
- 五、分页
- 六、高亮
- 七、批量操作

概要

一、Query DSL

Elasticsearch提供了基于JSON的完整查询DSL（Domain Specific Language 特定域的语言）来定义查询。将查询DSL视为查询的AST（抽象语法树），它由两种子句组成：

叶子查询子句：在特定域中寻找特定的值，如match，term或range查询；
复合子查询：
复合子查询子句包装其他叶子查询或复合查询，并用于以逻辑方式组合多个查询（例如：bool，dis_max查询），或更改其行为（例如：constant_score查询）。

基本语法：

POST /索引名/_search
{
	"query":{
		"查询类型":{
			"查询条件":"查询条件值"
		}	
	}
}

这里的query代表一个查询对象，里面可以有不同的查询属性

查询类型：
- match_all、match、term、range等
查询条件
查询条件会根据查询类型的不同，写法有差异

1.1 查询所有(match_all query)

示例：

POST /activity-index/_search
{
  "query": {
    "match_all": {}
  }
}

关于返回值说明：

took:查询花费的时间，单位时毫秒
time_out:是否超时
_shards:分片信息
hits:搜索结果
- total:搜索总条数
- max_score:所有结果中文档得分的最高分
- hits:搜索结果的文档对象数组，每个元素是一条搜索到的文档信息
  - _index:索引库
  - _type:文档类型
  - _id:文档id
  - _score:文档得分
  - _source:文档的源数据

1.2 全文检索(full-text query)

全文搜索能够搜索已分析的文本字段，如商品描述,，活动规则等。使用索引期间应用于字段的同一分析器处理查询字符串。全文搜索的分类很多几个典型的如下:

匹配搜索

全文查询的标准查询，它可以对一个字段进行模糊、短语查询。 match queries 接收text/numerics/dates, 对它们进行分词分析, 再组织成一个boolean查询。可通过operator 指定bool组合操作（or、and 默认是 or ）。
数据准备：
索引activity-index中有如下数据：

{
 	"hits" : [
      {
        "_index" : "activity-index",
        "_type" : "_doc",
        "_id" : "fDvaAo0BXPpqwihTV9Sk",
        "_score" : 1.0,
        "_source" : {
          "activityCode" : "111",
          "activityName" : "限时抢购活动001",
          "activityType" : "flash",
          "businessType" : "满减"
        }
      },
      {
        "_index" : "activity-index",
        "_type" : "_doc",
        "_id" : "fjvcAo0BXPpqwihT0tTk",
        "_score" : 1.0,
        "_source" : {
          "activityCode" : "222",
          "activityName" : "限时抢购活动002",
          "activityType" : "flash",
          "businessType" : "满赠"
        }
      },
      {
        "_index" : "activity-index",
        "_type" : "_doc",
        "_id" : "fzvdAo0BXPpqwihTW9Rm",
        "_score" : 1.0,
        "_source" : {
          "activityCode" : "333",
          "activityName" : "商品返金币活动001",
          "activityType" : "goodback",
          "businessType" : "满减"
        }
      },
      {
        "_index" : "activity-index",
        "_type" : "_doc",
        "_id" : "gDvdAo0BXPpqwihTwtSe",
        "_score" : 1.0,
        "_source" : {
          "activityCode" : "444",
          "activityName" : "商品返金币活动002",
          "activityType" : "goodback",
          "businessType" : "满增"
        }
      }
    ]

or关系

match 类型查询，会把查询条件进行分词，然后进行查询,多个词条之间是or的关系

POST /activity-index/_search
{
  "query": {
    "match": {
      "activityName": "抢购活动"
    }
  }
}

上面的查询中不仅会查出限时抢购活动，也会查出商品返金币活动；多个词之间是or的关系；

and关系

某些情况下，我们需要更精确查找，我们希望这个关系变成 and ，可以这样做

POST /activity-index/_search
{
  "query": {
    "match": {
      "activityName": {
        "query": "抢购活动",
        "operator": "and"
      }
    }
  }
}

本例中，只要activityName中同时包含了抢购活动的词条才会被检索到。

1.3 短语搜索(match phrase query)

match_phrase 查询用来对一个字段进行短语查询，可以指定 analyzer、slop移动因子。

POST /activity-index/_search
{
  "query": {
    "match_phrase": {
      "activityName": "抢购活动"
    }
  }
}

POST /activity-index/_search
{
  "query": {
    "match_phrase": {
      "activityName": {
        "query": "活动"
      }
    }
  }
}

POST /activity-index/_search
{
  "query": {
    "match_phrase": {
      "activityName": {
        "query": "抢购活动",
        "slop": 2
      }
    }
  }
}

1.4 query string查询

Query String Query提供了无需指定某字段而对文档全文进行匹配查询的一个高级查询,同时可以指定在哪些字段上进行匹配。
基本语法

POST /索引名/_search
{
  "query": {
    "query_string": {
      "default_field": "FIELD",
      "query": "this AND that OR thus"
    }
  }
}

示例

POST /activity-index/_search
{
  "query": {
    "query_string": {
      "query": "1"
    }
  }
}
-- 指定字段
POST /activity-index/_search
{
  "query": {
    "query_string": {
      "query": "1",
      "default_field": "activityName"
    }
  }
}

-- 逻辑查询
POST /activity-index/_search
{
  "query": {
    "query_string": {
      "query": "减 or 限时"
    }
  }
}

-- 多字段
POST /activity-index/_search
{
  "query": {
    "query_string": {
      "fields": ["activityName","activityType"],
      "query": "限时"
    }
  }
}

1.5 多字段匹配搜索(multi match query)

如果需要在多个字段上进行文本搜索，可用multi_match 。multi_match在match的基础上支持对多个字段进行文本查询。

POST /activity-index/_search
{
  "query": {
    "multi_match": {
      "fields": ["activityName","activityType"],
      "query": "限时"
    }
  }
}

还可以使用*匹配多个字段

POST /activity-index/_search
{
  "query": {
    "multi_match": {
      "fields": ["activity*"],
      "query": "限时"
    }
  }
}

二、词条级搜索

可以使用term-level queries根据结构化数据中的精确值查找文档。结构化数据的值包括日期范围、IP地址、价格或产品ID。
与全文查询不同，term-level queries不分析搜索词。相反，词条与存储在字段级别中的术语完全匹配。

数据准备：

PUT /book
{
  "settings": {},
  "mappings": {
    "properties": {
      "description":{
        "type": "text",
        "analyzer": "ik_max_word"
      },
      "name":{
        "type": "text",
        "analyzer": "ik_max_word"
      },
      "price":{
        "type": "float"
      },
      "timestamp":{
        "type": "date",
        "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
      }
    }
  }
}

PUT /book/_doc/1
{
  "name": "lucene",
  "description": "Lucene Core is a Java library providing powerful indexing and search features, as well as spellchecking, hit highlighting and advanced analysis/tokenization capabilities. The PyLucene sub project provides Python bindings for Lucene Core. ",
  "price": 100.45,
  "timestamp": "2020-08-21 19:11:35"
}


PUT /book/_doc/2
{
  "name": "solr",
  "description": "Solr is highly scalable, providing fully fault tolerant distributed indexing, search and analytics. It exposes Lucenes features through easy to use JSON/HTTP interfaces or native clients for Java and other languages.",
  "price": 320.45,
  "timestamp": "2020-07-21 17:11:35"
}


PUT /book/_doc/3
{
  "name": "Hadoop",
  "description": "The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models.",
  "price": 620.45,
  "timestamp": "2020-08-22 19:18:35"
}
PUT /book/_doc/4
{
  "name": "ElasticSearch",
  "description": "Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力 的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java语言开发的，并作为Apache许可条 款下的开放源码发布，是一种流行的企业级搜索引擎。Elasticsearch用于云计算中，能够达到实时搜 索，稳定，可靠，快速，安装使用方便。官方客户端在Java、.NET（C#）、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示，Elasticsearch是最受欢 迎的企业搜索引擎，其次是Apache Solr，也是基于Lucene。",
  "price": 999.99,
  "timestamp": "2020-08-15 10:11:35"
}

2.1 词条搜索(term query)

term 查询用于查询指定字段包含某个词项的文档

POST /book/_search
{
  "query": {
    "term": {
      "name": {
        "value": "solr"
      }
    }
  }
}

2.2 词条集合搜索(terms query)

terms查询，用于查询指定字段包含某些词项的文档

POST /book/_search
{
  "query": {
    "terms": {
      "name": [
        "hadoop","solr"
      ]
    }
  }
}

2.3 范围查询(range query)

gte：大于等于
gt：大于
lte：小于等于
lt：小于
boost：查询权重

POST /book/_search
{
  "query": {
    "range": {
      "price": {
        "gte": 10,
        "lte": 200,
        "boost": 2.0
      }
    }
  }
}

POST book/_search
{
  "query": {
    "range": {
      "timestamp": {
        "gte": "18/08/2020",
        "lte": "2021",
        "format": "dd/MM/yyyy||yyyy"
      }
    }
  }
}

2.4 不为空查询(exists query)

查询指定字段值不为空的文档。相当 SQL 中的 column is not null

POST /book/_search
{
  "query": {
    "exists": {"field": "price"}
  }
}

2.5 词项前缀搜索(prefix query)


POST /book/_search
{
  "query": {
    "prefix": {
      "name": {
        "value": "so"
      }
    }
  }
}

2.6 通配符搜索(wildcard query)


POST /book/_search
{
  "query": {
   "wildcard": {
     "name": {
       "value": "lu*"
     }
   }
  }
}

2.7 正则匹配(regexp query)

regexp允许使用正则表达式进行term查询.注意regexp如果使用不正确，会给服务器带来很严重的性能压力。比如.*开头的查询，将会匹配所有的倒排索引中的关键字，这几乎相当于全表扫描，会很慢。因此如果可以的话，最好在使用正则前，加上匹配的前缀。

POST /book/_search
{
  "query": {
    "regexp": {
      "name": "s*"
    }
  }
}

三、复合搜索(compound query)

3.1 constant_score query

用来包装另一个查询，将查询匹配的文档的评分设为一个常值

POST /book/_search
{
  "query": {
    "term": {
      "description": {
        "value": "solr"
      }
    }
  }
}
POST /book/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "description": "solr"
        }
      },
      "boost": 1.2
    }
  }
}

3.2 布尔搜索(bool query)

bool 查询；bool操作来组合多个查询字句为一个查询。可用的关键字：

must：必须满足
filter：必须满足，但执行的是filter上下文，不参与、不影响评分
should：或
must_not：必须不满足，在filter上下文中执行，不参与、不影响评分

POST /book/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "description": "java"
          }
        }
      ],
      "filter": [
        {
          "term": {
            "name": "solr"
          }
        }
      ],
      "must_not": [
        {
          "range": {
            "price": {
              "gte": 200,
              "lte": 300
            }
          }
        }
      ]
    }
  }
}

四、排序

相关性评分排序

默认情况下，返回的结果是按照相关性进行排序的——最相关的文档排在最前

为了按照相关性来排序，需要将相关性表示为一个数值。在 Elasticsearch 中，相关性得分由一个浮点数进行表示，并在搜索结果中通过 _score 参数返回，默认排序是 _score 降序，按照相关性评分升序排序如下。

POST /book/_search
{
  "query": {
    "match": {
      "description": "solr"
    }
  }
}

POST /book/_search
{
  "query": {
    "match": {
      "description": "solr"
    }
  },
  "sort": [
    {
      "_score": {
        "order": "asc"
      }
    }
  ]
}

字段值排序

POST /book/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    }
  ]
}

多级排序
先按照价格排序，再按照相关性排序

POST /book/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      },
      "_score":{
        "order": "desc"
      }
    }
  ]
}

五、分页

POST /book/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    }
  ],
  "from": 2,
  "size": 2
}

六、高亮

POST /book/_search
{
  "query": {
    "match": {
      "name": "elasticsearch"
    }
  },
  "highlight": {
    "pre_tags": "",
    "post_tags": "",
    "fields": [{"name":{}},{"description":{}}]
  } 
}

在使用match查询的同时，加上一个highlight属性：

pre_tags：前置标签
post_tags：后置标签
fields：需要高亮的字段
name：这里声明name字段需要高亮，后面可以为这个字段设置特有配置，也可以空

七、批量操作

有时候为了减少网络开销，需要将多个命令一次发往服务端进行执行，这时候就需要用到批量操作

批量查询

mget

POST /_mget
{
  "docs": [
    {
      "_index": "book",
      "_id": 1
    },
    {
      "_index": "book",
      "_id": 2
    }
  ]
}

统一索引下批量查询

POST /book/_mget
{
  "docs": [
    {
      "_id": 2
    },
    {
      "_id": 3
    }
  ]
}

POST /book/_search
{
  "query": {
    "ids": {
      "values": [1,4]
    }
  }
}

bulk批量增删改查

bulk操作将文档的增删改查一些列操作，通过一次请求全部做完，减少网络传输次数
语法：

POST /_bulk
{"action":{"metadata":{}}}
{"data"}

如下操作：删除1，新增5，修改2

POST /_bulk
{ "delete": { "_index": "book", "_id": "1" }}
{ "create": { "_index": "book", "_id": "5" }}
{ "name": "test14","price":100.99 }
{ "update": { "_index": "book", "_id": "2"} }
{ "doc" : {"name" : "test"} }

功能：

delete：删除一个文档，只要1个json串就可以了删除的批量操作不需要请求体
create：相当于强制创建 PUT /index/type/id/_create
index：普通的put操作，可以是创建文档，也可以是全量替换文档
update：执行的是局部更新partial update操作

格式：每个json不能换行。相邻json必须换行。
隔离：每个操作互不影响。操作失败的行会返回其失败信息

实际用法：
bulk请求一次不要太大，否则一下积压到内存中，性能会下降。所以，一次请求几千个操作、大小在几M正好。
bulk会将要处理的数据载入内存中，所以数据量是有限的，最佳的数据量不确定，它取决于你的硬件、文档大小以及复杂性，也跟索引以及搜索的负载有关。
一般建议是1000-5000个文档，大小建议是5-15MB，默认不能超过100M，可以在es的配置文件（ES的config下的elasticsearch.yml）中配置。
http.max_content_length: 10mb

ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
部署es集群 liushaojiax elasticsearch java 大数据
我们会在单机上利用docker容器运行多个es实例来模拟es集群。不过生产环境推荐大家每一台服务节点仅部署一个es的实例。部署es集群可以直接使用docker-compose来完成，但这要求你的Linux虚拟机至少有4G的内存空间创建es集群首先编写一个docker-compose文件，内容如下：version:'2.2'services:es01:image:elasticsearch:7.12
Elasticsearch8 - Docker安装Elasticsearch8.12.2 王谷雨_ ElasticSearch elasticsearch docker
前言最近在学习ES，所以需要在服务器上装一个单节点的ES服务器环境：centos7.9安装下载镜像目前最新版本是8.12.2dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.12.2创建配置新增配置文件elasticsearch.ymlhttp.host:0.0.0.0http.cors.enabled:truehttp.cors.
elasticsearch同步mysql数据库神器之go-mysql-elasticsearch 强哥的博客数据库
go-mysql-elasticsearch是国内作者开发的一款插件。测试表明：该插件优点：能实现同步增、删、改、查操作。不足之处（待完善的地方）：1、日志不是很详细，但是能满足基本需求；2、初始化时，无法自动同步mysql中存在的以前的数据，需要自行解决初始导入（如重建索引批量导入）go-mysql-elasticsearch安装步骤1：安装goyuminstallgo步骤2：安装godepgo
ELK离线安装和配置流程 GB9125 运维开发 elasticsearch elk linux 运维开发
ELK离线安装和配置流程一、介绍ELK是一个开源的数据分析和可视化工具，由三个开源项目组成：Elasticsearch、Logstash和Kibana。Elasticsearch是一个基于Lucene库的分布式搜索和分析引擎；Logstash是一个用于收集、处理和转换数据的数据管道，它可以从各种来源读取数据，包括日志文件、系统事件、网络流量等；Kibana则是一个数据可视化平台，可以对从Elast
javaweb个人博客系统-第二版—项目概述 Sunflow007
22.jpg2018.11.08更新：代码更新已提交github，更新如下：1.Elasticsearch全文检索——之前说过的Elasticseach，现在终于加上了，附带Logstash定时增量导入Mysql中的数据。2.增加和完善了用户收藏、评论区创建讨论和点赞的功能3.个人中心查看已收藏文章的功能、个人中心上传图片(按时间线排列的照片墙)的功能下一步要做的事：1.完善功能、修改bug和代码
【Elasticsearch】从零开始搭建ES8集群并且集成到Springboot，更好的服务电商类等需要全文索引的项目（一） Smily清禾酥酒中间件 elasticsearch spring boot lucene java 全文检索
从零开始搭建Elasticsearch集群（一）从零开始搭建Elasticsearch8.6集群（一）简单介绍下Elasticsearch，以及为何使用它下载Elasticsearch准备服务器解压安装配置文件elasticsearch.yml修改调整JVM运行内存设置密码证书认证1.生成证书2.生成秘钥3.迁移凭证地址到config目录下4.其他集群都要将这个凭证移动到这个ES安装的config
164Elasticsearch 基础入门--elasticsearch之mapping Jachin111
实验原理elasticsearchmapping简介Mapping对应数据库里的表定义，我们都知道数据库表有各种字段每种字段使用场景是不一样，mapping中字段也类似数据库字段，定义形式不同搜索场景也不同，mapping还有一些其他的含义，mapping不仅告诉ES一个field中是什么类型的值，它还告诉ES如何索引数据以及数据是否能被搜索到，Mapping是对于index上每种type的定义。
二十二、elasticSearch的most-fields策略书写只为分享
1、most-fields策略best-fields策略，主要是说将某一个field匹配尽可能多的关键词的doc优先返回回来most-fields策略，主要是说尽可能返回更多field匹配到某个关键词的doc，优先返回回来，用法和上面的一样当我们相查找与learningcourses相关的数据时如果数据如下：{"update":{"_id":"1"}}{"doc":{"sub_title":"le
Elasticsearch(11) intervals的使用 2跬步9 elastic的学习笔记 elasticsearch
elasticsearchversion7.10.1在Elasticsearch中，intervals查询是用来做复杂的区间表达式匹配的，它可以基于分析过的文本字段执行一系列复杂的关系运算。intervals查询特别适合于那些需要对文本数据进行模式匹配，而不只是单一词汇匹配的情况。intervals语法POST_search{"query":{"intervals":{"my_text":{"al
高效的ElasticSearch Java API - my-elasticsearch-starter 南天一梦N 中间件技术 elasticsearch java jenkins spring
ESJavaApi有很多种，本文主要是基于SpringBoot进行封装的，为什么选择SpringBoot，可以看往期文章Elasticsearch入门必读指南：到底选择哪个ES版本更合适。SpringBoot现在也是Java生态中最主流的开发框架，综上没有理由不使用，所以本文及提供的starter也以此为基础。一、背景以往业务应用中使用ES很多依赖的是spring-boot-starter-dat
基于ElasticSearch存储海量AIS数据-架构设计篇 iOS逆向数据库技能 elasticsearch 大数据搜索引擎
文章目录引言I背景II数据集群架构选型2.1关键点2.2架构设计2.3数据迁移工具:Canal关键词：时空索引；船舶自动识别系统；轨迹压缩；数据集群引言船舶自动识别系统(AIS)数据具有海量性、时空性和小记录频繁更新等特性。面向海量AIS数据，提出了一种基于分布式集群的AIS数据存储方法。该方法对AIS数据存储索引结构进行了设计，通过对时间维按月切分，以及对空间范围聚类切分，构造了索引时空立方体，
Spring Data访问Elasticsearch（一）----Elasticsearch客户端 85程序员老王 Elasticsearch elasticsearch 大数据搜索引擎
SpringData访问Elasticsearch（一）----Elasticsearch客户端一、命令式Rest客户端二、反应式（Reactive）Rest客户端三、客户端配置3.1客户端配置回调3.1.1底层ElasticsearchRestClient的配置:3.1.2底层ElasticsearchRestClient使用的HttpAsyncClient配置:四、客户端日志本文演示了支持的E
Windows安装Elasticsearch8.x保姆级教程柳衣白卿 windows elasticsearch
Elasticsearch下载安装下载：点击https://www.elastic.co/cn/downloads/elasticsearch--＞点击Viewpastreleases-->找到8.11.1版本的ES--->点击下载---目前最新版的SpringDataES最高支持8.11.1版本elasticsearch与JDK版本：https://www.elastic.co/cn/suppo
Elasticsearch详解es 思静语 elasticsearch elasticsearch 大数据搜索引擎
文章目录概述es架构为什么要使用ElasticSearchElasticSearch的优势使用场景es为什么这么快倒排索引如何保证ES和数据库的数据一致性监听binlog同步双写elasticsearch是如何实现master选举的Elasticsearch与Solr的区别概述ES全称是ElasticSearch，它是一个建立在全文搜索引擎库Lucene基础上的开源搜索和分析引擎。ES它本身具有分
Elastic Stack--10--QueryBuilders UpdateQuery 知行合一。。。常用数据库 jenkins 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录QueryBuildersESUtilQueryBuilderspackagecom.elasticsearch;importorg.elasticsearch.action.ActionListener;importorg.elasticsearch.action.search.SearchResponse;importor
探秘Elasticsearch：高性能搜索引擎的原理与应用场景（一）凛鼕将至搜索引擎 elasticsearch 大数据
本系列文章简介：本系列文章将探秘Elasticsearch的原理与应用场景，从基本原理到具体应用，带领读者全面了解这一强大的搜索引擎。首先我们将介绍Elasticsearch的基本原理，包括分布式架构、倒排索引和分片等核心概念。然后我们将深入探讨Elasticsearch的搜索原理，包括查询解析、相似度计算和布尔搜索等关键技术。接着我们将讨论Elasticsearch的索引和映射，了解如何对文档进
为什么不要使用elasticsearch 水的精神 Elasticsearch ES搜索优化 elasticsearch 大数据搜索引擎
互联网上有很多文章，都在讲为什么要使用elasticsearch，却很少有人讲为什么不要使用elasticsearch。作为深入研究elasticsearch四年，负责公司万亿级别检索的操盘手，借着这篇文章，给大家分享一下，为什么不要使用elasticsearch。一、不要使用的理由1.学习成本elasticsearch的文档蛮多的，而且看一遍什么用都没有，而且看一遍的时间成本很长。但是多看几遍，
为什么要使用ElasticSearch？ z.jiaminf ElasticSearch elasticsearch 大数据搜索引擎
ElasticSearch是一个开源的分布式搜索和分析引擎，主要适用于以下场景：1.搜索引擎：用于快速检索文档，商品，新闻等。2.日志分析：通过分析日志数据，帮助企业了解其业务的性能情况。3.数据分析：帮助数据科学家和数据分析师进行数据分析，以获取有价值的信息。4.商业智能：帮助企业制定数据驱动的决策，以实现商业上的成功。5.实时监控：帮助企业实时监测系统性能，监控数据变化，以保证系统正常运行。6
ElasticSearch 模糊查询嘟嘟嘟嘟嘟嘟222 ElasticSearch elasticsearch
前缀搜索#前缀搜索注意：前缀搜索匹配的是trem,而不是filed，倒排索引的分词性能比较差，没有缓存搜索时尽量把前缀词设置长一点GET/product/_search{"query":{"prefix":{"name":{"value":"小米"}}}}通配符通配搜索匹配的是tremGET/product/_search{"query":{"wildcard":{"name":{"value":
ElasticSearch 与java的结合使用（二）嘟嘟嘟嘟嘟嘟222 ElasticSearch elasticsearch
不同类型商品数量{"size":0,"aggs":{"type_group":{"terms":{"field":"type.keyword"}}}}SearchRequestrequest=newSearchRequest();request.indices("product");//按照类型分组统计数量AggregationBuildertype=AggregationBuilders.ter
选型搜索引擎之参考Elasticsearch 剑飞的编程思维 elasticsearch
简介Elasticsearch（简称ES）是一个基于ApacheLucene的开源、分布式、RESTful接口的全文搜索引擎。其设计用于云计算环境，能够达到实时搜索、稳定、可靠、快速、安装使用方便的效果。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。Elasticsearch的特点包括：分布式存储和搜索：Elasticsear
31.Elasticsearch集群故障排查及修复-2 大勇任卷舒
31.1定位红色或黄色的索引进一步定位未分配的原因可以要求集群进一步返回给定分片的当前分配情况和逻辑需要结合第三步返回结果对下面的_cluster/allocation/explainAPI参数进行修改GET/_cluster/allocation/explain{"index":"my_index_003","shard":0,"primary":false}一些常见的问题包括：磁盘空间不足分片
ElasticSearch为什么快？ z.jiaminf ElasticSearch elasticsearch 大数据搜索引擎
ElasticSearch是一个高性能，分布式搜索引擎，它之所以快，主要有以下几个原因：1.分布式存储：ElasticSearch使用分布式存储技术，将数据存储在多个节点上从而减少单个节点的压力，提高整体性能。2.索引分片：ElasticSearch把每个索引划分成多个分片，这样可以让查询操作并行化，从而提高查询速度。3.全文索引：ElasticSearch使用了高效的全文索引技术，把文档转化成可
ElasticSearch | Completion Suggester | Context Suggester 乌鲁木齐001号程序员
TheCompletionSuggesterCompletionSuggester提供了“自动完成（AutoCompletion）”的功能，用户每输入一个字符，就需要即时发送一个查询请求到后端查找匹配项；这种功能对性能的要求比较苛刻，ElasticSearch采用了不同的数据结构，而不是使用了倒排索引来实现；通过将Analyze的数据编码成FST和索引一起存放；FST会被ES整个加载进内存，从而达
Elasticsearch Completion Suggester 实战 tangwanggong 学习实践 Elasticsearch completion suggester
CompletionSuggester是ElasticsearchSearchAPIs中一种，主要用于输入框的自动补齐功能。我将通过字或者拼音首字母推荐成语的java程序作为实战演示。项目地址：https://github.com/tangwanggong/week-project/tree/master/week-1成语数据来源：https://github.com/pwxcoo/chinese
高效使用ELK 处理 SpringBoot 日志 zy_zeros elk spring boot 后端
在排查线上异常的过程中，查询日志总是必不可缺的一部分。现今大多采用的微服务架构，日志被分散在不同的机器上，使得日志的查询变得异常困难。工欲善其事，必先利其器。如果此时有一个统一的实时日志分析平台，那可谓是雪中送碳，必定能够提高我们排查线上问题的效率。本文带您了解一下开源的实时日志分析平台ELK的搭建及使用。ELK简介ELK是一个开源的实时日志分析平台，它主要由Elasticsearch、Logst
从入门到精通：Elasticsearch开发实践教程青年老年程序员 Elasticsearch学习 elasticsearch jenkins 大数据
Elasticsearch是一款开源的搜索引擎，它使用Lucene搜索库作为其核心搜索引擎。Elasticsearch使用RESTfulAPI进行交互，并支持多种数据类型的搜索和聚合。本教程将介绍Elasticsearch的基本原理，如何开发，以及如何在SpringBoot中使用Elasticsearch。Elasticsearch的原理Elasticsearch是一个分布式的文档存储和搜索引擎。
使用Elasticsearch 7.9.1实现对word，pdf，txt文件的全文内容检索 localhostAND elasticsearch 搜索引擎 lucene
使用Elasticsearch7.9.1实现对word，pdf，txt文件的全文内容检索POST/docwrite/_doc?pipeline=attachment{"name":"测试PDF2","type":"pdf","content":""}GET/docwrite/_search{"_source":["name","type"],"query":{"match":{"attachmen
elasticsearch 搜索怎么设置超时时间老程序员刘飞
SearchRequestBuilderbuilder；builder.setTimeout(TimeValue.timeValueMillis(1));本意是想es查询超过1毫秒就返回超时，但测试发现与想象的不一样。即使耗时100+毫秒也不会超时。setTimeout方法是不可靠的，解释如下：Sadly,itisabestefforttimeout,itsnotbeingcheckedonall
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio