ElasticSearch7.7.1安装分词器——ik分词器和hanlp分词器

背景

之所以选择用ES，自然是看重了她的倒排所以，倒排索引又必然关联到分词的逻辑，此处就以中文分词为例以下说到的分词指的就是中文分词，ES本身默认的分词是将每个汉字逐个分开，具体如下，自然是很弱的，无法满足业务需求，那么就需要把那些优秀的分词器融入到ES中来，业界比较好的中文分词器排名如下，hanlp> ansj >结巴>ik>smart chinese analysis；
博主这里就选两种比较常用的讲解hanlp和ik ，hanlp在业界名声最响，ik是官方推荐和ES版本同步更新的使用最多的分词器，并且举例比较下他们的功能；

断句对比效果

默认的分词器效果；

GET /_analyze
{
   "text": "林俊杰在上海市开演唱会啦"
}

# 结果
{
 "tokens" : [
   {
     "token" : "林",
     "start_offset" : 0,
     "end_offset" : 1,
     "type" : "",
     "position" : 0
   },
   {
     "token" : "俊",
     "start_offset" : 1,
     "end_offset" : 2,
     "type" : "",
     "position" : 1
   },
   {
     "token" : "杰",
     "start_offset" : 2,
     "end_offset" : 3,
     "type" : "",
     "position" : 2
   },
   {
     "token" : "在",
     "start_offset" : 3,
     "end_offset" : 4,
     "type" : "",
     "position" : 3
   },
   {
     "token" : "上",
     "start_offset" : 4,
     "end_offset" : 5,
     "type" : "",
     "position" : 4
   },
   {
     "token" : "海",
     "start_offset" : 5,
     "end_offset" : 6,
     "type" : "",
     "position" : 5
   },
   {
     "token" : "市",
     "start_offset" : 6,
     "end_offset" : 7,
     "type" : "",
     "position" : 6
   },
   {
     "token" : "开",
     "start_offset" : 7,
     "end_offset" : 8,
     "type" : "",
     "position" : 7
   },
   {
     "token" : "演",
     "start_offset" : 8,
     "end_offset" : 9,
     "type" : "",
     "position" : 8
   },
   {
     "token" : "唱",
     "start_offset" : 9,
     "end_offset" : 10,
     "type" : "",
     "position" : 9
   },
   {
     "token" : "会",
     "start_offset" : 10,
     "end_offset" : 11,
     "type" : "",
     "position" : 10
   },
   {
     "token" : "啦",
     "start_offset" : 11,
     "end_offset" : 12,
     "type" : "",
     "position" : 11
   }
 ]
}

ik分词器效果，这里以ik_smart为例；

GET /_analyze
{
  "text": "林俊杰在上海市开演唱会啦",
  "analyzer": "ik_smart"
}

# 结果
{
"tokens" : [
  {
    "token" : "林俊杰",
    "start_offset" : 0,
    "end_offset" : 3,
    "type" : "CN_WORD",
    "position" : 0
  },
  {
    "token" : "在上",
    "start_offset" : 3,
    "end_offset" : 5,
    "type" : "CN_WORD",
    "position" : 1
  },
  {
    "token" : "海市",
    "start_offset" : 5,
    "end_offset" : 7,
    "type" : "CN_WORD",
    "position" : 2
  },
  {
    "token" : "开",
    "start_offset" : 7,
    "end_offset" : 8,
    "type" : "CN_CHAR",
    "position" : 3
  },
  {
    "token" : "演唱会",
    "start_offset" : 8,
    "end_offset" : 11,
    "type" : "CN_WORD",
    "position" : 4
  },
  {
    "token" : "啦",
    "start_offset" : 11,
    "end_offset" : 12,
    "type" : "CN_CHAR",
    "position" : 5
  }
]
}

hanlp分词器效果，这里以hanlp默认分词器为例；

GET /_analyze
{
  "text": "林俊杰在上海市开演唱会啦",
  "analyzer": "hanlp"
}


# 结果如下
{
"tokens" : [
  {
    "token" : "林俊杰",
    "start_offset" : 0,
    "end_offset" : 3,
    "type" : "nr",
    "position" : 0
  },
  {
    "token" : "在",
    "start_offset" : 3,
    "end_offset" : 4,
    "type" : "p",
    "position" : 1
  },
  {
    "token" : "上海市",
    "start_offset" : 4,
    "end_offset" : 7,
    "type" : "ns",
    "position" : 2
  },
  {
    "token" : "开",
    "start_offset" : 7,
    "end_offset" : 8,
    "type" : "v",
    "position" : 3
  },
  {
    "token" : "演唱会",
    "start_offset" : 8,
    "end_offset" : 11,
    "type" : "n",
    "position" : 4
  },
  {
    "token" : "啦",
    "start_offset" : 11,
    "end_offset" : 12,
    "type" : "y",
    "position" : 5
  }
]
}

断句层面，hanlp还是要强于ik的；

ik安装

官网找到和ES版本的elasticsearch-analysis-ik-7.7.1.zip，下载安装zip包，如图1；

官网地址

图1 官网下载elasticsearch-analysis-ik-7.7.1.zip

将下载的elasticsearch-analysis-ik-7.7.1.zip上传到elasticsearch 的安装目录下的plugins下，如我的是/usr/local/tools/elasticsearch/elasticsearch-7.7.1/plugins,当然，你集群要是网速不错，也可以在家此文件夹下直接下载，省去上传的工作；

cd /usr/local/tools/elasticsearch/elasticsearch-7.7.1/plugins
#直接下载指令
wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.7.1/elasticsearch-analysis-ik-7.7.1.zip

解压/usr/local/tools/elasticsearch/elasticsearch-7.7.1/plugins``下的elasticsearch-analysis-ik-7.7.1.zip`包，指令如下；


#因为是zip，如果报错unzip不是内部指令。说明没安装unzip需要先安装，如果已安装，直接跳过这里
yum install zip 
yum install unzip

#新建id文件夹
mkdir ik

#将zip包移入刚刚新建ik文件夹呢
mv ./elasticsearch-analysis-ik-7.7.1.zip ik/

#进入ik文件夹
cd ik

#解压
unzip elasticsearch-analysis-ik-7.7.1.zip

#解压后确保里面的问价如下
total 5828
-rwxr-xr-x 1 hadoop supergroup  263965 Aug  5 18:57 commons-codec-1.9.jar
-rwxr-xr-x 1 hadoop supergroup   61829 Aug  5 18:57 commons-logging-1.2.jar
drwxrwxrwx 2 hadoop supergroup     299 Aug  5 18:57 config
-rwxr-xr-x 1 hadoop supergroup   54599 Aug  5 18:57 elasticsearch-analysis-ik-7.7.1.jar
-rwxr-xr-x 1 hadoop supergroup 4504441 Aug  5 18:57 elasticsearch-analysis-ik-7.7.1.zip
-rwxr-xr-x 1 hadoop supergroup  736658 Aug  5 18:57 httpclient-4.5.2.jar
-rwxr-xr-x 1 hadoop supergroup  326724 Aug  5 18:57 httpcore-4.4.4.jar
-rwxr-xr-x 1 hadoop supergroup    1805 Aug  5 18:57 plugin-descriptor.properties
-rwxr-xr-x 1 hadoop supergroup     125 Aug  5 18:57 plugin-security.policy


#赋权
chmod -R 777 ./*

#切换到es的安装目录
cd /usr/local/tools/elasticsearch/elasticsearch-7.7.1/

#查看是否安装完成
bin/elasticsearch-plugin list
#返回结果
future versions of Elasticsearch will require Java 11; your Java version from [/usr/local/tools/java/jdk1.8.0_211/jre] does not meet this requirement
ik

重启es，让分词器生效，操作shell如下；

# 利用jps查看elasticsearch的守护进程
jps
#结果
2497 Kafka
2609 QuorumPeerMain
23906 Elasticsearch
32282 NodeManager
2428 Jps
7341 Worker
2126 CoarseGrainedExecutorBackend

#杀死elasticsearch的守护进程
kill -9 23906 

#重启启动es
bin/elasticsearch -d

确保整个es集群上的每台机器都操作了以上步骤后，就可以在kibana上测试了,kibana RESTFul风格的测试语句如下；

  GET /_analyze
{
    "text": "林俊杰在上海市开演唱会啦",
    "analyzer": "ik_smart"
}

# 结果
{
  "tokens" : [
    {
      "token" : "林俊杰",
      "start_offset" : 0,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "在上",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "海市",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "开",
      "start_offset" : 7,
      "end_offset" : 8,
      "type" : "CN_CHAR",
      "position" : 3
    },
    {
      "token" : "演唱会",
      "start_offset" : 8,
      "end_offset" : 11,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "啦",
      "start_offset" : 11,
      "end_offset" : 12,
      "type" : "CN_CHAR",
      "position" : 5
    }
  ]
}

更多的ik分词器结合es的使用，请查考ik的官网readme教程：传送门

hanlp安装

hanlp在es的使用有很多人在做，版本相对比较乱，博主也是找了好几个版本，终于选了一个博主用的来的，hanlp的安装稍微会比ik繁琐一丢丢，所以大家也稍微耐心点；

hanlp并没有做到和ES版本的同步更新，所以遇到较新的版本，则需要自己编译源码打包！比如我们的ElasticSearch7.7.1就是目前（20201225）没有release版本！而且hanlp分词器不能直接找hanlp包，用不了，而是要找和elasticsearch兼容的elasticsearch-analysis-hanlp

进入其中一个elasticsearch-analysis-hanlp派系的官网,如图2：传送门

图2 elasticsearch-analysis-hanlp某一派系官网

利用git，在文件夹内git clone https://github.com/AnyListen/elasticsearch-analysis-hanlp.git,再利用java的开发工具IDEA或者eclipse打开项目，打开 pom.xml 文件，修改 7.0.0 为需要的 ES 版本；
这个git项目的老哥太大意了，留了个bug，如下图3d的文件内缺少两个参数name，你把它补全加上，不然编译报错,然后使用 mvn package 生产打包文件，最终文件在 target/release 文件夹下,打包完成后，使用离线方式安装即可。
.

图3 重新编译hanlp源码

在es的插件目录下/usr/local/tools/elasticsearch/elasticsearch-7.7.1/plugins新建`hanlp1文件夹，开始离线安装，代码如下；

#进入es插件目录
cd /usr/local/tools/elasticsearch/elasticsearch-7.7.1/plugins

#新建hanlp文件夹并进入
mkdir hanlp
chmod 755 hanlp
cd hanlp

#将之前重新编译打包好的 target/release下的elasticsearch-analysis-hanlp-7.7.1.zip上传到新建的hanlp目录下解压
unzip elasticsearch-analysis-hanlp-7.7.1.zip

#解压后目录如下
-rwxr-xr-x 1 hadoop supergroup   33498 Dec 24 15:24 elasticsearch-analysis-hanlp-7.7.1.jar
-rw-r--r-- 1 hadoop supergroup 7747506 Dec 24 15:24 elasticsearch-analysis-hanlp-7.7.1.zip
-rwxr-xr-x 1 hadoop supergroup 7971652 Dec 24 15:24 hanlp-portable-1.7.3.jar
-rwxr-xr-x 1 hadoop supergroup    2493 Dec 24 15:24 hanlp.properties
-rwxr-xr-x 1 hadoop supergroup    1117 Dec 24 15:24 plugin-descriptor.properties
-rwxr-xr-x 1 hadoop supergroup      88 Dec 24 15:24 plugin.properties
-rwxr-xr-x 1 hadoop supergroup     414 Dec 24 15:24 plugin-security.policy

#赋权
chmod -R 755 ./*

#利用vi修改hanlp.properties里面的root=的值，为es的hanlp插件安装目录，如下
root=/usr/local/tools/elasticsearch/elasticsearch-7.7.1/plugins/hanlp/
#wq！保存hanlp.properties的内容

#汇到es的安装目录查看hanlp分词器是否成功
cd /usr/local/tools/elasticsearch/elasticsearch-7.7.1/
bin/elasticsearch-plugin list
#返回结果
future versions of Elasticsearch will require Java 11; your Java version from [/usr/local/tools/java/jdk1.8.0_211/jre] does not meet this requirement
hanlp
ik

重启es，让分词器生效，操作shell如下；

# 利用jps查看elasticsearch的守护进程
jps
#结果
2497 Kafka
2609 QuorumPeerMain
24812 Elasticsearch
32282 NodeManager
2428 Jps
7341 Worker
2126 CoarseGrainedExecutorBackend

#杀死elasticsearch的守护进程
kill -9 24812 

#重启启动es
bin/elasticsearch -d

确保整个es集群上的每台机器都操作了以上步骤后，就可以在kibana上测试了,kibana RESTFul风格的测试语句如下；

GET /_analyze
{
  "text": "林俊杰在上海市开演唱会啦",
  "analyzer": "hanlp"
}


# 结果如下
{
"tokens" : [
  {
    "token" : "林俊杰",
    "start_offset" : 0,
    "end_offset" : 3,
    "type" : "nr",
    "position" : 0
  },
  {
    "token" : "在",
    "start_offset" : 3,
    "end_offset" : 4,
    "type" : "p",
    "position" : 1
  },
  {
    "token" : "上海市",
    "start_offset" : 4,
    "end_offset" : 7,
    "type" : "ns",
    "position" : 2
  },
  {
    "token" : "开",
    "start_offset" : 7,
    "end_offset" : 8,
    "type" : "v",
    "position" : 3
  },
  {
    "token" : "演唱会",
    "start_offset" : 8,
    "end_offset" : 11,
    "type" : "n",
    "position" : 4
  },
  {
    "token" : "啦",
    "start_offset" : 11,
    "end_offset" : 12,
    "type" : "y",
    "position" : 5
  }
]
}


   **更多的hanlp分词器结合es的使用，请查考hanlp某一派系的的官网readme教程：[传送门](https://github.com/anylisten/elasticsearch-analysis-hanlp)**
## ==专有名词对比效果==
   默认的分词器效果；
 ```json
GET /_analyze
{
    "text": "中国移动"
}

#结果
{
  "tokens" : [
    {
      "token" : "中",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "",
      "position" : 0
    },
    {
      "token" : "国",
      "start_offset" : 1,
      "end_offset" : 2,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "移",
      "start_offset" : 2,
      "end_offset" : 3,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "动",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "",
      "position" : 3
    }
  ]
}

ik分词器效果，这里以ik_smart为例；

GET /_analyze
{
  "text": "中国移动",
  "analyzer": "ik_smart"
}

#结果
{
"tokens" : [
  {
    "token" : "中国移动",
    "start_offset" : 0,
    "end_offset" : 4,
    "type" : "CN_WORD",
    "position" : 0
  }
]
}

hanlp分词器效果，这里以hanlp默认分词器为例；

GET /_analyze
{
  "text": "中国移动",
  "analyzer": "hanlp"
}


#结果如下
{
"tokens" : [
  {
    "token" : "中国",
    "start_offset" : 0,
    "end_offset" : 2,
    "type" : "ns",
    "position" : 0
  },
  {
    "token" : "移动",
    "start_offset" : 2,
    "end_offset" : 4,
    "type" : "vn",
    "position" : 1
  }
]
}

专有名词上，hanlp和ik的各有特殊，读者也可自己多测试几轮，而且ik和hanlp自带网页版的在线分词器，只需要百度搜索ik活hanlp在线分词即可使用；

维护自己的词典

当然不论采用哪种分词器，都不能一劳永逸解决所有的分词匹配需求，特别是针对某些特有的分词需求，如当搜索自家公司或者自家公司产品时，期望他得分靠前，这个时候就需要维护自己的词典，ik和hanlp都支持维护自己的词典，即当你规定某个词为一体时，该词不会再做细分；具体操作可以查看各自官网的readme文件有说明。

1.计算机处理器架构+嵌入式处理器架构及知识 vv 啊 arm-linux学习 linux 系统架构
目录一：x86-64处理器架构二：Intel80386处理器（i386）1.i3862.i686三：嵌入式Linux知识：1.MinGW2.GNU计划2.1GNU工具链概述此次只分享英特尔和ADM处理器有关于x86的架构，至于嵌入式处理器架构请查看https://en.wikipedia.org/wiki/List_of_ARM_processors一：x86-64处理器架构x86-64，也称为x
lodash插件吃我一锅一些插件
安装npminstalllodash引入importorderByfrom'lodash/orderBy'使用orderBy(要排序的变量，要排序的字段，升序还是降序)//例如，评论按照点赞数量排序orderBy(lilst,'like','desc')
ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
电商打单ERP必备API列表-API调用指南懂电商API接口的Jennifer 淘宝API接口 spring java 后端爬虫数据挖掘网络爬虫
1、打开淘宝开放平台API文档，查看API参数。2、选择需要的API，进行测试对接。注册账号获取APIkey3、进入API测试页，开始测试taobao.customcustom-自定义API操作公共参数名称类型必须描述keyString是调用key（必须以GET方式拼接在URL中）secretString是调用密钥api_nameString是API接口名称（包括在请求地址中）[item_sear
部署es集群 liushaojiax elasticsearch java 大数据
我们会在单机上利用docker容器运行多个es实例来模拟es集群。不过生产环境推荐大家每一台服务节点仅部署一个es的实例。部署es集群可以直接使用docker-compose来完成，但这要求你的Linux虚拟机至少有4G的内存空间创建es集群首先编写一个docker-compose文件，内容如下：version:'2.2'services:es01:image:elasticsearch:7.12
Elasticsearch8 - Docker安装Elasticsearch8.12.2 王谷雨_ ElasticSearch elasticsearch docker
前言最近在学习ES，所以需要在服务器上装一个单节点的ES服务器环境：centos7.9安装下载镜像目前最新版本是8.12.2dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.12.2创建配置新增配置文件elasticsearch.ymlhttp.host:0.0.0.0http.cors.enabled:truehttp.cors.
elasticsearch同步mysql数据库神器之go-mysql-elasticsearch 强哥的博客数据库
go-mysql-elasticsearch是国内作者开发的一款插件。测试表明：该插件优点：能实现同步增、删、改、查操作。不足之处（待完善的地方）：1、日志不是很详细，但是能满足基本需求；2、初始化时，无法自动同步mysql中存在的以前的数据，需要自行解决初始导入（如重建索引批量导入）go-mysql-elasticsearch安装步骤1：安装goyuminstallgo步骤2：安装godepgo
ELK离线安装和配置流程 GB9125 运维开发 elasticsearch elk linux 运维开发
ELK离线安装和配置流程一、介绍ELK是一个开源的数据分析和可视化工具，由三个开源项目组成：Elasticsearch、Logstash和Kibana。Elasticsearch是一个基于Lucene库的分布式搜索和分析引擎；Logstash是一个用于收集、处理和转换数据的数据管道，它可以从各种来源读取数据，包括日志文件、系统事件、网络流量等；Kibana则是一个数据可视化平台，可以对从Elast
Python - SFTP实现网络设备下载/上传来看帽子变戏法 Python python 自动化
##利用Python实现设备的上传/下载importparamiko#引入模块fromdatetimeimportdatetimeimportospath_files=r"file"#定义一个路径ifnotos.path.exists(path_files):#判断当前路径下是否存在这个文件os.mkdir(path_files)#如果不存在则创建time_now=datetime.now()#获
php短信验证码登录实现短信接口开发
本文为您提供了PHP语言版本的验证码短信接口对接DEMO示例//接口类型：互亿无线触发短信接口，支持发送验证码短信、订单通知短信等。//账户注册：请通过该地址开通账户http://user.ihuyi.com/?DKimmu//注意事项：//（1）调试期间，请使用用系统默认的短信内容：您的验证码是：【变量】。请不要把验证码泄露给其他人。//（2）请使用APIID及APIKEY来调用接口，可在会员中
javaweb个人博客系统-第二版—项目概述 Sunflow007
22.jpg2018.11.08更新：代码更新已提交github，更新如下：1.Elasticsearch全文检索——之前说过的Elasticseach，现在终于加上了，附带Logstash定时增量导入Mysql中的数据。2.增加和完善了用户收藏、评论区创建讨论和点赞的功能3.个人中心查看已收藏文章的功能、个人中心上传图片(按时间线排列的照片墙)的功能下一步要做的事：1.完善功能、修改bug和代码
乘法-逆矩阵取个名字真难呐线性代数矩阵算法线性代数
文章目录1.矩阵相乘-5种方式1.1C=AB1.2AX列组合1.3XB行组合1.4列行组合1.5块求和2.高斯消元法求A−1A^{-1}A−12.1求A−1A^{-1}A−12.2推理1.矩阵相乘-5种方式1.1C=AB假设我们要求得矩阵C=AB，可以用如下公式表示cij=∑k=1Naikbkj(1)c_{ij}=\sum_{k=1}^Na_{ik}b_{kj}\tag{1}cij=k=1∑Nai
【Elasticsearch】从零开始搭建ES8集群并且集成到Springboot，更好的服务电商类等需要全文索引的项目（一） Smily清禾酥酒中间件 elasticsearch spring boot lucene java 全文检索
从零开始搭建Elasticsearch集群（一）从零开始搭建Elasticsearch8.6集群（一）简单介绍下Elasticsearch，以及为何使用它下载Elasticsearch准备服务器解压安装配置文件elasticsearch.yml修改调整JVM运行内存设置密码证书认证1.生成证书2.生成秘钥3.迁移凭证地址到config目录下4.其他集群都要将这个凭证移动到这个ES安装的config
164Elasticsearch 基础入门--elasticsearch之mapping Jachin111
实验原理elasticsearchmapping简介Mapping对应数据库里的表定义，我们都知道数据库表有各种字段每种字段使用场景是不一样，mapping中字段也类似数据库字段，定义形式不同搜索场景也不同，mapping还有一些其他的含义，mapping不仅告诉ES一个field中是什么类型的值，它还告诉ES如何索引数据以及数据是否能被搜索到，Mapping是对于index上每种type的定义。
某小厂java后端初面，记录一下 bpmh Java开发1天1道面试题 java 面试
好吧，，，，，本人很菜，再接再励吧，继续刷。简单记录一下面试题，未亡羊补牢呗。1.liftjoin;innerjoin;rightjoin的区别2.union和unionall的区别3.like查询会走索引吗？4.主键和索引的区别5.count(*),count(1),count(ID)的区别6.exists了解吗？作用是什么7.线程池了解吗？8.spring创建的bean是单例模式还是多例模式，
PHP对接验证码短信接口DEMO示例樱桃桃
学习编程得第N天，发现一个超简单验证码短信接口对接DEMO示例步骤1.注册互亿无线账号2.查找APIID和APIKEY3.代码的书写注册互亿无线账号网站：http://user.ihuyi.com/?JA9Ewr查找APIID和APIKEY注意事项：（1）调试期间，请使用用系统默认的短信内容：您的验证码是：【变量】。请不要把验证码泄露给其他人。//开启SESSIONsession_start();
Dialogues---送礼物，又熬夜了快乐有你_1ec8
挑选礼物Army'sbirthdayiscomingup.I'mgoingtobuyherapresent.Me,too.Whataboutsendingheragifttogether?Thatwouldbegreat.一起去商场挑选礼物吧。Ilikethisbook.Itispopular.It'stooserious.Shedoesn'tlikereading.Howaboutthispai
二十二、elasticSearch的most-fields策略书写只为分享
1、most-fields策略best-fields策略，主要是说将某一个field匹配尽可能多的关键词的doc优先返回回来most-fields策略，主要是说尽可能返回更多field匹配到某个关键词的doc，优先返回回来，用法和上面的一样当我们相查找与learningcourses相关的数据时如果数据如下：{"update":{"_id":"1"}}{"doc":{"sub_title":"le
Elasticsearch(11) intervals的使用 2跬步9 elastic的学习笔记 elasticsearch
elasticsearchversion7.10.1在Elasticsearch中，intervals查询是用来做复杂的区间表达式匹配的，它可以基于分析过的文本字段执行一系列复杂的关系运算。intervals查询特别适合于那些需要对文本数据进行模式匹配，而不只是单一词汇匹配的情况。intervals语法POST_search{"query":{"intervals":{"my_text":{"al
腾讯云轻量应用服务器2核4G5M代表什么意思？熵云AI 腾讯云服务器腾讯云云计算
腾讯云服务器2核4G5M带宽配置是代表什么？代表2核CPU、4G内存、5M公网带宽，这是一款轻量应用服务器，系统盘为60GBSSD云硬盘，活动页面txybk.com/go/txy活动打开如下图：腾讯云2核4G5M服务器如上图所示，这台轻量应用服务器2核4G5M配置优惠价格165元一年、252元15个月、756元三年，还可以在腾讯云百科txy.wiki查看当前最新的优惠券和配置报价表。腾讯云百科来详
契可尼效应与焦虑 JeetChan
契可尼效应契可尼效应（Zeigarnikeffect；又称蔡加尼克效应）是一种记忆效应，指人们对于尚未处理完的事情，比已处理完成的事情印象更加深刻。这个现象是由蔡格尼克通过实验得出的结论。人们天生有一种办事有始有终的驱动力，人们之所以会忘记已完成的工作，是因为欲完成的动机已经得到满足；如果工作尚未完成，这同一动机便使他对此留下深刻印象。说到契可尼效应，很多例子与初恋相关，即所谓的“初恋情节”，总是
Unity URP 如何写基础的曲面细分着色器凯尔315 shader unity 着色器游戏引擎
左边是默认Cube在网格模式下经过曲面细分的结果，右边是原状态。曲面细分着色器在顶点着色器、几何着色器之后，像素着色器之前。它的作用时根据配置信息生成额外的顶点以切割原本的面片。关于这部分有一个详细的英文教程，感兴趣可以看一下。https://catlikecoding.com/unity/tutorials/advanced-rendering/tessellation/以下是完整代码Shade
mysql报错日志查看 youhebuke225 SQL Server mysql 数据库
路径命令在MySQL命令行客户端中，执行SHOWVARIABLESLIKE'log_error';这个命令可以显示log_error系统变量的值，这个值通常指向MySQL的错误日志文件（errorlog）的路径。通过这个命令，你可以快速找到MySQL的报错日志文件的位置。这里是如何操作的：首先，登录到MySQL命令行客户端。你可以使用以下命令（以root用户为例）登录：mysql-uroot-p输
MySQL模糊匹配之like和like concat 解忧杂货铺Q 数据库 mysql 数据库 java
SETNAMESutf8mb4;SETFOREIGN_KEY_CHECKS=0;--------------------------------Tablestructureforuser------------------------------DROPTABLEIFEXISTS`user`;CREATETABLE`user`(`id`int(10)UNSIGNEDNOTNULLAUTO_INCR
高效的ElasticSearch Java API - my-elasticsearch-starter 南天一梦N 中间件技术 elasticsearch java jenkins spring
ESJavaApi有很多种，本文主要是基于SpringBoot进行封装的，为什么选择SpringBoot，可以看往期文章Elasticsearch入门必读指南：到底选择哪个ES版本更合适。SpringBoot现在也是Java生态中最主流的开发框架，综上没有理由不使用，所以本文及提供的starter也以此为基础。一、背景以往业务应用中使用ES很多依赖的是spring-boot-starter-dat
基于ElasticSearch存储海量AIS数据-架构设计篇 iOS逆向数据库技能 elasticsearch 大数据搜索引擎
文章目录引言I背景II数据集群架构选型2.1关键点2.2架构设计2.3数据迁移工具:Canal关键词：时空索引；船舶自动识别系统；轨迹压缩；数据集群引言船舶自动识别系统(AIS)数据具有海量性、时空性和小记录频繁更新等特性。面向海量AIS数据，提出了一种基于分布式集群的AIS数据存储方法。该方法对AIS数据存储索引结构进行了设计，通过对时间维按月切分，以及对空间范围聚类切分，构造了索引时空立方体，
Spring Data访问Elasticsearch（一）----Elasticsearch客户端 85程序员老王 Elasticsearch elasticsearch 大数据搜索引擎
SpringData访问Elasticsearch（一）----Elasticsearch客户端一、命令式Rest客户端二、反应式（Reactive）Rest客户端三、客户端配置3.1客户端配置回调3.1.1底层ElasticsearchRestClient的配置:3.1.2底层ElasticsearchRestClient使用的HttpAsyncClient配置:四、客户端日志本文演示了支持的E
Windows安装Elasticsearch8.x保姆级教程柳衣白卿 windows elasticsearch
Elasticsearch下载安装下载：点击https://www.elastic.co/cn/downloads/elasticsearch--＞点击Viewpastreleases-->找到8.11.1版本的ES--->点击下载---目前最新版的SpringDataES最高支持8.11.1版本elasticsearch与JDK版本：https://www.elastic.co/cn/suppo
泽平的ScalersTalk第七轮新概念朗读持续力训练Day 319 20220204 郑泽平
练习材料：L9(1)：FlyingcatsCatsneverfailtofascinatehumanbeings.Theycanbefriendlyandaffectionatetowardshumans,buttheyleadmysteriouslivesoftheirownaswell.Theyneverbecomesubmissivelikedogsandhorses.Asaresult，h
spring activiti ACT_RE_MODEL hshpy spring 数据库 sql
InSpring,ifyou'rereferringto"activiti"inthecontextofworkfloworbusinessprocessmanagement,it'slikelyyou'reusingtheActivitiBPMN(BusinessProcessModelandNotation)engine.InActiviti,ACT_RE_MODELisoneofthetab
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

ElasticSearch7.7.1安装分词器——ik分词器和hanlp分词器

背 景

断句对比效果

ik安装

hanlp安装

维护自己的词典

你可能感兴趣的:(ElasticSearch,elasticsearch,ik,hanlp,分词器)

背景