MarsLord

elasticsearch实战摘录

elasticSearch语法摘录

准备相关:

docker启动es

索引新数据

选择合适的查询类型:使用term

使用过滤器:

应用聚合:

通过ID获取文档:

配置es集群

索引更新和删除数据

查看所有索引

使用mapping来定义各种文档

获取目前的映射

索引一篇新的文档

查看上面的新mapping

定义新的mapping

用于定义文档字段的核心类型

常用字段类型的查询

数组和多字段

使用预定义字段

更新现有的文档

使用 /_update

使用与doc同级的upsert参数来创建不存在的修改

通过脚本来更新文档

通过版本来实现并发控制

删除数据

删除文档

搜索数据

介绍查询和过滤器DSL

常用的基础查询和过滤器:

组合查询或复合查询

bool查询

bool过滤器

range查询和过滤器

prefix查询和过滤器

wildcard通配符查询

exists过滤器

分析数据

N元语法(ngram)和edge-ngram和滑动窗口

使用相关性进行搜索

使用boosting来影响文档的得分

解释一篇文档不匹配的原因

使用查询再打分来减少评分操作的性能影响(7.x似乎缺少相关属性??)

使用function_score来定制得分(7.x引入了script_score)

合并得分

1)field_value_factor

2)script_score

3)random_score

4)衰减函数

elasticSearch语法摘录

2020-06-21: notepad++中删除空格换行回车等方式,ctrl+f ==> 勾选循环查找和正则表达式 ==>替换栏输入\s 即可.

准备相关:

删除docker镜像 docker rmi id或标签

使用tag为镜像添加标签: docker tag 旧repostery:tag 新repostery:tag

当repostery不同,tag相同,imageID也相同的时候,使用docker rmi respostery:tag 删除不想要的image.

查看正在运行的容器: docker ps

启动已经停止的容器实例: docker start id

启动未启动过的容器实例: docker run. 有三个参数 1) -it,以交互方式启动;2) -p 映射内外部端口; 3) -d 以附加进程启动

进入docker容器:docker exec -it id前3位(可以模糊查询) /bin/bash ; 退出可以直接输入exit

停止一个正在运行的容器: docker stop 容器ID或容器名有一个参数 -t,给容器时间(秒)去保存自己的状态:dcoker stop -t=20

直接立即关闭容器:docker kill 容器名ID

重启一个容器: docker restart ID或名称对于正在运行的容器进行重启就可以加-t给一个保存状态的时间.

查看容器: docker inspect 容器名

删除容器: docker rm -v:直接删除容器,并解除与之关联的卷. -l db是移除容器甲对容器乙的连接db;-f db01 db02是删除容器db01和db02

清理临时的没有被使用的镜像文件:docker image prune(慎用!)

查看层级历史:docker history ID

docker启动es

9200端口用于外部通信,9300用于集群内部通信.

docker run -p 9200:9200 elasticsearch ,然后浏览器中调es所在ip:9200查看是否启动成功

索引是由一个或多个被称为分片的数据块组成.易于扩展

索引有分片,分片有副本,分片和副本可存在于不同的节点.当有3个节点5个分片和5个副本时:深色为分片,浅色为副本

一个es服务是一个节点,或者一个es进程也是一个节点.多个节点可以加入同一个集群.默认情况下可以连接集群中任意一个节点并访问完整的数据集(完整的数据集不限于单个节点).

当索引一篇文档时,系统首先根据文档ID的散列值选择一个主分片将该文档发送过去,这个主分片可能位于别的节点(机器,线程).然后主分片开始同步该文档至所有副分片.搜索该文档时,es需要在该索引的完整分片集合中进行查找,这些分片可能是主分片也可能是副分片.

一份分片是Lucene的索引:一个包含倒排索引的文件目录.一个es索引由多个Lucene索引组成.副分片可以在运行的时候进行添加和移除,主分片不可以.过多的分片会影响性能.

分布式索引和搜索.索引时一旦确定文档所在分片,接受请求的节点将文档发送到分片所在节点.然后同步至所有副本.搜索时接受请求的节点将请求转发到一组包含所有数据的分片(可以是不同的节点上).es使用round-robin的轮训机制选择可用的分片(主分片或副分片).并将搜索请求转发过去.然后es从这些分片收集结果,将其聚集到单一的回复返回给客户端.

索引新数据

cURL的使用: -X此处不带空格[GET默认可以不带-X PUT PIST]; 单引号'ip:9200/索引/ID?pretty'

添加一个文档的命令:

curl -XPOST -H "Content-Type:application/json" '192.168.1.103:9200/get-together/1?pretty' -d '{"name":"Elasticsearch","organizer":"chow"}'

//返回
{
  "_index" : "get-together",
  "_type" : "1",
  "_id" : "ol8p0XIBV6yKmAPNJs-g",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

[root@localhost ~]# curl -XPUT '192.168.1.103:9200/new-index'
{"acknowledged":true,"shards_acknowledged":true,"index":"new-index"}

查看mapping的命令:

[root@localhost ~]# curl '192.168.1.103:9200/get-together/_mapping?pretty'

全文查找的例子:这里加不了&fields=name,location\

[root@localhost ~]# curl "192.168.1.103:9200/get-together/_search?\
q=elasticsearch\
&size=1\
&pretty"

//es7.x已经移除type

可以写成&q=name,location:elasticsearch

[root@localhost ~]# curl "192.168.1.103:9200/get-together/_search?\
q=name:elasticsearch\
&size=1\
&pretty"

索引处可以加多个索引,用逗号隔开.也可以省略索引直接在所有索引间搜索.将不同范围的数据构建到不同的索引里,而不是一个大索引?

请求参数可以加"timeout=3s",设定请求在超过3秒后超时.此时只能获得这期间查到的内容.

返回结果中的"_shards"一栏会返回成功命中的分片以及失败的分片.即便有分片宕机,依然可以返回剩余分片的查询结果.

es默认限制结果数量为10.使用size参数修改返回的数量.

使用json格式制定搜索条件:

[root@localhost ~]# curl -H "Content-Type:application/json" '192.168.1.103:9200/get-together/_search?pretty' -d '{"query":{"query_string":{"query":"Denver"}}}'

单query里指定多条件字段的AND查询可以这样写:注意query里面的AND一定要大写

[root@localhost ~]# curl -H "Content-Type:application/json" '192.168.1.103:9200/get-together/_search?pretty' -d '{"query":{"query_string":{"query":"name:Denver AND location_group:Denver"}}}'

选择合适的查询类型:使用term

curl -H "Content-Type:application/json" '192.168.1.103:9200/get-together/_search?pretty' -d '{"query":{"term":{"name":"elasticsearch"}}}'

使用过滤器:

如果对打分不感兴趣,使用过滤器更快更适合缓存.使用filter要配合bool查询.max_score项为0.0.不会根据得分排序.

curl -H "Content-Type:application/json" '192.168.1.103:9200/get-together/_search?pretty' -d '{"query":{"bool":{"filter":{"term":{"name":"elasticsearch"}}}}}'

应用聚合:

对没有优化或加索引的字段聚合会报错.

[root@localhost ~]# curl -H "Content-Type:application/json" '192.168.1.103:9200/get-together/_search?pretty' -d '{"aggregations":{"organizers":{"terms":{"field":"organizer"}}}}'

      "caused_by" : {
        "type" : "illegal_argument_exception",
        "reason" : "Text fields are not optimised for operations that require per-document field data like aggregations and sorting, so these operations are disabled by default. Please use a keyword field instead. Alternatively, set fielddata=true on [organizer] in order to load field data by uninverting the inverted index. Note that this can use significant memory."

优化方式就是set fielddata=true .注意这里是_mapping相关操作

[root@localhost ~]# curl -H "Content-Type:application/json" '192.168.1.103:9200/get-together/_mapping?pretty' -d '{"properties":{"organizer":{"type":"text","fielddata":true}}}'
{
  "acknowledged" : true
}

在此聚合,就可以了.

"aggregations" : {
    "organizers" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "lee",
          "doc_count" : 2
        },
        {
          "key" : "andy",
          "doc_count" : 1
        },
        {
          "key" : "daniel",
          "doc_count" : 1
        },
        {
          "key" : "mik",
          "doc_count" : 1
        },
        {
          "key" : "tyler",
          "doc_count" : 1
        }
      ]
    }
  }

通过ID获取文档:

/_doc不能少

curl '192.168.1.103:9200/get-together/_doc/1?pretty'

配置es集群

1.elasticsearch.yml中指定集群的名称 cluster.name 改名称后原有数据将不可见,不是丢失.

2.logging.yml中编辑日志选项 cluster-name.log;超过半秒的慢搜索日志:cluster-name_index_search_slowlog.log;超过半秒的慢索引(索引相关操作)日志:cluster-name_index_indexing_slowlog.log.

3.在环境变量或elasticsearch.in.sh中调整内存设置.这是配置java虚拟机在文件开始部分加ES_HEAP_SIZE=500m.默认是256MB 实际生产中如果机器只运行es,可以将heap_size设置为最多一半的机器内存.

索引更新和删除数据

有3种类型的字段:基本字段,数组和多元字段,预定义字段.可以用预定义字段_ttl设置过期文档自动删除.

查看所有索引

[root@localhost ~]# curl "192.168.1.103:9200/_cat/indices?v"
health status index                  uuid                   pri rep docs.count docs.deleted store.size pri.store.size
yellow open   indexforputandmapping  gi0ZFKysRD6g1cO7ieTefA   1   1          1            0        4kb            4kb
yellow open   get-together           bM_WypSDQBma_mL4cHMdKA   2   1         20            0     45.2kb         45.2kb
yellow open   myindex                Fqk1gJbrTL6vyZ9eKXD0rg   1   1          0            0       208b           208b
yellow open   november_2014_invoices QEbTWlFMQJWPPWwXfss45A   1   1          0            0       208b           208b
yellow open   december_2014_invoices eMBBAX8WRKCAEAeUmZEixg   1   1          0            0       208b           208b
yellow open   new-index              iN-g0oqpQt6Qza6CmKqVtQ   1   1          0            0       208b           208b
green  open   .kibana_1              oRggM7WgRA-sN218C_WEkg   1   0          1            0      3.8kb          3.8kb

使用mapping来定义各种文档

获取目前的映射

curl '192.168.1.103:9200/get-together/_mapping?pretty'

索引一篇新的文档

[root@localhost ~]# curl -XPOST -H 'Content-Type:application/json' '192.168.1.103:9200/indexforputandmapping/1?pretty' -d '{"name":"Late Night with Elasticsearch","date":"2013-10-25T19:00"}'
{
  "_index" : "indexforputandmapping",
  "_type" : "1",
  "_id" : "yV-d1nIBV6yKmAPNM89t",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

查看上面的新mapping

[root@localhost ~]# curl '192.168.1.103:9200/indexforputandmapping/_mapping?pretty'
{
  "indexforputandmapping" : {
    "mappings" : {
      "properties" : {
        "date" : {
          "type" : "date"
        },
        "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

定义新的mapping

定义新的字段host,类型为text.es7.x移除了string,8之后会彻底移除.

[root@localhost ~]# curl -XPUT -H 'Content-Type:application/json' '192.168.1.103:9200/indexforputandmapping/_mapping?pretty' -d '{"properties":{"host":{"type":"text"}}}'
{
  "acknowledged" : true
}

可以每次只添加新字段,mapping会自动合并.再次查看该索引:

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/indexforputandmapping/_mapping?pretty'
{
  "indexforputandmapping" : {
    "mappings" : {
      "properties" : {
        "date" : {
          "type" : "date"
        },
        "host" : {
          "type" : "text"
        },
        "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

用于定义文档字段的核心类型

请参考这篇文章: https://blog.csdn.net/Mikowoo007/article/details/106585422

7.x 有字符串类:text,keyword;

数值型:long,integer,short,byte,double,float,half_float,scaled_float;布尔型:boolean;二进制型:binary默认不存储不搜索;

范围类型:integer_range,float_range,date_range等,譬如 age 的类型是 integer_range, 那么值可以是 {“gte”:20, “lte”: 40}：搜索 “term” {“age”:21} 可以搜索该值;

日期型:date 通过格式来判断是否属于date类型;

复杂数据类型:array 直接用[]定义,数组中的类型必须一致,可以是object对象数组;

对象类型:Object 查询时使用点操作符指定字段名;

专用数据类型: IP,经纬度geo_point等

常用字段类型的查询

先插一条数据

[root@localhost ~]# curl "192.168.1.103:9200/new-index/_mapping?pretty"
{
  "new-index" : {
    "mappings" : { }
  }
}

[root@localhost ~]# curl -XPOST -H 'Content-Type:application/json' '192.168.1.103:9200/new-index/1?pretty' -d '{"name":"Late Night with Elasticsearch","date":"2013-10-25T19:00"}'
{
  "_index" : "new-index",
  "_type" : "1",
  "_id" : "yl8A13IBV6yKmAPNIc-T",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

查询.默认分词器将所有字符转化为小写,query_string的效果:会对搜索词进行分词,然后在text类型(也会分词)中去匹配,词词之间可以不连续词序也可以调换.match_phrase则要求(所分的词)必须连续且顺序.请参考:https://www.cnblogs.com/chenmz1995/p/10199147.html

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/new-index/_search?pretty' -d '{"query":{"query_string":{"query":"late"}}}'
{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.2876821,
    "hits" : [
      {
        "_index" : "new-index",
        "_type" : "1",
        "_id" : "yl8A13IBV6yKmAPNIc-T",
        "_score" : 0.2876821,
        "_source" : {
          "name" : "Late Night with Elasticsearch",
          "date" : "2013-10-25T19:00"
        }
      }
    ]
  }
}

对于不需要搜索的字段可以设置index为no,以节省空间,加快索引及搜索过程.

数组和多字段

数组 :如果要索引拥有多个值的字段,将这些值放在方括号中.数组在mapping中的type是里面数据的基本类型.

多字段:使用多字段可以对同一个字段设置不同的type及index属性.这里演示给tag字段加上一个不索引的配置的字段.注意配置"index":false

[root@localhost ~]# curl -XPUT -H 'Content-Type:application/json' '192.168.1.103:9200/new-index/_mapping?pretty' -d '{"properties":{"date":{"type":"date"},"name":{"type":"text","fields":{"keyword":{"type":"keyword","ignore_above":256}}},"tags":{"type":"text","fields":{"keyword":{"type":"keyword","ignore_above":256},"verbatim":{"type":"text","index":false}}}}}'    {
  "acknowledged" : true
}

再查看该索引的mapping就会发现tag字段的mapping变了

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/new-index/_mapping?pretty'          {
  "new-index" : {
    "mappings" : {
      "properties" : {
        "date" : {
          "type" : "date"
        },
        "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "tags" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            },
            "verbatim" : {
              "type" : "text",
              "index" : false
            }
          }
        }
      }
    }
  }
}

使用预定义字段

/_cat/indices:查看所有索引

C:\Users\admin>curl localhost:9200/_cat/indices?pretty

_source:返回所有数据,如果只要返回某些字段,可以加上&_source=字段名

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/new-index/_search?pretty&_source=name'
{
  "took" : 13,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "new-index",
        "_type" : "1",
        "_id" : "yl8A13IBV6yKmAPNIc-T",
        "_score" : 1.0,
        "_source" : {
          "name" : "Late Night with Elasticsearch"
        }
      },
      {
        "_index" : "new-index",
        "_type" : "1",
        "_id" : "zV9E13IBV6yKmAPNVs-r",
        "_score" : 1.0,
        "_source" : { }
      }
    ]
  }
}

还可以使用filter_path将took,timeout,_shards等过滤掉(不选即不显示):这里只显示了?pretty&filter_path=hits.hits._source&_source=name

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/new-index/_search?pretty&filter_path=hits.hits._source&_source=name'
{
  "hits" : {
    "hits" : [
      {
        "_source" : {
          "name" : "Late Night with Elasticsearch"
        }
      },
      {
        "_source" : { }
      }
    ]
  }
}

更新现有的文档

文档的更新包括检索文档,处理文档,并重新索引文档,直至先前的文档被覆盖.

使用 /_update

更新前:

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/get-together/_doc/2?pretty'
{
  "_index" : "get-together",
  "_type" : "_doc",
  "_id" : "2",
  "_version" : 1,
  "_seq_no" : 1,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "relationship_type" : "group",
    "name" : "Elasticsearch Denver",
    "organizer" : "Lee",
    "description" : "Get together to learn more about using Elasticsearch, the applications and neat things you can do with ES!",
    "created_on" : "2013-03-15",
    "tags" : [
      "denver",
      "elasticsearch",
      "big data",
      "lucene",
      "solr"
    ],
    "members" : [
      "Lee",
      "Mike"
    ],
    "location_group" : "Denver, Colorado, USA"
  }
}

更新时:

[root@localhost ~]# curl -XPOST -H 'Content-Type:application/json' '192.168.1.103:9200/get-together/_doc/2/_update?pretty' -d '{"doc":{"organizer":"Roy"}}'
{
  "_index" : "get-together",
  "_type" : "_doc",
  "_id" : "2",
  "_version" : 2,
  "result" : "updated",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 16,
  "_primary_term" : 1
}

更新后:organizer改变,_version改变

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/get-together/_doc/2?pretty'         {
  "_index" : "get-together",
  "_type" : "_doc",
  "_id" : "2",
  "_version" : 2,
  "_seq_no" : 16,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "relationship_type" : "group",
    "name" : "Elasticsearch Denver",
    "organizer" : "Roy",
    "description" : "Get together to learn more about using Elasticsearch, the applications and neat things you can do with ES!",
    "created_on" : "2013-03-15",
    "tags" : [
      "denver",
      "elasticsearch",
      "big data",
      "lucene",
      "solr"
    ],
    "members" : [
      "Lee",
      "Mike"
    ],
    "location_group" : "Denver, Colorado, USA"
  }
}

如果之前文档不存在,那么这里会操作失败并提示文档缺失.同时也应该使用版本去避免并发修改.

使用与doc同级的upsert参数来创建不存在的修改

id为20的文档先前不存在,先upsert

[root@localhost ~]# curl -XPOST -H 'Content-Type:application/json' '192.168.1.103:9200/get-together/_doc/20/_update?pretty' -d '{"doc":{"organizer":"chow"},"upsert":{"name":"Elasticsearch Denver","organizer":"chow"}}'
{
  "_index" : "get-together",
  "_type" : "_doc",
  "_id" : "20",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 5,
  "_primary_term" : 1
}

再查看,已有

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/get-together/_doc/20?pretty'        {
  "_index" : "get-together",
  "_type" : "_doc",
  "_id" : "20",
  "_version" : 1,
  "_seq_no" : 5,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "name" : "Elasticsearch Denver",
    "organizer" : "chow"
  }
}

通过脚本来更新文档

可以实现:1)改值 2)删字段等

默认的脚本语言是Grovvy;

脚本涉及到修改并重新索引文档,所以使用ctx._source来引用_source, 使用ctx_source.字段名来引用某个指定的字段;

如果涉及到变量,建议在params下作为参数单独定义.参数与脚本分离,这样脚本只需要编译一次.

修改前:

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/online-shop/shirts/1?pretty'
{
  "_index" : "online-shop",
  "_type" : "shirts",
  "_id" : "1",
  "_version" : 1,
  "_seq_no" : 0,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "price" : 15
  }
}

修改中:这里的+=后面一定要用params引出参数名

[root@localhost ~]# curl -XPOST -H 'Content-Type:application/json' '192.168.1.103:9200/online-shop/shirts/1/_update?pretty' -d '{"script":{"inline":"ctx._source.price += params.price_diff","params":{"price_diff":10}}}'
{
  "_index" : "online-shop",
  "_type" : "shirts",
  "_id" : "1",
  "_version" : 2,
  "result" : "updated",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 1,
  "_primary_term" : 1
}

修改后:

[root@localhost ~]# curl -XGET -H 'Content-Type:application/json' '192.168.1.103:9200/online-shop/shirts/1?pretty'        {
  "_index" : "online-shop",
  "_type" : "shirts",
  "_id" : "1",
  "_version" : 2,
  "_seq_no" : 1,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "price" : 25
  }
}

遇到一些语法报错问题,参考了这篇文章: https://blog.csdn.net/sanbingyutuoniao123/article/details/79687195

向数组中添加还需要在脚本中使用add()方法.

通过版本来实现并发控制

模拟并发修改.此处改成在Kibana中调用es

POST /online-shop/shirts/1/_update
{
  "script":"Thread.sleep(5000);ctx._source.price = 2"
}
POST /online-shop/shirts/1/_update
{
  "script":"ctx._source.caption = \"Knowing Elasticsearch\""
}

乐观锁,假设很少出现冲突.真的出现冲突的时候就报错.悲观锁则通过锁住可能引起冲突的操作预防冲突.

此处可以设置/_update?retry_on_conflict=3让es自动在冲突时重试.

可以设置使用外部版本:?version_type=external

删除数据

删除单个或部分文档,先标记后异步删除;删除整个索引几乎瞬间就能完成;还可以关闭索引

删除文档

根据id删除单个文档:也可以有版本控制

DELETE /online-shop/shirts/1

删除查询匹配的文档:

Kibana的搜索

直接删除索引:

DELETE /online-shop

关闭索引: 索引名/_close 打开索引:索引名/_open

搜索数据

关键词:query,size,from,_source,sort

GET /get-together/_search
{
  "from":0,
  "size": 10,
  "sort":[{"date":"desc"}],
  "_source":{
    "includes": ["date","title"]  //可以不加includes或excludes,直接跟在_source后面
  }
}

介绍查询和过滤器DSL

GET /get-together/_search
{
  "query":{
    "match": {
      "title": "hadoop"
    }
  }
}

term属于过滤器.

常用的基础查询和过滤器:

1) query_string的用法

GET /get-together/_search
{
  "query":{
    "query_string": {
      "default_field": "description",
      "query": "nosql"
    }
  }
}

query中可以带上Lucene的表达式,可以使用 AND OR TO 以及使用减号"-"进行结果剔除.

GET /get-together/_search
{
  "query":{
    "query_string": {
      "default_field": "description",
      "query": "(tags:search OR tags:lucene) AND created_on:[1999-01-01 TO 2001-01-01] AND -description:mongodb"
    }
  }
}

2) term查询和term过滤器

GET /get-together/_search
{
  "query":{
    "term":{
      "tags": "elasticsearch"
    }
  }
}

term过滤:filter要配合bool使用.max_score不再评分

GET /get-together/_search
{
  "query": {
    "bool": {
      "filter": {
        "term": {
          "tags": "elasticsearch"
        }
      }
    }
  }
}

3)terms查询

GET /get-together/_search
{
  "query": {
    "terms": {
      "tags": [
        "elasticsearch",
        "jvm"
      ]
    }
  }
}

4) match查询和term过滤器

match查询是一个散列映射,包含了希望搜索的字段和字符串.match查询可以有多重方式,最常见的是boolean和词组phrase.

1.布尔查询方式: match会分词,这里查询的是Elasticsearch 和 Denver

GET /get-together/_search
{
  "query": {
    "match": {
      "name": {
        "query": "Elasticsearch Denver",
        "operator": "and"  //默认是or
      }
    }
  }
}

2.词组查询方式允许词与词之间可以有别的词

GET /get-together/_search
{
  "query": {
    "match": {
      "name": {
        //7.x没有type
        "query": "enterprise london"
        //7.x没有slop
      }
    }
  }
}

还可以用词的开头去匹配

GET /get-together/_search
{
  "query": {
    "match": {
      "name": {
        "query": "Elasticsearch Den",
        "max_expansions": 1
      }
    }
  }
}

3.使用multi_match来匹配多个字段,注意fields数组里的字段类型和query的类型

GET /online-shop/shirts/_search
{
  "query":{
    "multi_match": {
      "query": "haha",
      "fields": ["caption","name"]
    }
  }
}

组合查询或复合查询

bool查询

GET /online-shop/shirts/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "name": "hadoop"
          }
        }
      ],
      "should": [
        {
          "term": {
            "name": "hadoop"
          }
        },
        {
          "term": {
            "name": "1"
          }
        }
      ],
      "must_not": [
        {
          "range": {
            "price": {
              "gte": 10,
              "lte": 20
            }
          }
        }
      ]
    }
  }
}

bool过滤器

query不能直接跟filter,需要用bool包一层.must和should包在同一层真的没问题吗?

GET /online-shop/shirts/_search
{
  "query": {
    "bool": {
      "filter": {
        "bool": {
          "must": [
            {
              "term": {
                "name": "hadoop"
              }
            }
          ],
          "should": [
            {
              "term": {
                "name": "hadoop"
              }
            },
            {
              "term": {
                "name": "1"
              }
            }
          ],
          "must_not": [
            {
              "range": {
                "price": {
                  "gte": 10,
                  "lte": 20
                }
              }
            }
          ]
        }
      }
    }
  }
}

range查询和过滤器

GET /online-shop/shirts/_search
{
  "query":{
    "range": {
      "FIELD": {
        "gte": 10,
        "lte": 20
      }
    }
  }
}

过滤器形式:

GET /online-shop/shirts/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "range": {
            "FIELD": {
              "gte": 10,
              "lte": 20
            }
          }
        }
      ]
    }
  }
}

prefix查询和过滤器

GET /online-shop/shirts/_search
{
  "query": {
    "prefix": {
      "caption": {
        "value": "e"
      }
    }
  }
}

可用于根据输入实时查询,如果要带有一定的模糊性,可以使用match_phrase_prefix

wildcard通配符查询

*匹配任意数量字符,?匹配一个字符.?无法匹配空格.通配符出现的越早,查询性能越低.类似的有regexp查询.

GET /online-shop/shirts/_search
{
  "query": {
    "wildcard": {
      "caption": {
        "value": "l*n"
      }
    }
  }
}

exists过滤器

只查询特定字段有值的文档.

GET /get-together/_search
{
  "query": {
    "bool":{
      "filter": [
        {
          "exists": {
            "field": "tags"
          }
        }
      ]
    }
  }
}

高版本es filter的写法改为在bool中指定filter，并移除了missing的api(7.x已移除)，可以在 bool must not 中指定exists代表不存在

分析数据

字符过滤->分词->分词过滤->索引数据

match,match_phrase会对查词进行分词分析.term和terms不会.

如果要对字段进行分析,在mapping的该字段下设置analyzer参数;如果不想分析,可以设置该字段的index属性为not_analyzed.

还可以通过fields属性设置不同的分词分析方式.

分析器包括:字符过滤器,一个单个分词器,0或多个分词过滤器.

关于keyword analyzer,最好是在映射中将涉及的字段设为not_analyzed.

N元语法(ngram)和edge-ngram和滑动窗口

ngram是将一个词进行一个字符间距的分割或多个指定字符间距的分割.可以设置min_gram和max_gram.会以min到max之间的间距分别分割字符串.可用于具有一定相似度的模糊查询.

edge-ngram的分词方式是始终从一侧开始包含词头,分词数量相对较少.可以通过设置side属性来指定从词尾开始分词.

滑动窗口类似上面的分词,但它是分词级别的N元语法,而不像上面的那样是字符串级别的.滑动窗口适用于查询英语中连续的短语.

使用相关性进行搜索

词频和逆文档频率.Lucene评分公式TF-IDF基于此.

更换字段的打分方案是在mapping中字段属性下设置similarity属性.也可以在setting中设置更高级的配置.

使用boosting来影响文档的得分

GET /online-shop/shirts/_search
{
  "query": {
    "boosting": {
      "positive": {
        "match": {
          "caption": "Elasticsearch"
        }
      },
      "negative": {
        "multi_match": {
          "fields": [
            "acption",
            "name"
          ],
          "query": "hadoop"
        }
      },
      "negative_boost": 0.2
    }
  }
}

boost大致是加权的作用.将所有字段的boost设置相同的值等于都没设置.

基本所有的查询都能设置boost,除此以外还可以通过function_score更精细的来控制boosting.

可以使用explain来解释分值的形成.举例如下:

GET /online-shop/shirts/_search
{
  "query": {
    "match": {
      "caption": "hadoop"
    }
  },
  "explain": true
}

解释一篇文档不匹配的原因

需要先知道文档的id,然后使用/_explain进行分析.

GET /online-shop/shirts/1/_explain
{
  "query": {
    "match": {
      "caption": "java"
    }
  }
}
//返回结果
{
  "_index" : "online-shop",
  "_type" : "shirts",
  "_id" : "1",
  "matched" : false,
  "explanation" : {
    "value" : 0.0,
    "description" : "no matching term",
    "details" : [ ]
  }

使用查询再打分来减少评分操作的性能影响(7.x似乎缺少相关属性??)

在下列情况下打分可能会变成资源密集型的操作:

1.使用脚本来计算每篇

2.进行phrase词组查询.

使用function_score来定制得分(7.x引入了script_score)

GET /online-shop/shirts/_search
{
  "query": {
    "function_score": {
      "query": {
        "match": {
          "caption": "hadoop"
        }
      },
      "functions": [
        {
          "weight": 2,  //相当于原boost * 2
          "filter": {    //在上述查询结果中过滤出caption字段含"elasticSearch"的
            "term": {
              "caption": "elasticsearch"
            }
          }
        }
      ]
    }
  }
}

function_score查询有一组不同的函数,每个函数可以使用另一个过滤器函数.

合并得分

上面的functions数组中可以放多个weight,每个weight的分值可以不一样.那么可以通过score_mode参数(multiply,sum,avg,fitst,max,min.如果没有说明默认是multiply)来合并不同函数的得分.

还有一种是boost_mode.它控制了原始查询的得分和函数得分是如何合并的.

1)field_value_factor

2)script_score

3)random_score

如果不想第一页永远展示那几个文档,可以设不同的seed

GET /get-together/_search
{
  "query": {
    "function_score": {
      "query": {
        "match": {
          "description": "elasticsearch"
        }
      },
      "functions": [
        {
          "random_score": {
            "seed": 31415926535
          }
        }
      ]
    }
  },
  "size": 2
}

4)衰减函数

如果想要最近的文档优先展示,老的文档靠后.或者在地理位置上靠近某个点的结果增加得分,远离的结果减少得分.可以使用这个函数.根据热度,时间,距离进行打分.

你可能感兴趣的:(elasticSearch,elasticsearch)

ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
部署es集群 liushaojiax elasticsearch java 大数据
我们会在单机上利用docker容器运行多个es实例来模拟es集群。不过生产环境推荐大家每一台服务节点仅部署一个es的实例。部署es集群可以直接使用docker-compose来完成，但这要求你的Linux虚拟机至少有4G的内存空间创建es集群首先编写一个docker-compose文件，内容如下：version:'2.2'services:es01:image:elasticsearch:7.12
Elasticsearch8 - Docker安装Elasticsearch8.12.2 王谷雨_ ElasticSearch elasticsearch docker
前言最近在学习ES，所以需要在服务器上装一个单节点的ES服务器环境：centos7.9安装下载镜像目前最新版本是8.12.2dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.12.2创建配置新增配置文件elasticsearch.ymlhttp.host:0.0.0.0http.cors.enabled:truehttp.cors.
elasticsearch同步mysql数据库神器之go-mysql-elasticsearch 强哥的博客数据库
go-mysql-elasticsearch是国内作者开发的一款插件。测试表明：该插件优点：能实现同步增、删、改、查操作。不足之处（待完善的地方）：1、日志不是很详细，但是能满足基本需求；2、初始化时，无法自动同步mysql中存在的以前的数据，需要自行解决初始导入（如重建索引批量导入）go-mysql-elasticsearch安装步骤1：安装goyuminstallgo步骤2：安装godepgo
ELK离线安装和配置流程 GB9125 运维开发 elasticsearch elk linux 运维开发
ELK离线安装和配置流程一、介绍ELK是一个开源的数据分析和可视化工具，由三个开源项目组成：Elasticsearch、Logstash和Kibana。Elasticsearch是一个基于Lucene库的分布式搜索和分析引擎；Logstash是一个用于收集、处理和转换数据的数据管道，它可以从各种来源读取数据，包括日志文件、系统事件、网络流量等；Kibana则是一个数据可视化平台，可以对从Elast
javaweb个人博客系统-第二版—项目概述 Sunflow007
22.jpg2018.11.08更新：代码更新已提交github，更新如下：1.Elasticsearch全文检索——之前说过的Elasticseach，现在终于加上了，附带Logstash定时增量导入Mysql中的数据。2.增加和完善了用户收藏、评论区创建讨论和点赞的功能3.个人中心查看已收藏文章的功能、个人中心上传图片(按时间线排列的照片墙)的功能下一步要做的事：1.完善功能、修改bug和代码
【Elasticsearch】从零开始搭建ES8集群并且集成到Springboot，更好的服务电商类等需要全文索引的项目（一） Smily清禾酥酒中间件 elasticsearch spring boot lucene java 全文检索
从零开始搭建Elasticsearch集群（一）从零开始搭建Elasticsearch8.6集群（一）简单介绍下Elasticsearch，以及为何使用它下载Elasticsearch准备服务器解压安装配置文件elasticsearch.yml修改调整JVM运行内存设置密码证书认证1.生成证书2.生成秘钥3.迁移凭证地址到config目录下4.其他集群都要将这个凭证移动到这个ES安装的config
164Elasticsearch 基础入门--elasticsearch之mapping Jachin111
实验原理elasticsearchmapping简介Mapping对应数据库里的表定义，我们都知道数据库表有各种字段每种字段使用场景是不一样，mapping中字段也类似数据库字段，定义形式不同搜索场景也不同，mapping还有一些其他的含义，mapping不仅告诉ES一个field中是什么类型的值，它还告诉ES如何索引数据以及数据是否能被搜索到，Mapping是对于index上每种type的定义。
二十二、elasticSearch的most-fields策略书写只为分享
1、most-fields策略best-fields策略，主要是说将某一个field匹配尽可能多的关键词的doc优先返回回来most-fields策略，主要是说尽可能返回更多field匹配到某个关键词的doc，优先返回回来，用法和上面的一样当我们相查找与learningcourses相关的数据时如果数据如下：{"update":{"_id":"1"}}{"doc":{"sub_title":"le
Elasticsearch(11) intervals的使用 2跬步9 elastic的学习笔记 elasticsearch
elasticsearchversion7.10.1在Elasticsearch中，intervals查询是用来做复杂的区间表达式匹配的，它可以基于分析过的文本字段执行一系列复杂的关系运算。intervals查询特别适合于那些需要对文本数据进行模式匹配，而不只是单一词汇匹配的情况。intervals语法POST_search{"query":{"intervals":{"my_text":{"al
高效的ElasticSearch Java API - my-elasticsearch-starter 南天一梦N 中间件技术 elasticsearch java jenkins spring
ESJavaApi有很多种，本文主要是基于SpringBoot进行封装的，为什么选择SpringBoot，可以看往期文章Elasticsearch入门必读指南：到底选择哪个ES版本更合适。SpringBoot现在也是Java生态中最主流的开发框架，综上没有理由不使用，所以本文及提供的starter也以此为基础。一、背景以往业务应用中使用ES很多依赖的是spring-boot-starter-dat
基于ElasticSearch存储海量AIS数据-架构设计篇 iOS逆向数据库技能 elasticsearch 大数据搜索引擎
文章目录引言I背景II数据集群架构选型2.1关键点2.2架构设计2.3数据迁移工具:Canal关键词：时空索引；船舶自动识别系统；轨迹压缩；数据集群引言船舶自动识别系统(AIS)数据具有海量性、时空性和小记录频繁更新等特性。面向海量AIS数据，提出了一种基于分布式集群的AIS数据存储方法。该方法对AIS数据存储索引结构进行了设计，通过对时间维按月切分，以及对空间范围聚类切分，构造了索引时空立方体，
Spring Data访问Elasticsearch（一）----Elasticsearch客户端 85程序员老王 Elasticsearch elasticsearch 大数据搜索引擎
SpringData访问Elasticsearch（一）----Elasticsearch客户端一、命令式Rest客户端二、反应式（Reactive）Rest客户端三、客户端配置3.1客户端配置回调3.1.1底层ElasticsearchRestClient的配置:3.1.2底层ElasticsearchRestClient使用的HttpAsyncClient配置:四、客户端日志本文演示了支持的E
Windows安装Elasticsearch8.x保姆级教程柳衣白卿 windows elasticsearch
Elasticsearch下载安装下载：点击https://www.elastic.co/cn/downloads/elasticsearch--＞点击Viewpastreleases-->找到8.11.1版本的ES--->点击下载---目前最新版的SpringDataES最高支持8.11.1版本elasticsearch与JDK版本：https://www.elastic.co/cn/suppo
Elasticsearch详解es 思静语 elasticsearch elasticsearch 大数据搜索引擎
文章目录概述es架构为什么要使用ElasticSearchElasticSearch的优势使用场景es为什么这么快倒排索引如何保证ES和数据库的数据一致性监听binlog同步双写elasticsearch是如何实现master选举的Elasticsearch与Solr的区别概述ES全称是ElasticSearch，它是一个建立在全文搜索引擎库Lucene基础上的开源搜索和分析引擎。ES它本身具有分
Elastic Stack--10--QueryBuilders UpdateQuery 知行合一。。。常用数据库 jenkins 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录QueryBuildersESUtilQueryBuilderspackagecom.elasticsearch;importorg.elasticsearch.action.ActionListener;importorg.elasticsearch.action.search.SearchResponse;importor
探秘Elasticsearch：高性能搜索引擎的原理与应用场景（一）凛鼕将至搜索引擎 elasticsearch 大数据
本系列文章简介：本系列文章将探秘Elasticsearch的原理与应用场景，从基本原理到具体应用，带领读者全面了解这一强大的搜索引擎。首先我们将介绍Elasticsearch的基本原理，包括分布式架构、倒排索引和分片等核心概念。然后我们将深入探讨Elasticsearch的搜索原理，包括查询解析、相似度计算和布尔搜索等关键技术。接着我们将讨论Elasticsearch的索引和映射，了解如何对文档进
为什么不要使用elasticsearch 水的精神 Elasticsearch ES搜索优化 elasticsearch 大数据搜索引擎
互联网上有很多文章，都在讲为什么要使用elasticsearch，却很少有人讲为什么不要使用elasticsearch。作为深入研究elasticsearch四年，负责公司万亿级别检索的操盘手，借着这篇文章，给大家分享一下，为什么不要使用elasticsearch。一、不要使用的理由1.学习成本elasticsearch的文档蛮多的，而且看一遍什么用都没有，而且看一遍的时间成本很长。但是多看几遍，
为什么要使用ElasticSearch？ z.jiaminf ElasticSearch elasticsearch 大数据搜索引擎
ElasticSearch是一个开源的分布式搜索和分析引擎，主要适用于以下场景：1.搜索引擎：用于快速检索文档，商品，新闻等。2.日志分析：通过分析日志数据，帮助企业了解其业务的性能情况。3.数据分析：帮助数据科学家和数据分析师进行数据分析，以获取有价值的信息。4.商业智能：帮助企业制定数据驱动的决策，以实现商业上的成功。5.实时监控：帮助企业实时监测系统性能，监控数据变化，以保证系统正常运行。6
ElasticSearch 模糊查询嘟嘟嘟嘟嘟嘟222 ElasticSearch elasticsearch
前缀搜索#前缀搜索注意：前缀搜索匹配的是trem,而不是filed，倒排索引的分词性能比较差，没有缓存搜索时尽量把前缀词设置长一点GET/product/_search{"query":{"prefix":{"name":{"value":"小米"}}}}通配符通配搜索匹配的是tremGET/product/_search{"query":{"wildcard":{"name":{"value":
ElasticSearch 与java的结合使用（二）嘟嘟嘟嘟嘟嘟222 ElasticSearch elasticsearch
不同类型商品数量{"size":0,"aggs":{"type_group":{"terms":{"field":"type.keyword"}}}}SearchRequestrequest=newSearchRequest();request.indices("product");//按照类型分组统计数量AggregationBuildertype=AggregationBuilders.ter
选型搜索引擎之参考Elasticsearch 剑飞的编程思维 elasticsearch
简介Elasticsearch（简称ES）是一个基于ApacheLucene的开源、分布式、RESTful接口的全文搜索引擎。其设计用于云计算环境，能够达到实时搜索、稳定、可靠、快速、安装使用方便的效果。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。Elasticsearch的特点包括：分布式存储和搜索：Elasticsear
31.Elasticsearch集群故障排查及修复-2 大勇任卷舒
31.1定位红色或黄色的索引进一步定位未分配的原因可以要求集群进一步返回给定分片的当前分配情况和逻辑需要结合第三步返回结果对下面的_cluster/allocation/explainAPI参数进行修改GET/_cluster/allocation/explain{"index":"my_index_003","shard":0,"primary":false}一些常见的问题包括：磁盘空间不足分片
ElasticSearch为什么快？ z.jiaminf ElasticSearch elasticsearch 大数据搜索引擎
ElasticSearch是一个高性能，分布式搜索引擎，它之所以快，主要有以下几个原因：1.分布式存储：ElasticSearch使用分布式存储技术，将数据存储在多个节点上从而减少单个节点的压力，提高整体性能。2.索引分片：ElasticSearch把每个索引划分成多个分片，这样可以让查询操作并行化，从而提高查询速度。3.全文索引：ElasticSearch使用了高效的全文索引技术，把文档转化成可
ElasticSearch | Completion Suggester | Context Suggester 乌鲁木齐001号程序员
TheCompletionSuggesterCompletionSuggester提供了“自动完成（AutoCompletion）”的功能，用户每输入一个字符，就需要即时发送一个查询请求到后端查找匹配项；这种功能对性能的要求比较苛刻，ElasticSearch采用了不同的数据结构，而不是使用了倒排索引来实现；通过将Analyze的数据编码成FST和索引一起存放；FST会被ES整个加载进内存，从而达
Elasticsearch Completion Suggester 实战 tangwanggong 学习实践 Elasticsearch completion suggester
CompletionSuggester是ElasticsearchSearchAPIs中一种，主要用于输入框的自动补齐功能。我将通过字或者拼音首字母推荐成语的java程序作为实战演示。项目地址：https://github.com/tangwanggong/week-project/tree/master/week-1成语数据来源：https://github.com/pwxcoo/chinese
高效使用ELK 处理 SpringBoot 日志 zy_zeros elk spring boot 后端
在排查线上异常的过程中，查询日志总是必不可缺的一部分。现今大多采用的微服务架构，日志被分散在不同的机器上，使得日志的查询变得异常困难。工欲善其事，必先利其器。如果此时有一个统一的实时日志分析平台，那可谓是雪中送碳，必定能够提高我们排查线上问题的效率。本文带您了解一下开源的实时日志分析平台ELK的搭建及使用。ELK简介ELK是一个开源的实时日志分析平台，它主要由Elasticsearch、Logst
从入门到精通：Elasticsearch开发实践教程青年老年程序员 Elasticsearch学习 elasticsearch jenkins 大数据
Elasticsearch是一款开源的搜索引擎，它使用Lucene搜索库作为其核心搜索引擎。Elasticsearch使用RESTfulAPI进行交互，并支持多种数据类型的搜索和聚合。本教程将介绍Elasticsearch的基本原理，如何开发，以及如何在SpringBoot中使用Elasticsearch。Elasticsearch的原理Elasticsearch是一个分布式的文档存储和搜索引擎。
使用Elasticsearch 7.9.1实现对word，pdf，txt文件的全文内容检索 localhostAND elasticsearch 搜索引擎 lucene
使用Elasticsearch7.9.1实现对word，pdf，txt文件的全文内容检索POST/docwrite/_doc?pipeline=attachment{"name":"测试PDF2","type":"pdf","content":""}GET/docwrite/_search{"_source":["name","type"],"query":{"match":{"attachmen
elasticsearch 搜索怎么设置超时时间老程序员刘飞
SearchRequestBuilderbuilder；builder.setTimeout(TimeValue.timeValueMillis(1));本意是想es查询超过1毫秒就返回超时，但测试发现与想象的不一样。即使耗时100+毫秒也不会超时。setTimeout方法是不可靠的，解释如下：Sadly,itisabestefforttimeout,itsnotbeingcheckedonall
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl