为梦而来

Lucene(转)

Lucene 简介

Lucene 是一个基于 Java 的全文信息检索工具包，它不是一个完整的搜索应用程序，而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。

目前已经有很多应用程序的搜索功能是基于 Lucene 的，比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文本类型的数据建立索引，所以你只要能把你要索引的数据格式转化的文本的，Lucene 就能对你的文档进行索引和搜索。比如你要对一些 HTML 文档，PDF 文档进行索引的话你就首先需要把 HTML 文档和 PDF 文档转化成文本格式的，然后将转化后的内容交给 Lucene 进行索引，然后把创建好的索引文件保存到磁盘或者内存中，最后根据用户输入的查询条件在索引文件上进行查询。不指定要索引的文档的格式也使 Lucene 能够几乎适用于所有的搜索应用程序。

图 1 表示了搜索应用程序和 Lucene 之间的关系，也反映了利用 Lucene 构建搜索应用程序的流程：

图1. 搜索应用程序和 Lucene 之间的关系

索引和搜索

索引是现代搜索引擎的核心，建立索引的过程就是把源数据处理成非常方便查询的索引文件的过程。为什么索引这么重要呢，试想你现在要在大量的文档中搜索含有某个关键词的文档，那么如果不建立索引的话你就需要把这些文档顺序的读入内存，然后检查这个文章中是不是含有要查找的关键词，这样的话就会耗费非常多的时间，想想搜索引擎可是在毫秒级的时间内查找出要搜索的结果的。这就是由于建立了索引的原因，你可以把索引想象成这样一种数据结构，他能够使你快速的随机访问存储在索引中的关键词，进而找到该关键词所关联的文档。Lucene 采用的是一种称为反向索引（inverted index）的机制。反向索引就是说我们维护了一个词/短语表，对于这个表中的每个词/短语，都有一个链表描述了有哪些文档包含了这个词/短语。这样在用户输入查询条件的时候，就能非常快的得到搜索结果。我们将在本系列文章的第二部分详细介绍 Lucene 的索引机制，由于 Lucene 提供了简单易用的 API，所以即使读者刚开始对全文本进行索引的机制并不太了解，也可以非常容易的使用 Lucene 对你的文档实现索引。

对文档建立好索引后，就可以在这些索引上面进行搜索了。搜索引擎首先会对搜索的关键词进行解析，然后再在建立好的索引上面进行查找，最终返回和用户输入的关键词相关联的文档。

Lucene 软件包分析

Lucene 软件包的发布形式是一个 JAR 文件，下面我们分析一下这个 JAR 文件里面的主要的 JAVA 包，使读者对之有个初步的了解。

Package: org.apache.lucene.document

这个包提供了一些为封装要索引的文档所需要的类，比如 Document, Field。这样，每一个文档最终被封装成了一个 Document 对象。

Package: org.apache.lucene.analysis

这个包主要功能是对文档进行分词，因为文档在建立索引之前必须要进行分词，所以这个包的作用可以看成是为建立索引做准备工作。

Package: org.apache.lucene.index

这个包提供了一些类来协助创建索引以及对创建好的索引进行更新。这里面有两个基础的类：IndexWriter 和 IndexReader，其中 IndexWriter 是用来创建索引并添加文档到索引中的，IndexReader 是用来删除索引中的文档的。

Package: org.apache.lucene.search

这个包提供了对在建立好的索引上进行搜索所需要的类。比如 IndexSearcher 和 Hits, IndexSearcher 定义了在指定的索引上进行搜索的方法，Hits 用来保存搜索得到的结果。

一个简单的搜索应用程序

假设我们的电脑的目录中含有很多文本文档，我们需要查找哪些文档含有某个关键词。为了实现这种功能，我们首先利用 Lucene 对这个目录中的文档建立索引，然后在建立好的索引中搜索我们所要查找的文档。通过这个例子读者会对如何利用 Lucene 构建自己的搜索应用程序有个比较清楚的认识。

建立索引

为了对文档进行索引，Lucene 提供了五个基础的类，他们分别是 Document, Field, IndexWriter, Analyzer, Directory。下面我们分别介绍一下这五个类的用途：

Document

Document 是用来描述文档的，这里的文档可以指一个 HTML 页面，一封电子邮件，或者是一个文本文件。一个 Document 对象由多个 Field 对象组成的。可以把一个 Document 对象想象成数据库中的一个记录，而每个 Field 对象就是记录的一个字段。

Field

Field 对象是用来描述一个文档的某个属性的，比如一封电子邮件的标题和内容可以用两个 Field 对象分别描述。

Analyzer

在一个文档被索引之前，首先需要对文档内容进行分词处理，这部分工作就是由 Analyzer 来做的。Analyzer 类是一个抽象类，它有多个实现。针对不同的语言和应用需要选择适合的 Analyzer。Analyzer 把分词后的内容交给 IndexWriter 来建立索引。

IndexWriter

IndexWriter 是 Lucene 用来创建索引的一个核心的类，他的作用是把一个个的 Document 对象加到索引中来。

Directory

这个类代表了 Lucene 的索引的存储的位置，这是一个抽象类，它目前有两个实现，第一个是 FSDirectory，它表示一个存储在文件系统中的索引的位置。第二个是 RAMDirectory，它表示一个存储在内存当中的索引的位置。

熟悉了建立索引所需要的这些类后，我们就开始对某个目录下面的文本文件建立索引了，清单1给出了对某个目录下的文本文件建立索引的源代码。

清单 1. 对文本文件建立索引

package TestLucene; import java.io.File; import java.io.FileReader; import java.io.Reader; import java.util.Date; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; /** * This class demonstrate the process of creating index with Lucene * for text files */ public class TxtFileIndexer { public static void main(String[] args) throws Exception{ //indexDir is the directory that hosts Lucene's index files File indexDir = new File("D:\\luceneIndex"); //dataDir is the directory that hosts the text files that to be indexed File dataDir = new File("D:\\luceneData"); Analyzer luceneAnalyzer = new StandardAnalyzer(); File[] dataFiles = dataDir.listFiles(); IndexWriter indexWriter = new IndexWriter(indexDir,luceneAnalyzer,true); long startTime = new Date().getTime(); for(int i = 0; i < dataFiles.length; i++){ if(dataFiles[i].isFile() && dataFiles[i].getName().endsWith(".txt")){ System.out.println("Indexing file " + dataFiles[i].getCanonicalPath()); Document document = new Document(); Reader txtReader = new FileReader(dataFiles[i]); document.add(Field.Text("path",dataFiles[i].getCanonicalPath())); document.add(Field.Text("contents",txtReader)); indexWriter.addDocument(document); } } indexWriter.optimize(); indexWriter.close(); long endTime = new Date().getTime(); System.out.println("It takes " + (endTime - startTime) + " milliseconds to create index for the files in directory " + dataDir.getPath()); } }

在清单1中，我们注意到类 IndexWriter 的构造函数需要三个参数，第一个参数指定了所创建的索引要存放的位置，他可以是一个 File 对象，也可以是一个 FSDirectory 对象或者 RAMDirectory 对象。第二个参数指定了 Analyzer 类的一个实现，也就是指定这个索引是用哪个分词器对文挡内容进行分词。第三个参数是一个布尔型的变量，如果为 true 的话就代表创建一个新的索引，为 false 的话就代表在原来索引的基础上进行操作。接着程序遍历了目录下面的所有文本文档，并为每一个文本文档创建了一个 Document 对象。然后把文本文档的两个属性：路径和内容加入到了两个 Field 对象中，接着在把这两个 Field 对象加入到 Document 对象中，最后把这个文档用 IndexWriter 类的 add 方法加入到索引中去。这样我们便完成了索引的创建。接下来我们进入在建立好的索引上进行搜索的部分。

搜索文档

利用Lucene进行搜索就像建立索引一样也是非常方便的。在上面一部分中，我们已经为一个目录下的文本文档建立好了索引，现在我们就要在这个索引上进行搜索以找到包含某个关键词或短语的文档。Lucene提供了几个基础的类来完成这个过程，它们分别是呢IndexSearcher, Term, Query, TermQuery, Hits. 下面我们分别介绍这几个类的功能。

Query

这是一个抽象类，他有多个实现，比如TermQuery, BooleanQuery, PrefixQuery. 这个类的目的是把用户输入的查询字符串封装成Lucene能够识别的Query。

Term

Term是搜索的基本单位，一个Term对象有两个String类型的域组成。生成一个Term对象可以有如下一条语句来完成：Term term = new Term(“fieldName”,”queryWord”); 其中第一个参数代表了要在文档的哪一个Field上进行查找，第二个参数代表了要查询的关键词。

TermQuery

TermQuery是抽象类Query的一个子类，它同时也是Lucene支持的最为基本的一个查询类。生成一个TermQuery对象由如下语句完成： TermQuery termQuery = new TermQuery(new Term(“fieldName”,”queryWord”)); 它的构造函数只接受一个参数，那就是一个Term对象。

IndexSearcher

IndexSearcher是用来在建立好的索引上进行搜索的。它只能以只读的方式打开一个索引，所以可以有多个IndexSearcher的实例在一个索引上进行操作。

Hits

Hits是用来保存搜索的结果的。

介绍完这些搜索所必须的类之后，我们就开始在之前所建立的索引上进行搜索了，清单2给出了完成搜索功能所需要的代码。

清单2 ：在建立好的索引上进行搜索

package TestLucene; import java.io.File; import org.apache.lucene.document.Document; import org.apache.lucene.index.Term; import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.TermQuery; import org.apache.lucene.store.FSDirectory; /** * This class is used to demonstrate the * process of searching on an existing * Lucene index * */ public class TxtFileSearcher { public static void main(String[] args) throws Exception{ String queryStr = "lucene"; //This is the directory that hosts the Lucene index File indexDir = new File("D:\\luceneIndex"); FSDirectory directory = FSDirectory.getDirectory(indexDir,false); IndexSearcher searcher = new IndexSearcher(directory); if(!indexDir.exists()){ System.out.println("The Lucene index is not exist"); return; } Term term = new Term("contents",queryStr.toLowerCase()); TermQuery luceneQuery = new TermQuery(term); Hits hits = searcher.search(luceneQuery); for(int i = 0; i < hits.length(); i++){ Document document = hits.doc(i); System.out.println("File: " + document.get("path")); } } }

在清单2中，类IndexSearcher的构造函数接受一个类型为Directory的对象，Directory是一个抽象类，它目前有两个子类：FSDirctory和RAMDirectory. 我们的程序中传入了一个FSDirctory对象作为其参数，代表了一个存储在磁盘上的索引的位置。构造函数执行完成后，代表了这个IndexSearcher以只读的方式打开了一个索引。然后我们程序构造了一个Term对象，通过这个Term对象，我们指定了要在文档的内容中搜索包含关键词”lucene”的文档。接着利用这个Term对象构造出TermQuery对象并把这个TermQuery对象传入到IndexSearcher的search方法中进行查询，返回的结果保存在Hits对象中。最后我们用了一个循环语句把搜索到的文档的路径都打印了出来。好了，我们的搜索应用程序已经开发完毕，怎么样，利用Lucene开发搜索应用程序是不是很简单。

最近要做一个站内的全文检索功能，主要是针对clob字段的，于是去网上找了点lucene的资料，现在新版本的是2.0.0，网上的例子多是1.4.3的，有些方法已经废弃了，搞了n久终于把2.0.0的功能实现了，呵呵，下面把实现的代码贴出来，实现了索引的创建、检索和删除功能，并可以从检索结果去查询数据库~

// 创建索引

public void indexFiles() {

// 创建索引文件存放路径

File indexDir = new File("E:\\lucene_Learning\\lucene-2.0.0src\\src\\demo\\index");

try {

Date start = new Date();

// 创建分析器,主要用于从文本中抽取那些需要建立索引的内容,把不需要参与建索引的文本内容去掉.

// 比如去掉一些a the之类的常用词,还有决定是否大小写敏感.

StandardAnalyzer standardAnalyzer = new StandardAnalyzer();

// 参数true用于确定是否覆盖原有索引的

IndexWriter indexWriter = new IndexWriter(indexDir, standardAnalyzer, true);

indexWriter.setMergeFactor(100);

indexWriter.setMaxBufferedDocs(100);

// 只索引这个Field的前5000个字，默认为10000

indexWriter.setMaxFieldLength(5000);

// 从数据库取出所有纪录

List articleList = articleManager.getArticles(null);

for (int i = 0; i < articleList.size(); i++) {

Article article = (Article) articleList.get(i);

// 在Document方法是创建索引的具体代码

Document doc = Document(article);

indexWriter.addDocument(doc);

}

// Optimize的过程就是要减少剩下的Segment的数量,尽量让它们处于一个文件中.

indexWriter.optimize();

indexWriter.close();

Date end = new Date();

System.out.println("create index: " + (end.getTime() - start.getTime()) + " total milliseconds");

} catch (IOException e) {

System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());

}

public static Document Document(Article article) throws java.io.IOException {

Document doc = new Document();

// 为article表的主健创建索引，关于Field的几个参数下面有详细解释

Field fieldId = new Field("uid", article.getArticleId(), Field.Store.YES, Field.Index.UN_TOKENIZED,

Field.TermVector.YES);

// 为detail字段创建索引，detail在DB中是clob字段，内容为html文本

String contentHtml = article.getDetail();

Reader read = new StringReader(contentHtml);

// 用HTMLParser把detail字段中的HTML分析成文本在索引

// HTMLParser这个类可以在lucene的demo中找到

HTMLParser htmlParser = new HTMLParser(read);

BufferedReader breader = new BufferedReader(htmlParser.getReader());

String htmlContent ="";

String tempContent = breader.readLine();

while (tempContent != null && tempContent.length() > 0) {

htmlContent = htmlContent + tempContent;

tempContent = breader.readLine();

}

Field fieldContents = new Field("content", htmlContent,

Field.Store.COMPRESS, Field.Index.TOKENIZED,Field.TermVector.YES);

// db中的每条纪录对应一个doc，每个字段对应一个field

doc.add(fieldId);

doc.add(fieldContents);

return doc;

}

// 搜索文件，keyword是你在页面上输入的查找关键字，这里查找的是detail字段

public List searchFiles(String keyword){

String index = "E:\\lucene_Learning\\lucene-2.0.0src\\src\\demo\\index";

// hitsList用来保存db的纪录，这些纪录可以通过查询结果取到

List hitsList = new ArrayList();

try {

Date start = new Date();

IndexReader reader = IndexReader.open(index);

Searcher searcher = new IndexSearcher(reader);

Analyzer analyzer = new StandardAnalyzer();

QueryParser parser = new QueryParser("content", analyzer);

// 解析查询关键字，比如输入的是以空格等分开的多个查询关键字，这里解析后，可以多条件查询

Query query = parser.parse(keyword);

// hits用来保存查询结果，这里的hits相当于sql中的result

Hits hits = searcher.search(query);

for (int i = 0; i < hits.length(); i++) {

Document doc = hits.doc(i);

// 获得article表的主健

String uid");

// 根据主健去db中取纪录，返回到hitsList中

try {

Article article = articleManager.getArticle(id);

} catch (ObjectRetrievalFailureException e) {

article = null;

}

// 如果没有找到该纪录，表示该纪录已经不存在，不必添加到hitsList中

if(article!=null) hitsList.add(article);

}

searcher.close();

reader.close();

Date end = new Date();

System.out.println("search files: " + (end.getTime() - start.getTime()) + " total milliseconds");

} catch (IOException e) {

System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());

} catch (ParseException e) {

System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());

}

return hitsList;

}

// 删除索引

public void deleteIndex(){

String index = "E:\\lucene_Learning\\lucene-2.0.0src\\src\\demo\\index";

try {

Date start = new Date();

IndexReader reader = IndexReader.open(index);

int numFiles = reader.numDocs();

for (int i = 0; i < numFiles; i++) {

// 这里的删除只是给文档做一个删除标记，你可以看到执行deleteDocument后会产生一个del后缀的文件，

// 用来记录这些标记过的文件

reader.deleteDocument(i);

}

reader.close();

Date end = new Date();

System.out.println("delete index: " + (end.getTime() - start.getTime()) + " total milliseconds");

} catch (IOException e) {

System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());

}

// 恢复已删除的索引

public void unDeleteIndex(){

String index = "E:\\lucene_Learning\\lucene-2.0.0src\\src\\demo\\index";

try {

IndexReader reader = IndexReader.open(index);

reader.undeleteAll();

reader.close();

} catch (IOException e) {

System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());

}

Field就像我们学过的数据库中的字段，简单的说，就是一个名值对。这个域有三种属性，分别是

isStored - 是否被存储

isIndexed - 是否被索引

isTokenized - 是否分词

这些属性的组合又构成了四种不同类型的Field，而且各有用途

	Stored	Indexed	Tokenized
Keyword	Y	Y	N
UnIndexed	Y	N	N
UnStored	N	Y	Y
Text: String	Y	Y	Y
Text : Reader	N	Y	Y

关于Field，2.0.0版本和1.4.3版本方法相比改动比较大，具体见下表

1.4.3版本中的下面方法都被Field(String name, String value, Store store, Index index, TermVector termVector)取代

Keyword(String name, String value) // only version 1.4.3

存储、索引、不分词，用于URI（比如MSN聊天记录的日期域、比如MP3文件的文件全路径等等）

Field(String name, String value, Field.Store.YES, Field.Index.UN_TOKENIZED) // version 2.0.0

UnIndexed(String name, String value) // only version 1.4.3

存储、不索引、不分词，比如文件的全路径

Field(String name, String value,Field.Store.YES, Field.Index.NO) // version 2.0.0

UnStored(String name, String value) // only version 1.4.3

不存储、索引、分词，比如HTML的正文、Word的内容等等，这部分内容是要被索引的，但是由于具体内容通常很大，没有必要再进行存储，可以到时候根据URI再来挖取。所以，这部分只分词、索引，而不存储。

Field(String name, String value,Field.Store.YES, Field.Index.TOKENIZED)// version 2.0.0

Text(String name, String value) // only version 1.4.3

存储、索引、分词，比如文件的各种属性，比如MP3文件的歌手、专辑等等。Field.Store.YES, Field(String name, String value,Field.Index.TOKENIZED)// version 2.0.0

Text(String name, Reader value) // only version 1.4.3

Field(String name, Reader reader) // version 2.0.0

不存储、索引、分词。

你可能感兴趣的:(Lucene(转))

IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
《路远连着天》第二章在路上 7 亚宁
大路镇的街道两旁尽是店铺，气派者是红门柱子雕花门窗，一般则多为布匹小百货店，还有几家门面朝外的车马大店，和一家颇有气势的典当铺。街上来往人还真不少，有挑担叫卖水果的，有背篓子路过的，还有衣冠楚楚，悠哉悠哉，甩着双手散步的有钱爷。耿六想着先寻姑妈家，还是先到兵营看那几个土匪呢？也只是一转念，他选择了后者，跟在几个闲人后，就来到了在镇外山头上曾看到过的那处飘着晴天白日旗的兵营门外。这里，围观的人乱哄哄
旋转安静的影子
图片发自App傍晚你带我们去万象城说是试营业到了大厦底下好家伙这么壮观我望向楼顶直达蓝天白云啊整个大楼似乎在转圈我蒙了又很奇妙的感觉我透过大厦望天空就感觉到在旋转真的感觉到动态的效果很神奇我慌忙叫你看快看快看大厦好像会旋转你说我知道知道知道也不知道你是否感觉到了真的很美妙的体会是天空在转吗我感觉大厦也在旋转很美妙很美妙图片发自App图片发自App
中原焦点团队党秀丽分享276天，约练268次，5月29日，周五润物无声dang
第十二次课，答疑解惑。1.咨询约练过程中遇到来访者上来就说想处理情绪，可是聊的过程中他又不想具体聊他的情绪怎么产生的，多久了，就是希望用外化技术处理他的情绪，我除了好奇是什么让他希望用外化呢，也用阳谋告诉他，外化前也是需要具体的聊聊这个情绪的，还可以怎么做呢？给他安全感这一块大概怎么做呢？不想具体说有他的道理，聊聊情绪大概是什么事儿？专业的认识，专业度的认可。不带功利心，转介几次的不太好，信任程度
感赏客户一克拉燕子
1，我感赏每次能吸引轻微的客户！一两瓶帮他们调理好！2，我感赏我的每一个客户用好了后都热心帮我介绍！3，我感赏每个镇上都能遇到客户转代理！5，我感赏附近有疼痛的人都主动加我！6，我感赏每天都有人主动找我做代理！7，我感赏以前体验过的客户都找我卖产品！8，我感赏我的团队越来越大！100人！9，我感赏团队每个人都是销售精英！都是积极主动，好学！10，我感赏以前咨询过我的人都来跟我代理可暖！11，我感赏
如何纠正过度养育，将孩子培养成合格的成年人呢？陌语啊
有些家长在孩子的成长过程中发现，自己对孩子的养育出现了问题。父母每天围着孩子转，孩子觉得应该的；家务活不会干，自己的东西总是找不到；娇蛮任性，动不动就对父母大喊大叫；性格孤僻，不愿结识朋友，整天与游戏为伴等。其实，这是过度养育的后果，那么我们改如何改正呢？作为父母，我们首先要思考一下孩子为什么会变成这样，是他们天性如此吗？显然不是，孩子刚出生时就是一张白纸，需要我们经过后天培养的。那么孩子出现一些
word转pdf、pdf转word在线工具分享 bpmh 常用工具 word pdf
️一、在线转换网站（方便快捷，无需安装）MicrosoftOfficeOnline(官方推荐，最安全可靠)：网址：直接使用你的Microsoft账户登录https://www.office.com/方法：将你的.docx或.doc文件上传到OneDrive。在OfficeOnline中打开该Word文档。点击文件>另存为>下载PDF副本。优点：官方出品，完全免费，无需额外上传到第三方服务器，安全性
探索高效文档转换新路径：Aspose.Words v18.7助力Word无缝变PDF 邴卉露Robust
探索高效文档转换新路径：Aspose.Wordsv18.7助力Word无缝变PDF【下载地址】Aspose.Wordsv18.7C示例源码Word转PDF无需安装Office本仓库提供了一个使用Aspose.Wordsv18.7将Word文档转换为PDF文档的C#示例源码。Aspose.Words是一个强大的.NET控件，允许开发者在不安装MicrosoftOffice的情况下读写Word文档，并
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
搜索引擎技术选型 dusty_giser
近期，业主对POI检索提出了一些想法，针对之前简单的WordSegment分词和模糊匹配搜索需要进行一些更为符合业主需求的调整。于是这几天对搜索引擎进行了一些技术选型；一、ApacheLucene Lucene是一个开源的高性能、可扩展的全文检索引擎工具包，但不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎。所以它是一套信息检索工具包，可以说是当今最先进
看图写诗No235 假如生活欺骗了你不要忧郁也不要愤慨短诗：只要环球慢旅程
只要我知道你在寻找爱的解药一颗心千疮百孔风吹过落雪无痕生活总是琢磨不透爱的路上总是百转千回天空不会永远是灰色你看希望似春天的花蕾在角落里绽放只要相信爱是生命中最大的奇迹时间的手里捧着治愈一切伤痛的解药只要耐心等待世间所有的色彩都会回来———环球慢旅程2020年12月28日关于“只要”这首诗的一点说明，怎么也不会想到，2020年会是这样可怕，2021年马上就要开始，看着欧洲愈演愈烈的疫情，真的是不知
第六十七章受刑一指弹江南
黑影从床边直起了身子，我朝他一瞧，个头不高，还是个驼子，心里顿时一跳，难道真是疤脸？我想动身子，却发现身子居然已经给捆的结结实实，感觉全身上下都给捆上了。黑影这时候一转身，从他那里传来“吧嗒”一声，房间里顿时有了光亮，借着光亮我朝那黑影一看，脑袋当即“嗡”了一声，完了，彻底完了，躲躲藏藏提心吊胆这么些天，还是没能躲过去，心一下子沉到了谷底，不知道接下来该咋办了。房间里这条黑影，正是疤脸，这时候他一
1022.与喵共舞496~周末颐和园摹喵居士
2018.11.25周日啦，天气没有完全转差，正好户外户外活动一下。来到了颐和园，现在已经是淡季了，没想到6岁还能免票。进入新建宫门。迎面就是十七孔桥。一起拍照，来的游客很少。远处的西堤，还没有游客。据说有五百多个石狮子。一只小狗出场了。兴高采烈地跑来跑去。树木已经光秃秃了。亲一下吧。远处的石舫，雾蒙蒙的。外面的树，好像一团烟雾。文昌阁，有点破落。万寿山上。落叶缤纷。这个小样子还挺标志。扑在妈妈身
一种植物合欢树 yingyingjilv789
2020.6.10周三32-24度雨转多云有时有阵雨这两天我路过广场，发现很多合欢树，开得挺漂亮的。合欢，又名绒花树，马缨花。落叶乔木，夏季开花，头状花序，合瓣花冠，雄蕊多条，淡红色。合欢生于山坡或栽培。合欢喜温暖湿润和阳光充足环境，对气候和土壤适应性强，宜在排水良好、肥沃土壤生长，但也耐瘠薄土壤和干旱气候，但不耐水涝。生长迅速。合欢，性喜光，喜温暖，耐寒、耐旱、耐土壤瘠薄及轻度盐碱，对二氧化硫、
2023-5-10晨间日记佳悦_1b1d
今天是什么日子今天是周三，下雨了，昨晚上因为微信转账转错人了的事情，搞得我睡得不安稳，差不多5点就醒了，睡不着了，去账单看那人还没有确认收款，我就想着我还能做些什么呢？于是我就通过自己摸索，在腾讯后台，自己把微信支付的账户给冻结了，没想到账户冻结了以后，只要对方在24小时之内接收也是可以收款的，而且十点多钟，客服给我打电话说是否需要他们帮助通知对方，我说需要，那时钱还是没接收的，没想到可能是因为他
骗术萧小放
为什么突然换了笔风，想写这样一篇文章，主要目的是为了给正整游走于股市边缘家人们提个醒，一定要记得天上不会掉馅饼这句箴言，赚钱不易，且用且谨慎！废话话不多说，直接进入正题。2016年的时候我在办理银行业务的时候顺带开了一个股票却一直未启用，菜鸟级别，说出来不怕你笑话，同事们都说不玩股票可以申购转债，中签即白捡，基本无风险，一千块钱搞定。即便是这样我也没有激活账户。2020年的疫情来领，行业不景气，坐
2022-09-05 双髻山府正堂
A项,公司章程是全体股东协商一致制定的公司内部最高效力的管理规范,且公司有利润并不意味着必须向股东分红,为了公司的发展战略,将利润留在公司并不违法,所以章程中规定公司成立前三年不分红的内容是有效的,A项错误。B项,异议股权回购的前提条件是:一,有股东会决议;二,决议涉及法定情形(连续5年盈利不分红、合并分立转财产、届满续命改章程);三,股东持反对意见。本案中,公司成立前三年不分红,是包括李某在内的
2022-03-23 良人相伴
2022.3.23星期三晴20/7咱也不知道绿码转黄码究竟都有哪些标准。中午和同事一起在外面小店吃过午饭，回到上班地点进门时习惯性扫码，其中一个同事很突然的就出现了黄码。听到她扫出了黄码，旁边站着的一个人走过来说他也扫出了黄码。奇怪的是，早上上班时他们都还是绿码。门口的保安大叔很负责，黄码是坚决不会让进大厅的。就这样，吃个饭的功夫就回不到工作岗位了。
微习惯的养成160（补8.17）大眼妹宝贝
任务：1、早睡早起：23点前休息，起床7：30-7：50。2、专业课学习开始，每科2页阅读。将这个习惯改为：每周至少3天学习专业课，2天书法练习，从6月1日起。3、肩颈运动：手臂上下摇摆50次，或者转肩膀50次。4、站桩或者静坐3分钟。5、读书一页。6、桑麻丸或芝麻丸：共2颗7、“90天秀发活动”梳头36下1、赶车，到了火车站，发现车票出了问题，改成明天早上走。折腾回家已经接近凌晨2点，早上8：3
立春的后几天涵笑_1654
今天是立春的第二天，可是天气还是没有变化，我原本以为立春天气就会变暖和。今天早上补课奶奶送我去的，寒风把我吹的瑟瑟发抖。脸上像被刀刮了一样。路上的雪还没有融化。路上的行人都把自己裹得严严实实的……中午的时候天气稍微暖和了，太阳晒在身上暖洋洋的。晚上我回家问妈妈立春了为什么天气还是这么冷呀。妈妈说立春只是二十节气的第一个而已，并不代表天气就会暖和呀，等过了数九寒天天气就会慢慢转暖了。图片发自App
[转]MFC窗体中打开第三方exe程序到指定区域 XiangDong_ MFC
2018年8月18日转发至：https://blog.csdn.net/tfygg/article/details/51174801流程如下：1、CreateProcess创建外部EXE进程2、获取指定区域的坐标3、查找进程的主窗口4、将外部程序移到指定区域5、调用ShowWindow显示窗口主程序如下：handle=StartProcess(“D:\\programtool\\SecureCRT
凤凰何其少童无忌的三樱园
宋代的文学家苏轼，不但诗词写得精彩，中国画也画得好。传说明朝一个员外偶然间得到了苏轼的《百鸟归巢图》，遍请状元伦文叙题一首诗，伦文叙也毫不含糊，提笔就写：天生一只又一只，三四五六七八只。员外一看，瞬间懵了？这是什么？打油诗吗？然而没等员外发问，伦文叙笔锋一转，又写下：凤凰何少鸟何多，啄尽人间千万石。员外看完后拍案叫绝，为什么呢？首先我们来看一下，画的标题中说是“百鸟”:题诗中却不见“百”字踪影，似
一级7机并联，二级单机构型的两级液体运载火箭入轨弹道设计_Part2 小亨GNC颐园火箭弹道数据驱动人工智能优化控制零攻角转弯
书接上文，上篇文章介绍了两级液体运载火箭的设计过程和设计结果。这期文章将介绍火箭飞行过程中弹道特征点的参数和详细的弹道数据，文末有两级液体火箭详细弹道数据的下载链接，对于需要大量样本数据进行大模型学习训练的人工智能研发人员和数据驱动弹道优化设计的从业者可以重点关注一下。特征点弹道参数为飞行时序Time(s)H(km)Vg(m/s)射程S(km)火箭起飞0.0000.0500.0000.000一级转
C#与halcon联合（3）文本写入可以改变字体大小类型及绘画直线图形十字叉箭头轮廓
这里写目录标题1.操作demo2.绘画直线及显示①在halcon中的操作代码如下②转换成C#代码并将其封装成函数如下3.绘画圆形及显示其轮廓（XLD）①在halcon中的操作代码如下②转换成C#代码并将其封装成函数如下4.绘画普通矩形及轮廓显示（XLD）①在halcon中的操作代码如下②转换成C#代码并将其封装成函数如下5.绘画角度可调矩形及其轮廓显示（XLD）①在halcon中的操作代码如下②转
周日上班幸福种子成长陕西三原分群群主
1、坚持瑜伽，年龄的问题，休息两天身体就缺柔软，累并快乐着！2、下午带婆婆带汪出去转，慢生活，感受那个当下，婆婆健康，狗狗开心，我很有价值！！3、去看望一个姐姐；把之前做的事情进行简单小结，便于提高下次办事效率；有两个朋友把我的产品帮忙分享出去，随喜朋友的影响力，感恩钱宝宝的流动！
2019-03-27day20课堂笔记故此曦
day20课堂笔记磁盘历史和内外部物理结构介绍1956年IBM发布磁盘1980年出现现代磁盘体积更小存储密度跟高速度更快读写更灵敏的磁头，接口更先进容量更大h存储密度更高，介质更好使用更安全数据保持保护技术硬盘的六个层次：SSD优点：SSD缺点：SSD固态盘与传统机械磁盘对比：企业磁盘选型：1、企业级SAS硬盘（默认）：15000转/分满足容量的基础上尽量保持四块磁盘，给客户用，用SAS盘。2、企
现在的我迷茫了，不知人生去往何处叶子jvy
身在西安上大学的我，现在才大一，学编辑出版学的我开始想转专业，成绩的硬性要求我达到了，现在我犹豫的是要不要转专业的问题，虽然说我们这个学校是法学类学校，但是因为学法后我如果拿不下律师资格证我并不知道我学了法出来能干嘛，律师，法官这些都将与我失之交臂。这样的后果我承受不了，因为我身为农村孩子，不能只考虑眼前，还要做长远的打算，为以后找到工作而学习吧。所以大伙儿能给我点建议不?我现在很迷茫，不只在大学
《中医黑与瞎子摸象》 87410fc487d0
收到了这个评论，我明白了中医黑如何才能转中医粉？一位署名“被西医毒害…”的钢粉，说，自己从（被）小滥用抗生素，恶性循环，几十年。前几年胸闷，手臂因缺氧而发抖，烦躁，拍片显示肺纹理增粗，胸膜增厚.，去西医治疗却说没事。后来找到中医治疗后很快康复，由中医黑转中医粉，开始自学中医。另一位是慢性咽炎，西医只能激光手术，结果几副中药好了。看到一部分人盲目跟风，做了中医黑，当自己碰到顽疾束手无策时，巧合遇到了
AI技术落地的综合实战经验报告，结合最新行业案例、代码示例及可视化图表，系统阐述AI在开发提效、算法优化与行业应用中的实践路径。
一、自动化开发革命：从代码生成到低代码架构1.1自然语言转代码（NL2Code）实战技术架构基于GPT-4/Codex的代码生成器实现以下流程：graphTDA[自然语言输入]-->B(GPT-4/Codex解析)B-->C{代码解析器}C-->D[Python/Java/SQL]C-->E[测试用例]D-->F[代码质量检测]F-->G[可执行程序]典型场景：数据清洗函数生成python#输入提
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$