- IK分词
初心myp
实现简单的分词功能,智能化分词添加依赖配置:4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
- 包含日志获取webshell
陈望_ning
日志文件关闭:Apache目录下的httpd.conf文件#ErrorLog"logs/error.log"#CustomLog"logs/access.log"common加#号为注释不产生日志文件如果去掉#将会在Apache/logs/目录下产生日志文件linux:access_logerror_logwindows:access.logerror.logaccess_log每一行记录了一次网
- 人工智能应用研究快讯 2021-11-30
峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
- docker-基础入门
docker入门dockers安装1.首先如果系统中已经存在旧的Docker,则先卸载:yumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\docker-logrotate\docker-engine\docker-selinux2.配置Dock
- 【Appium】selenium.common.exceptions.WebDriverException: Message: The requested resource could not be
枫萏
Appium踩坑达人appium
1、报错内容(1)脚本报错内容在PyCharm编写好脚本后,模拟器和appium也是连接成功的,但是运行脚本时报错:selenium.common.exceptions.WebDriverException:Message:Therequestedresourcecouldnotbefound,orarequestwasreceivedusinganHTTPmethodthatisnotsuppo
- 探秘CommonJS:Node.js模块化核心解析
CommonJS是JavaScript的模块化规范,主要应用于服务器端环境(尤其是Node.js),其核心目标是解决代码组织、依赖管理和作用域隔离问题。以下是其核心要点:一、核心特性同步加载模块通过require()同步加载并执行,后续代码需等待模块加载完成后执行,适用于I/O快速的服务器环境(如本地文件读取)。作用域隔离每个文件视为独立模块,模块内定义的变量、函数默认私有(不污染全局作用域),仅
- centos 配置docker
一、卸载旧版本(如有)sudoyumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\docker-logrotate\docker-engine二、安装依赖包sudoyuminstall-yyum-utilsdevice-mapper-persis
- Python 使用期物处理并发(显示下载进度并处理错误)
显示下载进度并处理错误前面说过,17.1节中的几个脚本没有处理错误,这样做是为了便于阅读和比较三种方案(依序、多线程和异步)的结构。为了处理各种错误,我创建了flags2系列示例。flags2_common.py这个模块中包含所有flags2示例通用的函数和设置,例如main函数,负责解析命令行参数、计时和报告结果。这个脚本中的代码其实是提供支持的,与本章的话题没有直接关系,因此我把源码放在附录A
- 浅谈经典开发工具之Visual C++ 6.0
写写闲篇儿
c++开发语言
如大家所了解的,MicrosoftVisualC++6.0(简称VC6.0)是微软公司于1998年推出的经典C++集成开发环境(IDE),主要用于Windows平台下的程序开发,集成了编译器、调试器、MFC库等工具,至今仍用于旧项目维护和教学。VisualC++6.0(commonlyknownasVC6),whichincludedMFC6.0,wasreleasedin1998.国内许多高
- WEB安全--Java安全--jsp webshell免杀
1.1、BCELClassLoader介绍(仅适用于BCEL6.0以下):BCEL(ApacheCommonsBCEL™)是一个用于分析、创建和操纵Java类文件的工具库;BCEL的类加载器在解析类名时会对ClassName中有BCEL标识的类做特殊处理,该特性经常被用于编写各类攻击Payload。当BCEL的loadClass加载一个类名中带有BCEL$$”的类时会截取出BCEL后面的字符串,然
- 三、搭建springCloudAlibaba2021.1版本分布式微服务-springcloud loadbalancer负载均衡
什么是负责均衡SpringCloudLoadBalancer是一个客户端负载均衡器,类似于Ribbon,但是由于Ribbon已经进入维护模式,并且Ribbon2并不与Ribbon1相互兼容,所以SpringCloud全家桶在SpringCloudCommons项目中,添加了SpringcloudLoadbalancer作为新的负载均衡器,并且做了向前兼容,就算你的项目中继续用SpringCloud
- PF4J+SpringBoot
QingyunChen
javaspringboot后端java
plugin-commonpom.xml相关配置pub.qingyunplugin-common0.0.1-SNAPSHOT插件配置类org.pf4jpf4j3.12.0org.apache.maven.pluginsmaven-assembly-plugintruecommon-impl0.0.1jar-with-dependenciesmake-assemblypackagesingle插件服
- Guava教程:Google工程师的“Java糖果罐“
zhysunny
Java类库guavajava
目录Guava是什么?6颗最甜的Guava"糖果"1️⃣集合工具:比JDK更聪明的容器2️⃣不可变集合:防御式编程利器3️⃣函数式编程:让Java也能优雅4️⃣字符串处理:比ApacheCommons更流畅5️⃣缓存工具:比HashMap更专业6️⃣原生类型处理:告别int与Integer的纠结Guavavs原生JDK对比Guava最佳实践1.防御性编程2.优雅的参数校验3.Stopwatch计时
- LocaleUtils:你的国际化“翻译官“——让多语言处理不再手忙脚乱
五行星辰
业务系统应用技术apachecommons工具箱java开发语言
各位全球化开发者们好!今天要介绍的是ApacheCommonsLang3中的LocaleUtils工具类。这个工具就像编程界的"巴别鱼",能帮你轻松处理各种本地化需求,让你的应用在国际舞台上大放异彩!一、为什么需要LocaleUtils?原生Java本地化操作就像:Locale.getAvailableLocales():返回数组不方便查找验证Locale是否有效?要自己遍历检查语言代码转换?手动
- 探索Apache Commons OGNL:掌握灵活表达式的钥匙
蒋素萍Marilyn
探索ApacheCommonsOGNL:掌握灵活表达式的钥匙commons-ognlApacheCommonsOGNL(Dormant)项目地址:https://gitcode.com/gh_mirrors/co/commons-ognl在技术的浩瀚宇宙中,有一颗曾经璀璨夺目的星——ApacheCommonsOGNL(Object-GraphNavigationLanguage)。虽然今日它进入了
- 推荐项目:Apache Commons Email - 邮件发送的瑞士军刀
苏玥隽
推荐项目:ApacheCommonsEmail-邮件发送的瑞士军刀commons-emailApacheCommonsEmail项目地址:https://gitcode.com/gh_mirrors/co/commons-email在数字化交流的时代,邮件作为不可或缺的沟通工具,其自动化处理和批量发送的需求日益增长。为此,我们带来了一款强大的开源神器——ApacheCommonsEmail,它简化
- “Java开发者必备神器:掌握 BeanUtils,这篇就够了!”
代码魔法师Sunny
Javajava开发语言
在日常Java开发中,数据对象的复制与转换是一个常见需求,但手动编写代码容易出错且效率低下。而ApacheCommons提供的BeanUtils工具类,就像一把瑞士军刀,可以轻松应对这些场景!本文将带你全面掌握BeanUtils的用法,附带完整示例,轻松入门!概括:作用将一个对象转换成另外一个对象ApacheCommons下的包1.什么是BeanUtils?BeanUtils是ApacheComm
- Apache Commons:Java开发者的瑞士军刀
ApacheCommons是Apache软件基金会下的一个项目,它提供了一系列可重用的Java组件库。这些库解决了Java开发中常见的问题,极大地提高了开发效率,被誉为Java开发者的"瑞士军刀"。本文将深入探讨ApacheCommons的核心组件、应用场景以及最佳实践。引言ApacheCommons项目概述ApacheCommons项目始于2001年,旨在为Java开发者提供高质量、可重用的组件
- selenium.common.exceptions.NoSuchElementException: Message: An element could not be located on th...
DuffyMagic
场景:appium+python+android自动化测试问题:selenium.common.exceptions.NoSuchElementException:Message:Anelementcouldnotbelocatedonthepageusingthegivensearchparameters解决:在capabilities参数里加入'automationName':'uiautom
- CTE语法 和 临时表 都有其特定的用途和优缺点
CTE语法和临时表都有其特定的用途和优缺点在Hive中,CTE(CommonTableExpressions,公共表表达式)和临时表都有其特定的用途和优缺点。以下是针对Hive环境中CTE和临时表的详细解释以及它们的优缺点1、CTE公共表表达式:优点:缺点:2、tmp临时表:优点:缺点:总结:1、CTE公共表表达式:优点:模块化查询:与SQL中的CTE一样,Hive中的CTE允许用户将复杂的查询分
- SCI论文写作句型
shirleychiang
摘要:描述观点的重要性Oneofthemostsignificantcurrentdiscussionsinlegalandmoralphilosophyis…Itisbecomingincreasinglydifficulttoignorethe…Xistheleadingcauseofdeathinwesternindustrialisedcountries.Xisacommondisorde
- python打开文件的路径问题
jingyucsdn
python文件读取
举例:pythonjson文件在app下的static文件夹里,获取方法在app下的utils文件夹的common.py文件夹里,如何在common.py里获取json方法一:基于__file__的路径构建(最推荐)通过脚本位置计算相对路径,确保路径稳定性:importosimportjsondefload_json():current_dir=os.path.dirname(os.path.
- 腾讯云前端面经(笔试+3技术面+HR面)
(3):bfc布局规则(4)项目怎么做的移动端适配?flexible原理(1px问题,通过viewport)2、说一下原型链,原型链实现继承。3、http和tcp协议?4、缓存相关(对比缓存?强缓存?对应请求头)cookie有哪些属性?5、简单请求?跨域?6、vue中nextTick的实现,结合浏览器事件循环机制说一下?7、说说commonjs和esmodule?6、最近在看什么新东西吗?vue3
- docker阿里云安装
川贝橘ger
docker阿里云容器
要在Linux系统上安装阿里云Docker(实际上是通过阿里云镜像源安装DockerEngine,并配置阿里云镜像加速器),可以按照以下步骤操作:步骤1:卸载旧版本Docker(如有)sudoyumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\d
- centos 使用Docker 快速搭建LNMP环境
Solo_67ed
一、安装Docker更新yum包yum-yupdate卸载旧版本(如果之前安装过的话)yumremovedockerdocker-commondocker-selinuxdocker-engine安装需要的软件包,yum-util提供yum-config-manager功能,另外两个是devicemapper驱动依赖yuminstall-yyum-utilsdevice-mapper-persis
- MongoHelper工具类库
packagecom.jimi.tracker.mongo;importcom.google.common.collect.Lists;importcom.jimi.tracker.model.DeviceInfo;importcom.khan.utils.JacksonUtils;importlombok.extern.slf4j.Slf4j;importorg.springframework.
- python爬虫实战-小案例:爬取苏宁易购的好评
一、项目背景与价值1为什么爬取商品好评?消费者洞察:分析用户真实反馈,了解产品优缺点市场研究:监测竞品评价趋势,优化产品策略二.实现代码fromseleniumimportwebdriverfromselenium.webdriver.edge.optionsimportOptionsfromselenium.webdriver.common.byimportByimporttimeedge_op
- 模态弹出框
追逐繁星的阿忠
//问号/*预估金额弹层*/moneyModelOpen():void{this._commonService.layerDialog({name:'.js-money-model',size:['419px','260px'],});}账户余额关闭-->
- Android Studio中java项目添加kotlin代码方法
李艺为
javaandroidstudiokotlin
根目录下build.gradle修改:添加如下代码id'org.jetbrains.kotlin.android'version'1.9.0'applyfalse完成后应该如下//Top-levelbuildfilewhereyoucanaddconfigurationoptionscommontoallsub-projects/modules.plugins{id'com.android.app
- python实现爬取淘宝商品信息(标题、销量、主图、店铺等)
因为数据可视化这门课程的大作业要自己爬取数据,想着爬取淘宝的数据,结果找了不少文章都不太行、或者已经失效了等等,就边学边看边写搓了一份代码出来,一是为了记录一下、二是如果大家有需要也可以使用。首先看最后爬取的数据的效果:代码部分api免费测试引入第三方库importpymysqlfromseleniumimportwebdriverfromselenium.common.exceptionsimp
- apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
- fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
- 网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
- [sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
- ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
- 自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
- pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
- StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
- Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
- 从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
- Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
- js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
- 【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
- java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
- 盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
- 读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
- JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
- 常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
- pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
- [Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
- 结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
- Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
- Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
- Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
- Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
- 二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
- java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
- oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
- 使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号