- [Ljava.lang.Object; cannot be cast to [Ljava.lang.String;
这些不会的
解释:这个错误是很常见的错误,错误的提示已经很清楚了就是java的Object数组不能转换成为String[]数组,这就说明你要转换的数组它本身是Object类型的数组,但是你却非要把它转换为String类的数组,这当然是错误的。示例:[java]viewplaincopypackagecom.dada;importjava.util.ArrayList;importjava.util.List;
- Java:数据结构-ArrayList和顺序表(2)
blammmp
java数据结构开发语言
一ArrayList的使用1.ArrayList的构造方法第一种(指定容量的构造方法)创建一个空的ArrayList,指定容量为initialCapacity。publicArrayList(intinitialCapacity){if(initialCapacity>0){this.elementData=newObject[initialCapacity];}elseif(initialCap
- 【数据结构】--ArrayList与顺序表
bubu__
数据结构数据结构
文章目录1.线性表2.顺序表3.ArrayList简介4.MyArrayList的实现5.ArrayList使用5.1ArrayList的构造5.2ArrayList常见操作5.3ArrayList的遍历5.4ArrayList的扩容机制6.ArrayList的具体使用6.1简单的洗牌算法6.2杨辉三角1.线性表线性表(linearlist)是n个具有相同特性的数据元素的有限序列。线性表是一种在实
- 数据结构2-集合类ArrayList与洗牌算法
文章目录★引言:一.MyArrayList模拟实现(一)IList(二)MyArrayList(1)add(Tdata)(2)add(intpos,Tdata)(3)IllgalPosException(4)indexOf(ObjecttoFind)(5)contains(ObjecttoFind)(6)get(intpos)(7)set(intpos,Tvalue)(8)remove(Objec
- 三种接口实现增删改查
灬爱码士灬
javajava
目录ArrayListHashSetHashMapArrayListArrayList实现增删改查packagetest;importjava.util.ArrayList;importjava.util.Iterator;/***@Author:Mo*@Date:2020/12/611:11*/publicclasslist{ArrayListlist1=newArrayList();publi
- 【Java】基于ArrayList手写HashMap集合
即使再小的️帆也能远航
集合HashMapjava开发语言集合HashMap手写HashMap
HashMap底层不是基于ArrayList实现的,而是基于HashCode值计算的,基于ArrayList查询效率非常低,时间复杂度O(n)虽然可以保证存放键值对的有序性但是并不可取示例代码packagecom.collection.Demo10;importjava.util.ArrayList;/***基于ArrayList手写HashMap集合*手写简易版本的HashMap,不推荐这样使用
- 数据结构之顺序表&链表&栈
tryxr
数据结构顺序表链表栈
顺序表什么是listlist的使用线性表是什么顺序表是什么顺序表和线性表的关系顺序表和数组的区别List和ArrayList的关系如何自己模拟实现myArrayListArrayList的构造ArrayList的常见方法以下两种写法有什么区别ArrayListarrayList=newArrayListlist=newArrayList是什么意思返回值是List>是什么意思ArrayList实现杨
- java List<Map> 去重
Perfect珈蓝
java
publicstaticList>removeRepeatMapByKey(List>list,StringmapKey){if(CollectionUtils.isNullOrEmpty(list))returnnull;List>listMap=newArrayListmsp=newHashMap=0;i--){Mapmap=list.get(i);Stringid=map.get(mapKe
- list<String>去重BUG
复盘一下:最近项目上出现了这样一个问题,前端传的参数是List类型的,里面的内容是数字,我用String接收,貌似没啥问题。但是。。。。Listlist=newArrayListlist2=list.stream().distinct().collect(Collectors.toList());System.out.println(list2);输出:[1,1,2][1,2]没啥问题,但是我给第
- Java中给List<String>去重的4种方式
Java&Develop
Java开发javalistwindows
Java中给List去重的4种方式Listlist=newArrayListlist1=list.stream().distinct().collect(Collectors.toList());System.out.println("方式1:"+list1);//方式2:使用Set去重Setset=newHashSetlist2=newArrayListlinkedHashSet=newLink
- Java泛型初始化ArrayList<String>()和ArrayList<>()的区别
文章目录前言Java泛型初始化:`ArrayList()`vs`ArrayList()`)1.2钻石操作符初始化(`ArrayListlist=newArrayList()钻石操作符初始化:Listlist=newArrayList()vsArrayList())Listlist=newArrayList();在newArrayList()中,显式指定了泛型类型String。适用于Java5及以上
- [Java集合]------ArrayList的扩容机制源码分析
麦兜仔
Java基础java
一、ArrayList的简介publicclassArrayListextendsAbstractListimplementsList,RandomAccess,Cloneable,java.io.SerializableArrayList实现了List、RandomAccess、Cloneable、java.io.Serializable接口Lits:说明ArrayList是一个有序可重复的集合
- 客户从银行账户存取钱操作的设计与实现(采用集合存储顾客信息)(可直接运行)
SEVEN是7
java蓝桥杯开发语言
主类:Demopackage包名;importjava.io.*;importjava.util.ArrayList;//ArrayList类是一个特殊的数组--动态数组。来自于System.Collections命名空间;通过添加和删除元素,就可以动态改变数组的长度。importjava.util.HashMap;//HashMap是一个散列表,它存储的内容是键值对(key-value)映射。i
- java sftp工具类_基于JSch的Sftp工具类
邵典
javasftp工具类
1importjava.io.File;2importjava.io.InputStream;3importjava.util.ArrayList;4importjava.util.List;5importjava.util.Properties;6importjava.util.Vector;7importorg.apache.log4j.Logger;8importcom.jcraft.jsc
- 基于JDK1.8源码讲解ArrayList扩容机制
一位即将成功的野男人
java数据结构链表java数组
现在有两组ArrayList,分别是list1和list2Listlist1=newArrayList();list1.add(1);list1.add(14);Listlist2=newArrayList(list1);先说list1的情况,我们点进ArrayList查看ArrayList构造器(无参),如下会构造一个默认容量为10的ArrayList[],即Object[],此时的size为0
- 问题集锦6
凡尔赛mo
java开发语言
1.外调外围接口数据库没有变化我已经修改完发到线上,看调用用代码释放更新了or自己掉测试环境试下handledList2.list每次写入最前面Lists=newArrayListcollect=Stream.of(1,2,3).collect(Collectors.toList());
- javaweb之条件查询和多表联合查询
xrkhy
JavaWebjavajava-ee数据库
文章目录条件查询工具类封装使用1使用2使用条件必须提供基础SQL空值处理规则特殊字符转义多表联合查询一对一一对多条件查询publicListfindListBy(Mapmaps)throwsException{//wherea.productNamelikeconcat('%',?,'%')andtotalPrice>=?andtotalPricebillList=newArrayListpara
- ArrayList与顺序表
ArrayList与顺序表文章目录ArrayList与顺序表List什么是List常见方法介绍List的使用线性表顺序表接口相关方法ArrayList简介ArrayList使用ArrayList构造ArrayList常见操作ArrayList遍历ArrayList扩容机制List什么是List在Java中,List是集合框架(java.util包)中的一个接口,它继承自Collection接口,用
- Java第三天
啦啦啦_9a5f
为什么会出现集合类:Java是面向对象编程语言,为了方便对多个对象进行操作,就必须存储多个对象。因此存储多个对象的存储类型不能是一个基本类型,而应该是一个容器类型的变量。学习过的容器类型的数据:1,StringBuilder只能存储字符串。2,数组。只能存储相同类型的数据。集合类的特点:1,长度可变ArrayList1,位于java.util的包下,使用时需要导包。2,大小可变数组的实现:是一种特
- java list使用
奋斗live
一、增加、删除、查询可使用add、remove、get方法,如下System.out.println("list的添加、获取和删除元素");Listanimal=newArrayListanimal=newArrayListanimal=newArrayListanimal=newArrayListanimal=newArrayListanimal=newArrayListphone=newArr
- ArrayList 与 LinkedList 的区别
BonnenuIt゛浅时光737
Java基础java面试
ArrayList与LinkedList的核心区别在Java中,ArrayList和LinkedList是两种常用的列表实现,它们在底层结构、性能特性和适用场景上有显著差异。以下从多个维度详细对比:1.底层数据结构对比项ArrayListLinkedList数据结构动态数组(Object[])双向链表(每个节点包含前驱和后继指针)存储方式连续内存空间存储元素非连续内存,通过指针关联元素内存占用需预
- ArrayList与LinkedList有什么区别
萤火12345
java基础java数据结构算法面试
总结自知乎用户bravo1988java小册数组与链表ArrayList与LinkedList区别底层数据结构首先要从底层数据结构说起,ArrayList底层数据结构是数组,是一块连续的内存空间LinkedList底层数据结构不是连续的内存空间,是用一个节点记住下个节点的地址串起来的容器特点ArrayList保证数据在内存中是连续的只有保证连续才能使用索引,保证连续导致了操作非尾部数据时,会发生数
- Arraylist与LinkedList区别
雪碧聊技术
Java八股文ArrayListLinkedList
欢迎来到我的Java八股文专栏!各位程序员小伙伴们好呀~我是雪碧聊技术,很高兴能在CSDN与大家相遇!✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点,内容涵盖:Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏?精准定位:直击大厂Java面试高频考点系统全面:从基础到进阶,构建完整知识体系实战导向:理论
- 多线程进阶——线程安全的集合类
iナナ
java开发语言
目录一、多线程环境使用ArrayList(一)自行加锁(二)Collections.synchronizedList(newArrayList);(三)使用CopyOnWriteArrayList二、多线程环境使用哈希表(一)Hashtable(二)ConcurrentHashMap原来的集合类,大部分都不是线程安全的。Vector,Stack,HashTable,是线程安全的(不建议用),其他集
- hihocoder53
GoDeep
http://hihocoder.com/contest/offers53/problems题目1:继承顺位建树,然后前序遍历packagel531;importjava.util.ArrayList;importjava.util.HashMap;importjava.util.HashSet;importjava.util.List;importjava.util.Map;importjava
- c#泛型集合(ArrayList和List、Dictionary的对比)
一、List集合1.基本概念泛型集合:只能存储指定类型的数据,类型安全。动态扩容:无需指定初始大小,自动调整容量。性能优势:避免装箱拆箱(相比ArrayList)。2.创建与初始化//空列表Listlist=newList();//带初始值的列表Listlist4=newList{"aaa","ccc","bbb"};3.常用属性与方法操作代码示例说明添加元素list.Add(100);在末尾添
- Unity中常用数据结构的特点,优缺点,实例
Unity中常用的数据结构有一下几种:Array,ArrayList,List,LinkedList,Queue,Stack,Dictionary;一,数组(Array)特点:数组属于线性结构,在内存中是连续存放的。数组的元素类型必须相同。数组可以直接通过下标访问。数组的查找速度非常快,新增和删除速度慢。数组在初始化时要指定数组长度。优缺点:优:存储在连续内存上;内容都是相同类型;可以通过下标访问
- Unity中常用的数据结构总结
anbd0604
游戏数据结构与算法
本篇博文对U3D经常用到的数据结构和各种数据结构的应用场景总结下。1.几种常见的数据结构这里主要总结下在工作中常碰到的几种数据结构:Array,ArrayList,List,LinkedList,Queue,Stack,Dictionary数组Array:数组是最简单的数据结构。其具有如下特点:数组存储在连续的内存上。数组的内容都是相同类型。数组可以直接通过下标访问。数组Array的创建:1int
- Unity3D中常用的数据结构总结与分析
七大黍
Unity技术文章Unity3D培训Unity3D游戏Unity培训Unity教程
今天来给大家介绍U3D时经常用到的数据结构和各种数据结构的应用场景吧。1.几种常见的数据结构这里主要总结下小匹夫在工作中常碰到的几种数据结构:Array,ArrayList,List,LinkedList,Queue,Stack,Dictionary数组Array:数组是最简单的数据结构。其具有如下特点:数组存储在连续的内存上。数组的内容都是相同类型。数组可以直接通过下标访问。数组Array的创建
- Java 中的并发集合(Concurrent Collections)详解与使用指南
超级小忍
Javajava开发语言
前言在多线程编程中,共享数据结构的线程安全是一个关键问题。传统的集合类(如HashMap、ArrayList)并不是线程安全的,如果在并发环境下直接使用,可能会导致数据不一致、死锁等问题。为了解决这个问题,Java提供了一套线程安全的并发集合类,它们都位于java.util.concurrent包中。本文将详细介绍Java中常见的并发集合类,包括它们的实现原理、使用场景以及性能对比,帮助你更好地选
- apache 安装linux windows
墙头上一根草
apacheinuxwindows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装,另外一种就是通过yum 安装,此中安装方式,需要物理机联网。以下分别介绍两种的安装方式
通过二进制文件安装Apache需要的软件有apr,apr-util,pcre
1,安装 apr 下载地址:htt
- fill_parent、wrap_content和match_parent的区别
Cb123456
match_parentfill_parent
fill_parent、wrap_content和match_parent的区别:
1)fill_parent
设置一个构件的布局为fill_parent将强制性地使构件扩展,以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。
2) wrap_conte
- 网页自适应设计
天子之骄
htmlcss响应式设计页面自适应
网页自适应设计
网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起,更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小,需要设计几套css样式,用js脚本判断窗口大小,选择加载。结构臃肿,加载负担较大。现笔者经过一定时间的学习,有所心得,故分享于此,加强交流,共同进步。同时希望对大家有所
- [sql server] 分组取最大最小常用sql
一炮送你回车库
SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
- ImageIO写图片输出到硬盘
3213213333332132
javaimage
package awt;
import java.awt.Color;
import java.awt.Font;
import java.awt.Graphics;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imagei
- 自己的String动态数组
宝剑锋梅花香
java动态数组数组
数组还是好说,学过一两门编程语言的就知道,需要注意的是数组声明时需要把大小给它定下来,比如声明一个字符串类型的数组:String str[]=new String[10]; 但是问题就来了,每次都是大小确定的数组,我需要数组大小不固定随时变化怎么办呢? 动态数组就这样应运而生,龙哥给我们讲的是自己用代码写动态数组,并非用的ArrayList 看看字符
- pinyin4j工具类
darkranger
.net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号:大中小
引入pinyin4j-2.5.0.jar包:
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,
- StarUML学习笔记----基本概念
aijuans
UML建模
介绍StarUML的基本概念,这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。
模型、视与图(Model, View and Diagram)
&
- Activiti最终总结
avords
Activiti id 工作流
1、流程定义ID:ProcessDefinitionId,当定义一个流程就会产生。
2、流程实例ID:ProcessInstanceId,当开始一个具体的流程时就会产生,也就是不同的流程实例ID可能有相同的流程定义ID。
3、TaskId,每一个userTask都会有一个Id这个是存在于流程实例上的。
4、TaskDefinitionKey和(ActivityImpl activityId
- 从省市区多重级联想到的,react和jquery的差别
bee1314
jqueryUIreact
在我们的前端项目里经常会用到级联的select,比如省市区这样。通常这种级联大多是动态的。比如先加载了省,点击省加载市,点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。 针对这种场景,如果我们使用jquery来实现,要考虑很多的问题,数据部分,以及大量的dom操作。比如这个页面上显示了某个区,这时候我切换省,要把市重新初始化数据,然后区域的部分要从页面
- Eclipse快捷键大全
bijian1013
javaeclipse快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
- js 笔记 函数
征客丶
JavaScript
一、函数的使用
1.1、定义函数变量
var vName = funcation(params){
}
1.2、函数的调用
函数变量的调用: vName(params);
函数定义时自发调用:(function(params){})(params);
1.3、函数中变量赋值
var a = 'a';
var ff
- 【Scala四】分析Spark源代码总结的Scala语法二
bit1129
scala
1. Some操作
在下面的代码中,使用了Some操作:if (self.partitioner == Some(partitioner)),那么Some(partitioner)表示什么含义?首先partitioner是方法combineByKey传入的变量,
Some的文档说明:
/** Class `Some[A]` represents existin
- java 匿名内部类
BlueSkator
java匿名内部类
组合优先于继承
Java的匿名类,就是提供了一个快捷方便的手段,令继承关系可以方便地变成组合关系
继承只有一个时候才能用,当你要求子类的实例可以替代父类实例的位置时才可以用继承。
在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。
内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相
- 盗版win装在MAC有害发热,苹果的东西不值得买,win应该不用
ljy325
游戏applewindowsXPOS
Mac mini 型号: MC270CH-A RMB:5,688
Apple 对windows的产品支持不好,有以下问题:
1.装完了xp,发现机身很热虽然没有运行任何程序!貌似显卡跑游戏发热一样,按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响!
2.反观安装了Mac os的展示机,发热量很小,运行了1天温度也没有那么高
&nbs
- 读《研磨设计模式》-代码笔记-生成器模式-Builder
bylijinnan
java设计模式
声明: 本文只为方便我个人查阅和理解,详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/
/**
* 生成器模式的意图在于将一个复杂的构建与其表示相分离,使得同样的构建过程可以创建不同的表示(GoF)
* 个人理解:
* 构建一个复杂的对象,对于创建者(Builder)来说,一是要有数据来源(rawData),二是要返回构
- JIRA与SVN插件安装
chenyu19891124
SVNjira
JIRA安装好后提交代码并要显示在JIRA上,这得需要用SVN的插件才能看见开发人员提交的代码。
1.下载svn与jira插件安装包,解压后在安装包(atlassian-jira-subversion-plugin-0.10.1)
2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
- 常用数学思想方法
comsci
工作
对于搞工程和技术的朋友来讲,在工作中常常遇到一些实际问题,而采用常规的思维方式无法很好的解决这些问题,那么这个时候我们就需要用数学语言和数学工具,而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法,仅供学习和参考
函数思想
把某一数学问题用函数表示出来,并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
- pl/sql集合类型
daizj
oracle集合typepl/sql
--集合类型
/*
单行单列的数据,使用标量变量
单行多列数据,使用记录
单列多行数据,使用集合(。。。)
*集合:类似于数组也就是。pl/sql集合类型包括索引表(pl/sql table)、嵌套表(Nested Table)、变长数组(VARRAY)等
*/
/*
--集合方法
&n
- [Ofbiz]ofbiz初用
dinguangx
电商ofbiz
从github下载最新的ofbiz(截止2015-7-13),从源码进行ofbiz的试用
1. 加载测试库
ofbiz内置derby,通过下面的命令初始化测试库
./ant load-demo (与load-seed有一些区别)
2. 启动内置tomcat
./ant start
或
./startofbiz.sh
或
java -jar ofbiz.jar
&
- 结构体中最后一个元素是长度为0的数组
dcj3sjt126com
cgcc
在Linux源代码中,有很多的结构体最后都定义了一个元素个数为0个的数组,如/usr/include/linux/if_pppox.h中有这样一个结构体: struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
- Linux cp 实现强行覆盖
dcj3sjt126com
linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest,即使加了-f也是不能强行覆盖的,这时怎么回事的呢?一两个文件还好说,就输几个yes吧,但是要是n多文件怎么办,那还不输死人呢?下面提供三种解决办法。 方法一
我们输入alias命令,看看系统给cp起了一个什么别名。
[root@localhost ~]# aliasalias cp=’cp -i’a
- Memcached(一)、HelloWorld
frank1234
memcached
一、简介
高性能的架构离不开缓存,分布式缓存中的佼佼者当属memcached,它通过客户端将不同的key hash到不同的memcached服务器中,而获取的时候也到相同的服务器中获取,由于不需要做集群同步,也就省去了集群间同步的开销和延迟,所以它相对于ehcache等缓存来说能更好的支持分布式应用,具有更强的横向伸缩能力。
二、客户端
选择一个memcached客户端,我这里用的是memc
- Search in Rotated Sorted Array II
hcx2013
search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?
Would this affect the run-time complexity? How and why?
Write a function to determine if a given ta
- Spring4新特性——更好的Java泛型操作API
jinnianshilongnian
spring4generic type
Spring4新特性——泛型限定式依赖注入
Spring4新特性——核心容器的其他改进
Spring4新特性——Web开发的增强
Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC
Spring4新特性——Groovy Bean定义DSL
Spring4新特性——更好的Java泛型操作API
Spring4新
- CentOS安装JDK
liuxingguome
centos
1、行卸载原来的:
[root@localhost opt]# rpm -qa | grep java
tzdata-java-2014g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64
java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64
[root@localhost
- 二分搜索专题2-在有序二维数组中搜索一个元素
OpenMind
二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。
用数学语言描述如下:p满足
(1),对任意的x1,x2,y,如果x1<x2,则p(x1,y)<p(x2,y);
(2),对任意的x,y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2);
2,问题:
给定满足1的数组p和一个整数k,求是否存在x0,y0使得p(x0,y0)=k?
3,算法分析:
(
- java 随机数 Math与Random
SaraWon
javaMathRandom
今天需要在程序中产生随机数,知道有两种方法可以使用,但是使用Math和Random的区别还不是特别清楚,看到一篇文章是关于的,觉得写的还挺不错的,原文地址是
http://www.oschina.net/question/157182_45274?sort=default&p=1#answers
产生1到10之间的随机数的两种实现方式:
//Math
Math.roun
- oracle创建表空间
tugn
oracle
create temporary tablespace TXSJ_TEMP
tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf'
size 32m
autoextend on
next 32m maxsize 2048m
extent m
- 使用Java8实现自己的个性化搜索引擎
yangshangchuan
javasuperword搜索引擎java8全文检索
需要对249本软件著作实现句子级别全文检索,这些著作均为PDF文件,不使用现有的框架如lucene,自己实现的方法如下:
1、从PDF文件中提取文本,这里的重点是如何最大可能地还原文本。提取之后的文本,一个句子一行保存为文本文件。
2、将所有文本文件合并为一个单一的文本文件,这样,每一个句子就有一个唯一行号。
3、对每一行文本进行分词,建立倒排表,倒排表的格式为:词=包含该词的总行数N=行号