mcyJacky

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础

- 前言
- 一、决策树模型与学习
  - - 1.1 决策树模型
    - 1.2 决策树与条件概率分布
    - 1.3 决策树决策模型
- 二、特征选择
  - - 2.1 什么是特征选择
    - 2.2 信息增益(Information Gain)
- 三、决策树的生成
  - - 3.1 ID3算法
    - 3.2 C4.5的生成算法
- 四、决策树的剪枝
- 五、扩展
  - - 5.1 基尼指数(Gini Index )
    - 5.2 分类误差率(Misclassification Error)

前言

机器学习实战系列之学习笔记主要是本人进行学习机器学习的整理。本系列所有代码是用python3编写，并使用IDE Pycharm在Windows平台上编译通过。本系列所涉及的所有代码和资料可在我的github或者码云上下载到，gitbub地址：https://github.com/mcyJacky/MachineLearning，码云地址：https://gitee.com/mcyHome/MachineLearning，如有问题，欢迎指出~。

一、决策树模型与学习

1.1 决策树模型

决策树(Decision tree)，分类的决策树模型是一种描述对实例进行分类的树形结构，是一种基本的分类与回归方法。决策树由结点(node)和有向边(directed edge)组成。结点有两种类型：内部结点(internal)和叶结点(leaf node)，内部结点表示一个特征或属性，叶结点表示一个类。
用决策树进行分类，从根结点开始，对实例的某一特征进行测试，根据测试结果，将实例分配到其子结点；这时，每个子节点对应着该特征的一个取值，如此递归地对实例进行测试并分配，直到达到叶结点。最后将实例分到叶结点的类中。如下图1.1为决策树示意图。图中圆和方框表示内部结点和叶结点。

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第1张图片

图1.1 决策树模型

1.2 决策树与条件概率分布

决策树还表示给定特征条件下类的条件概率分布，这一条件概率分布定义在特征空间的一个划分(partition)上。将特征空间划分为互不相交的单元(cell)或区域(region)，并在每个单元定义一个类的概率分布就构成了一个条件概率分布。决策树的一条路径对应于划分的一个单元。决策树所表示的条件概率分布由各个单元给定条件下类的条件概率分布组成。假设 X 为表示特征的随机变量， Y 为类的随机变量，那么这个条件概率分布可以表示 P(Y|X) 。 X 取值于给定划分下单元的集合， Y 取值于类的集合。各个叶结点上的条件概率往往偏向某一个类，即属于某一个类的概率较大，决策树分类时将该结点的实例强行分到条件概率大的那一类去。如下图1.2定义了特征空间的划分.图中大正方形表示特征空间。这个大正方形被若干个小矩形分割，每个小矩形表示一个单元。类别假设有两个类：A和B。图1.3即为图1.2所表示的条件概率分布的决策树。

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第2张图片

图1.2 特征空间划分

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第3张图片

图1.3 特征空间划分对应的决策树

1.3 决策树决策模型

决策树的学习，假设给定训练数据集

D = {(x 1, y 1), (x 2, y 2), . . ., (x n, y n)}

其中，

xi=(x(1)i,x(2)i,...,x(n)i) x i = ( x i ( 1 ) , x i ( 2 ) , . . . , x i ( n ) ) 为输入实例（特征向量），

n n 为特征个数，

yi∈{1,2,...,K} y i ∈ { 1 , 2 , . . . , K } 为类标记，

i=1,2,...,N i = 1 , 2 , . . . , N 为样本容量。 学习目标根据给定的训练数据集构建一个决策树模型，使他能够对实例进行正确分类。

决策树学习本质上是从训练数据集中归纳出一组分类规则，与训练数据集不相矛盾的决策树（即能对训练数据进行正确分类的决策树）可能有多个，也可能一个也没有。我们需要的是一个与训练数据矛盾较小的决策树，同时具有很好的泛化能力。从一个角度看，决策树学习是由训练数据集估计条件概率模型。基于特征空间划分的类的条件概率模型有无穷多个，我们选择的条件概率模型应该不仅对训练数据有很好的拟合，而且对未知数据有很好的预测。决策树学习用损失函数表示这一目标，决策树学习的损失函数通常是正则化的极大似然函数，决策树学习的策略是以损失函数为目标函数的最小化。

决策树学习的算法通常是一个递归地选择最优特征，并根据该特征对训练数据进行分割，使得对各个子数据集有一个最好的分类的过程。这一过程对应着对特征空间的划分，也对应着决策树的构建。开始，构建根结点，将所有训练数据集放在根结点，选择一个最优特征，按照这一特征将训练数据集分割成子集，使得各个子集有一个在当前条件下的最好的分类。如果这些子集已经能够被基本确定分类，那么构建叶结点，并将这些子集分到所对应的叶结点中去；如果还有子集不能被基本确定分类，那么就对这些子集选择新的最优特征，继续对其进行分割构建相应的结点，如此递归地进行下去，直到所有训练数据子集被基本正确分类，或没有合适的特征为止。最后每个子集都被分到叶结点上，即都有了明确的类，生产了一颗决策树。以上方法生成的决策树可能对训练数据有很好的分类能力，但对未知的测试数据未必有很好的分类能力，即可能发生过拟合现象。我们需要对已生成的数自下而上进行剪切，将数变得更简单，从而使它具有更好的泛化能力。具体地就是去掉过于细分的叶结点，使其回退到父结点，甚至更高的结点，然后将父结点或更高的结点改为新的叶结点。决策树学习的常用算法包括ID3、C4.5、CART三种。而决策树学习算法包含：

①特征选择
②决策树的生成
③决策树的剪枝

二、特征选择

2.1 什么是特征选择

特征选择在于选取对训练数据具有分类能力的特征。这样可以提高决策树学习的效率。如果利用一个特征进行分类的结果与随机分类的结果没有很大差别则这个特征是没有分类能力的。下面通过一个例子来说明特征选择问题。

表2.1是一个由14个样本组成的判断是否适合打网球(playtennis)数据集。数据包括Outlook、Temperature、Humidity、Wind4个特征属性。每个特征属性包括不同的特征向量。表最后一列就是表示分类结果：yes|no。

表2.1 根据环天气特征而判断是否适合打网球的数据表

Day	Outlook	Temperature	Humidity	Wind	PlayTennis
D1	Sunny	Hot	High	Weak	No
D2	Sunny	Hot	High	Strong	No
D3	Overcast	Hot	High	Weak	Yes
D4	Rain	Mild	High	Weak	Yes
D5	Rain	Cool	Normal	Weak	Yes
D6	Rain	Cool	Normal	Strong	No
D7	Sunny	Cool	Normal	Strong	Yes
D8	Overcast	Mild	High	Weak	No
D9	Sunny	Cool	Normal	Weak	Yes
D10	Rain	Mild	Normal	Weak	Yes
D11	Sunny	Mild	Normal	Strong	Yes
D12	Overcast	Mild	High	Strong	Yes
D13	Overcast	Hot	Normal	Weak	Yes
D14	Rain	Mild	High	Strong	No

我们希望通过所给的训练数据学习一个打网球判断的决策树，用以对未来某天气特征能否进行打网球进行分类。下图2.1表示从表2.1数据学习到的两个可能的决策树，分别由两个不同的根结点构成。图2.1(a)根结点的特征是Outlook，有三个取值；图2.1(b)根结点的特征是Wind，有两个取值。对应于不同的取值有不同的子结点，两个决策树都可以从此延续下去。问题是：究竟选择哪个特征会更好些呢？这就要求确定选择特征的准则。直观上，如果一个特征具有更好的分类能力，或者说，按照这一特征将训练数据集分割成子集，使得各个子集在当前条件下有最好的分类，那就应该寻找这个特征。而信息增益(Information gain)就能很好的表达这一准则。

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第4张图片

图2.1 不同特征决定的不同决策树

2.2 信息增益(Information Gain)

1）信息论(Information Theory)

在讨论信息增益之前，我们先引入几个概念，我们用最通俗易懂的话语来说明。什么叫信息论，也就是可以理解为一件事件所包含的信息量理论。那怎么看待一件事件所包含的信息量呢？首先，比如你收到两件事件的信息：①你妈妈打电话叫你冬天了多注意保暖；②你班主任打电话给你说你得了最高奖学金。对于第一件事件，你是会经常收到你妈妈的问候的，也就是概率极高。而第二件事件是你得了最高奖学金这件事情是很不容易发生的，也就是概率极低。我们可以认为第二件事件所包含的信息量更大。同时，如果问你这两件事件的信息总量是多少，我们可以将第一件事件和第二件事件的信息量进行相加。最后，信息量肯定是大于零。根据这三点，我们假设事件1的信息量为 H(x1) ，事件2的信息量为 H(x2) ，我们假设事件发生的概率为 p(x) ，我们会得出如下：

⎧ ⎩ ⎨ ⎪ ⎪ ① H (x) \infty 1 p ( x ) （ 正 比 于 ） ② H (x 1, x 2) = H (x 1) + H (x 2) ③ H (x) \geq 0

根据以上三点，我们刚好可以用 H(x)=log1p(x) 来匹配上述的条件。

2）熵(Entropy)

在信息论与概率统计中，熵是表示随机变量不确定性的度量，当 X 取有限个值的离散随机变量时，其概率分布为：

P (X = x i) = p i, i = 1, 2, . . ., n

则 随机变量熵的定义为：

E n t r o p y (X) = E x [H (X)] = - \sum i = 1 n p i log p i

若

pi=0 p i = 0 ，则定义

0log0=0 0 log ⁡ 0 = 0 。式中对数是以2为底或以

e e 为底，这时的熵单位别为比特(bit)或纳特(nat)。熵只依赖于

X X 的分布，与

X X 的取值无关，所以也可将

X X 的熵记作

H(p) H ( p ) ，即：

H (p) = - \sum i = 1 n p i log p i

熵越大，随机变量的不确定性就越大。从定义可验证：

0 \leq H (p) \leq log n

如当随机变量只取两个值，例如1，0时，即 X 的分布为：

P (X = 1) = p ， p (X = 0) = 1 - p ， 0 \leq p \leq 1

熵为：

H (p) = - p log 2 p - (1 - p) log 2 (1 - p)

这时，熵随概率变化的曲线如图2.2所示（单位为比特）。

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第5张图片

图2.2 分布为伯努利分布时熵与概率的关系

当 p=0 或 p=1 时 H(p)=0 ，随机变量完全没有不确定性。当 p=0.5 时， H(p)=1 ，熵取值最大，随机变量不确定性最大。

3）条件熵

设有随机变量 (X,Y) ，其联合概率分布为：

P (X = x i, Y = y i) = p i j, i = 1, 2, . . ., n; j = 1, 2, . . ., m

条件熵

H(Y|X) H ( Y | X ) 表示在已知随机变量

X X 的条件下随机变量

Y Y 的不确定性。随机变量

X X 给定的条件下随机变量

Y Y 的条件熵（conditional entropy）

H(Y|X) H ( Y | X ) ，定义为

X X 给定条件下

Y Y 的条件概率分布的熵对

X X 的数学期望：

H (Y | X) = \sum i = 1 n p i H (Y | X = x i)

，这里的

pi=P(X=xi),i=1,2,...n p i = P ( X = x i ) , i = 1 , 2 , . . . n 。

当熵和条件熵中的概率由数据估计（特别是极大似然估计）得到时，所对应的熵与条件熵分别称为经验熵(empirical entropy)和经验条件熵(empirical conditional entropy).此时，如果有0的概率，令 0log0=0 。

4）信息增益

信息增益表示得知特征 X 的信息而使得类 Y 的信息的不确定性减少的程度。设特征 A 对训练数据集 D 的信息增益 g(D,A) ，定义为集合 D 的经验熵 H(D) 与特征 A 给定条件下 D 的经验条件熵 H(D|A) 之差，即

g (D, A) = H (D) - H (D | A)

决策树学习可以应用信息增益准则选择特征。给定训练数据集 D 和特征 A ，经验熵 H(D) 表示对数据集 D 进行分类的不确定性。而经验条件熵 H(D|A) 表示在特征 A 给定的条件下对数据集 D 进行分类的不确定性。那么它们的差，即信息增益，就表示由于特征 A 而使得对数据集 D 的分类的不确定性减少的程度。显然，对于数据集而言，信息增益依赖于特征，不同的特征往往具有不同的信息增益，信息增益大的特征具有更强的分类能力。

根据信息增益准则的特征的选择方法：对训练数据集（或子集） D ，计算其每个特征的信息增益，并并比较它们的大小，选择信息增益最大的特征。

设训练数据集为 D , |D| 表示其样本容量。设有 K 个类 Ck，k=1,2,..,K，|Ck| 为属于类 Ck 的样本个数， ∑Kk=1|Ck|=|D| 。设特征 A 有 n 个不同的取值 {a1,a2,...an} ，根据特征 A 的取值将 D 划分为 n 个子集 D1,D2,...Dn ， |Di| 为 Di 的样本个数， ∑ni=1|Di|=|D| 。记子集 Di 中属于类 Ck 的样本的集合为 Dik ，即 Dik=Di ∩ Ck ， |Dik| 为 Dik 的样本个数。于是信息增益的具体算法如下：

①经验熵：

H (D) = - \sum k = 1 K | C k | D log 2 | C k | D

②经验条件熵：

H (D | A) = \sum I = 1 n | D i | D H (D i) = - \sum I = 1 n | D i | D \sum k = 1 K | D i k | D i log 2 | D i k | D i

③计算信息增益：

g (D, A) = H (D) - H (D | A)

下面对表2.1中Wind特征进行信息增益的计算：

H (D) = - 9 14 log 2 9 14 - 5 14 log 2 5 14 = 0.940

H (D | W i n d) = - 8 14 [6 8 log 2 6 8 + 2 8 log 2 2 8] - 6 14 [3 6 log 2 3 6 + 3 6 log 2 3 6] = 0.982

g (D, w i n d) = H (D) - H (D | w i n d) = 0.940 - 0.982 = 0.0478

5）信息增益比

以信息增益作为划分训练数据集的特征，存在偏向于选择取值较多的特征的问题。使用信息增益比(information gain ratio)可以对这个问题进行校正，这是特征选择的另一个准则。

定义：特征 A 对训练数据集 D 的信息增益比 gR(D,A) 为信息增益 g(D,A) 与训练数据集 D 关于特征 A 的值的熵 HA(D) 之比，即：

g R (D, A) = g ( D , A ) H A ( D )

其中，

HA(D)=−∑nk=1|Di|Dlog2|Di|D H A ( D ) = − ∑ k = 1 n | D i | D log 2 ⁡ | D i | D ，

n n 是特征

A A 取值的个数。

三、决策树的生成

3.1 ID3算法

ID3算法的核心是在决策树各个结点上应用信息增益准则选择特征，递归地构建决策树。具体方法是：从根结点开始，对结点计算所有可能的特征的信息增益，选择信息增益最大的特征作为结点的特征，由该特征的不同取值建立子结点；再对子结点递归地调用以上方法，构建决策树；直到所有特征的信息增益均很小或没有特征可以选择为止；最后得到一个决策树。

   算法步骤：
   输入：训练数据集 D ，特征集 A ，阈值 ε ；
   输出：决策树 T .

(1)若 D 中所有实例属于同一类 Ck ，则 T 为单结点树，并将类 Ck 作为该结点的类标记，返回 T .

(2)若 A=∅ ，则 T 为单结点树，并将 D 中实例最大的类 Ck 作为该结点的类标记，返回 T .

(3)否则，按信息增益算法计算 A 中各特征对 D 的信息增益，选择信息增益最大的特征 Ag .

(4)如果 Ag 的信息增益小于阈值 ε ，则置 T 为单结点树，并将 D 中实例数最大的类 Ck 作为该结点的类标记，返回 T .

(5)否则，对 Ag 的每一可能值 ai ，依 Ag=ai 将 D 分割为若干非空子集 Di ，将 Di 中实例数最大的类作为标记，构建子结点，由结点及其子结点构成数 T ，返回 T .

(6)对第 i 个子结点，以 Di 为训练集，以 A−{Ag} 为特征集，递归地调用步骤(1)~(5)，得到子树 Ti ，返回 Ti 。
注意：ID3算法容易产生过拟合现象。

3.2 C4.5的生成算法

C4.5算法与ID3算法相似，C4.5算法对ID3算法进行了改进，C4.5算法在生成过程中，用信息增益比来选择特征。

   算法步骤：
   输入：训练数据集 D ，特征集 A ，阈值 ε ；
   输出：决策树 T .

(1)若 D 中所有实例属于同一类 Ck ，则 T 为单结点树，并将类 Ck 作为该结点的类标记，返回 T .

(2)若 A=∅ ，则 T 为单结点树，并将 D 中实例最大的类 Ck 作为该结点的类标记，返回 T .

(3)否则，按信息增益比算法计算 A 中各特征对 D 的信息增益比，选择信息增益比最大的特征 Ag .

(4)如果 Ag 的信息增益比小于阈值 ε ，则置 T 为单结点树，并将 D 中实例数最大的类 Ck 作为该结点的类标记，返回 T .

(6)对第 i 个子结点，以 Di 为训练集，以 A−{Ag} 为特征集，递归地调用步骤(1)~(5)，得到子树 Ti ，返回 Ti 。

四、决策树的剪枝

决策树生成算法递归地产生决策树，直到不能继续下去为止。这样产生的树往往对训练数据的分类很准确，但对未知的测试数据的分类却没有那么准确，即出现过拟合现象。过拟合的原因在于学习时过多地考虑如何提高对训练数据的正确分类，从而构建过于复杂的决策树。解决这个问题的办法是考虑决策树的复杂度，对已生成的决策树进行简化。

在决策树学习中将已生成的树进行简化的过程称为剪枝(pruning)。具体地，剪枝从已生成的树上裁掉一些子树或叶结点，并将其根结点或父结点作为新的叶结点，从而简化分类树模型。

决策树的剪枝往往通过极小化决策树整体的损失函数(loss function)或代价函数(cost function)来实现，设树T的叶结点个数为 |T| ， t 是树 T 的叶结点，该叶结点有 Ni 个样本点，其中 k 类的样本有 Ntk 个， k=1,2,...K ， Ht(T) 为叶结点t上的经验熵， α≥0 为参数，则决策树学习的损失函数可以定义为：

C α = \sum t = 1 | T | N t H t (T) + α | T |

其中经验熵：

H t (T) = - \sum k N t k N t log 2 N t k N t

我们记

C(T)=∑|T|t=1NtHt(T) C ( T ) = ∑ t = 1 | T | N t H t ( T ) ，所以有

C α = C (T) + α | T |

式中，

C(T) C ( T ) 表示模型对训练数据的预测误差，即模型与训练数据的拟合度，

|T| | T | 表示模型复杂程度，参数

α≥0 α ≥ 0 控制两者之间的影响。 较大的 α 促进选择简单的模型树，较小的 α 促使选择较复杂的模型树。 α=0 意味着只考虑模型与训练数据的拟合程度，不考虑模型的复杂度。

剪枝，就是当 α 确定时，选择损失函数最小的模型，即损失函数最小的树。当 α 确定时，子树越大，往往与训练数据的拟合越好，但是模型的复杂度就越高；相反，子树越小，模型的复杂度就越低，但是往往与训练数据的拟合不好。损失函数正好表示了对两者的平衡。图4.1为决策树剪枝的示例模型。

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第6张图片

图4.1 决策树的剪枝

五、扩展

5.1 基尼指数(Gini Index )

除了信息增益好信息增益比进行特征选择时，我们还可以使用基尼指数，我们常常把它用于CART算法。

定义：分类中，假设有 K 个类，样本点属于第 k 类的概率为 pk ，则概率分布的基尼指数定义为：

G i n i (p) = 1 - \sum k = 1 K p 2 k

而对于给定的样本集合 D ，其基尼指数为：

G i n i (D) = 1 - \sum k - 1 K (| C k | | D |) 2

这里，

Ck C k 是

D D 中属于第

k k 类的样本子集，

K K 是类的个数。如果样本集合

D D 根据特征

A A 是否取某一可能值

a a 被分割成

D1 D 1 和

D2 D 2 ，则在特征

A A 的条件下， 集合 D 的基尼指数为：

G i n i (D, A) = | D 1 | | D | G i n i (D 1) + | D 2 | | D | G i n i (D 2)

基尼指数Gini(D)表示集合D的不确定性，基尼指数Gini(D,A)表示精A=a分割后集合D的不确定性。基尼指数值越大，样本集合的不确定性也就越大。

5.2 分类误差率(Misclassification Error)

我们也可以通过分类误差率进行特征选择，假设有 K 个类，样本点属于第 k 类的概率为 pk 分类误差率的公式如下：

E r r o r (p) = 1 - m a x (p k)

。

运用熵、基尼指数、分类误差率进行二类分类分类时，得到的结果是一样的。从下图5.1可以知道三条曲线取到最值的时候是相同的。

python3《机器学习实战系列》学习笔记----3.1 决策树理论基础_第7张图片

图5.1 二类分类中基尼指数、熵、分类误差率的关系

【参考】：
   1. 《统计学习方法》作者：李航第5章决策树
   2. 《机器学习》作者：周志华
   3. 视频《机器学习全新升级版Ⅰ》（决策树）秦曾昌

转载声明：
版权声明：非商用自由转载-保持署名-注明出处
署名：mcyJacky
文章出处：https://blog.csdn.net/mcyJacky

你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
2022-04-07 上善若水1979527
昨天苏阿姨来给我送普门品！和她一块来的还有另外一个阿姨！我下去拿时！那阿姨说你不是干房产的小赵！帮我租房的！我说你认识我？对啊！你帮我租的房子！我没印象了！我和保红一块！我说我想起来了阿姨！你这运动服一换！小电车一骑！一下年轻十岁我早记不得了！我只记得一九年五一带看了河滨美航还有德胜的好多套房子！你都不当意！你告诉我你每晚拜观音菩萨说快让小赵普萨帮我找套合适的房子吧！我把本子上记得半年内的德胜房源
2019-04-05 诚信装饰祝希信
2019年4月5日星期五天气晴(451)六年级七班祝全文今天是清明节，都放假了，好多人外出游玩踏青。一大早醒来去提水浇菜园子，全文还在呼呼睡大觉，浇完菜园子，简单吃了点饭就去干活了。中午回到家，厨房里乱七八糟，全文自己的脏衣服也没有洗，心里感觉真不是滋味，怎么会这样？优秀的孩子不是这样的，是我不该发脾气吗？还是回家继续忙碌，他人爱怎么怎么？家庭是共同的家庭，应该都有责任去承担，不要整天说来说去。全
2021-07-04张宪臣因寻找孩子落入敌手，是不是不专业？可以容忍
张宪臣离开小兰去书店前，小兰心情很好，对他说等他回来炖排骨给他吃，他觉得目前处在敌人的心脏里，在这样严酷的情势下，小兰这样掉以轻心太不认真了。这是很危险的，一个疏忽就会暴露自己，可能给自己带来灭顶之灾，所以他立马拉下脸来严肃地提醒小兰：长点心！既然如此他又为什么“不长点心”，而让自己在万分危急的逃跑途中，思想开小差去找自己的孩子，以致耽误了自己的逃跑时间而落入敌手？说实话这一点也是这部电影既合理又
时间看得见（第71天/3650天）瓜小西呀
【第71天/3650天】时间管理：2019.04.24今天雨竟然下了一整天，晚上计划好的搬家计划也被迫搁浅了，原来热闹的宿舍只剩下空荡荡的床位，如果不是大雨，这个房子今晚已经没有人了，没想到行动最早的我和玉米竟站了宿舍最后一班岗。想我的小伙伴们啊~虽然有时会觉得有点吵，但吵吵闹闹的不才是生活吗？这样一下子突然安安静静的，还真是一点都不习惯呢！不过还好我们都会保持联系:-)还没分开，我们就已经开始约
践行5.0-第五周02.26-03.04 初队长
一年又一年，正月十五一过这个年也就过去了，元宵节过去了代表大家又将焦点集中到了最终的年度目标上了，而我也经过了这两周的调试，让自己也步入了正轨，但是在过程中自己经常会被手机视频等一些所影响，导致效率并不失很高，因此，接下来的一周践行会将手机封存起来，并将自己的一日五色表践行深入。一日五色表：践行5.0的90天目标：1、工作日每天保证一日五色表完成，形成习惯；检视：一日五色表的操作觉得还是在应付，并
2018-05-03收盘点评：曙光初现！当前行情怎么做？（附今晚纵横股海公益课第9讲-如何操作底部机会个股） db1eae6e5a78
今日复盘：上证指数今日收在3100.86点，上涨19.68个点，+0.64%，深证成指收在10458.62点，上涨115.78个点，+1.12%。今天大盘又一次探底回升，收出一根小阳线，创业板K线上走势更好看一些，下影线很长，阳线实体也较大，这也体现出今天走势更强的是创业板为代表的小票。之前已经提到过很多次，今年行情大概率就是创业板行情，涨幅更大的是小票，确定性更大的也在小票上。今天涨停板家数为5
100天蜕变41 羽佳成长故事
今天12月11日，晴又瞎忙了一天，干哩点啥呢？01.参加社群运营学院的组织策划活动，第一在线上主持人，第一次当小助手，第一次坚定表达自己的意见。群里两派意见，一个是想非比赛模式，另一个比赛模式，意见僵持不下。02.走路一个多小时03.听罗胖60秒十几遍04.下午文章完成打卡05.写打卡文06.写总结启示不干不知道，做一次才能理解别人。老觉得主持人反应慢，实际上是看许多事，忙不过来。
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
在Ubuntu24.04搭建VLLM， SGLang 和 LangChain环境小熊冲！冲！冲！ AI ubuntu langchain ai 毕业设计
在Ubuntu24.04搭建VLLM，SGLang和LangChain环境[!NOTE]概述整片文章是笔者的回忆(白天忙碌了一天，晚上进行的总结)，所以有些地方的描述可能有误差，本文更多的是大体方向问题，细节步骤不是本文的重点，见谅!!!如何安装Ubuntu24.04制作启动U盘，作者使用的是rufus.exe工具下载Ubuntu24.04的ISO镜像使用rufus.exe工具刷入Ubuntu22
Ubuntu24安装MariaDB/MySQL后不知道root密码如何解决
Ubuntu24.04安装MariaDB后root密码未知？解决方案在此在Ubuntu24.04上新安装MariaDB后，许多用户会发现自己不知道root用户的密码，甚至在安装过程中也没有提示设置密码。这是因为在较新的MariaDB版本中，默认情况下root用户采用了unix_socket身份验证插件。这意味着您可以使用操作系统的root用户权限直接登录MariaDB，而无需输入密码。本文将为您详
VirtualBox安装Ubuntu 22.04后终端无法打开的解决方案 yuanpan ubuntu linux 运维
问题现象在VirtualBox中使用"快速安装"模式安装Ubuntu22.04后图形终端（gnome-terminal）无法通过图标或快捷键(Ctrl+Alt+T)启动系统其他功能正常根本原因语言环境(Locale)配置异常导致：快速安装模式可能跳过Locale生成步骤gnome-terminal依赖的本地化资源加载失败解决方案▶方法1：修复Locale配置（推荐）进入TTY终端快捷键：Ctrl+
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和使用 NoMachine 山岚的运维笔记 Linux 运维及使用 linux ubuntu 运维 nomachine 远程连接
NoMachine是一款适用于Linux（Ubuntu）及其他支持的操作系统的远程桌面应用程序，允许用户通过本地或远程系统从世界任何地方控制计算机。它可以在低带宽连接下工作，被专业人士和家庭用户广泛使用。NoMachine的主要功能高性能远程访问跨平台兼容性易于使用，因为用户界面友好提供强大的加密协议，如SSH、SSL及其他安全标准支持远程文件传输和打印服务允许从远程计算机进行音频和视频流媒体传输
高级情绪文案小柒情诗
01、觉得疲惫，方方面面。02、深夜总是和开心走散。03、今天好像只有天气很好。04、我两手空空，但心事重重。05、下雨了，我说的不是天气。06、时间会融化掉所有的尖锐。07、委曲求全不是公主的作风。08、这乱七八糟的生活还会好吗。09、活得太清醒是件不浪漫的事。10、减少没必要的倾诉及分享欲。11、事不会压垮人，但是情绪会。12、压制情绪这件事越来越顺手。13、你从人海来，终究回到人海去。14、
RCLAMP0504S.TCT 升特半导体TVS二极管无损传输+军工防护+纳米护甲 ESD防护芯片深圳市尚想信息技术有限公司 ESD防护芯片 Semtech USB4 车规电子 AI硬件
RCLAMP0504S.TCTSemtechTVS二极管阵列一、产品简介RCLAMP0504S.TCT是Semtech新一代超低电容TVS二极管阵列，专为USB4、Thunderbolt™4、HDMI2.1等超高速接口打造！以0.3pF行业最低电容和20Gbps无损传输能力，成为高端电子设备的"隐形防护盾"！二、五大颠覆性优势信号0损耗0.3pF超低电容（比前代降低40%），支持20Gbps超高速
Day10--栈与队列--232. 用栈实现队列，225. 用队列实现栈，20. 有效的括号，1047. 删除字符串中的所有相邻重复项，150. 逆波兰表达式求值
Day10–栈与队列–232.用栈实现队列，225.用队列实现栈，20.有效的括号，1047.删除字符串中的所有相邻重复项，150.逆波兰表达式求值232.用栈实现队列思路：用ArrayDeque来实现；有趣的dumpToStackOut();classMyQueue{DequestackIn;DequestackOut;publicMyQueue(){stackIn=newArrayDeque(
Docker部署Minio YiShuoChen666 eureka 云原生 docker minio
一、拉取镜像dockerpullminio/minio:RELEASE.2025-04-22T22-12-26Z注：这里使用的版本是RELEASE.2025-04-22T22-12-26Z，最新的版本Web-UI界面没有管理bucket和其它的操作按钮，需要通过mc命令来实现，这对于新手很不友好二、创建目录，来存放minio的配置和将来放的文件mkdir-p/home/minio/configmk
时间看得见（第408天/3650）瓜小西呀
【2020.04.05】此时此刻23:32，工作刚刚结束，第一天直播完成，稿子也刚刚完成，但是明天依旧要早起发文，今天六点惊醒一直到下午五点才眯了十分钟，感觉要累炸了。。。但愿明天一切顺利。
0415 爆文拆解练习 Ccrystal爱生活
❤️选题｜健康❤️标题｜“啥也不想干”，是身体给你最好的信号标题结构｜“一句话”+是...信号；❤️开篇｜悬念开头+阐述具体表现+案例+观点❤️结构｜01案例+过渡+案例+结尾反问02引用一句话+解析+阐述看法原因+案例+引用名人名言+解析总结03提出疑问+引用心理学家一个观点+解析+案例+案例总结+代入现实+阐述【行动】具体表现+结论+【不行动】行为阐述+总结❤️结尾04提出疑问+给出答案+具体
2020-04-06 紫洞箫
上午你又哭了一场。其实，我真的很理解你的感受。你真的是个好孩子乖孩子，吃过早饭你就乖乖自觉地去做题，虽然不是你想做的类型，可是还是认真地按照考试流程去做。我练字等着检查你的试卷，数学做完由于几个粗心的地方没有得一百分，我也没有苛责你。只是提醒你，以后要细心点，休息一会就去做语文，因为写话都是老生常谈，所以想让你做另外一个，可是你就是不同意。就依你，但是我提醒你要写出新的东西，不能像一年级那时候样简
2018-04-30 星期一晴 232 丽娜_550e
昨天累着起床有点晚！起床后儿子看见儿子已经穿戴整齐安静的看着电视。真是一个懂事的好孩子。问起儿子中午想吃什么？儿子答到红烧肉，让儿子抓紧时间写他的作业，昨天回老家估计也没有写！跟儿子说等你写完，自己的饭也就做好。焖上米饭看看时间十点多了拿出肉切成块。在手机上找了一个红烧肉做法，照着步骤去做，正好儿子写完我也做完。让儿子评价自己做的怎样？儿子用筷子尝后说好！自己再做个蘑菇汤便开始吃饭，红烧肉色香在那
ZAP漏洞扫描系列04:手动导入请求添加站点宁儿数据安全 #安全测试安全
ZAP漏洞扫描系列04:手动导入请求添加站点通过请求器“曲线救国”添加站点，可按以下步骤操作（本质是手动发请求让ZAP识别站点）：GET请求步骤1：在请求器构造目标站点请求在请求器的“请求”编辑框，替换默认内容为：点击“发送（Send）”按钮，ZAP会向http://10.1.1.xx:8081/发请求。GEThttp://10.1.1.xx:8081/HTTP/1.1host:10.1.1.xx
番茄畅听邀请码邀请码是多少？2024番茄畅听官方app邀请码（小编调查总结） e95cfad15310
番茄畅听APP的模式是非常简单的，在APP里没有复制的社交电商淘客的那一套会员体系。只有会员这么简单，相比其他的分级剥削制度，好得不要太多！番茄畅听邀请码邀请码是【47424044】【46740241】和【43530241】人们对付获取消息和娱乐资讯的需求也越来越急迫。然而，许多传统消息应用步调存在着加载速度慢占用大量手机内存等问题，这直接影响了用户的使用体验。番茄畅听邀请码是番茄畅听邀请码是番茄
中秋佳节话团圆风中的竹
中原焦点团队中级25期梁利坚持分享第304天今日中秋佳节，亦是婆婆的生日，今天孩子的姑姑们都要来串亲戚并为婆婆过生日，往年都是去饭店，今年婆婆要求在家过，我们也爽快地顺从老人的想法。昨晚睡得太晚了，再加上流鼻血，本来打算今早个老公一起去超市购物，准备，谁知早上超级不想动，老公说：“你再睡一会儿，我去买东西。”睡醒之后，一切收拾妥当回老家后，发现老公已经准备就绪，只等炒菜，摆盘，我完全插不上手，由于
2023-04-28《举杯畅饮的姐姐们》定档0428，三个女人一台戏，铁三角乘风破浪娱娱鱼
都市情感治愈短剧《举杯畅饮的姐姐们》定档0428。曾用名《开怀畅饮的姐姐们》。据说改编自韩剧《酒鬼都市的女人们》。金莎饰演的瞿洋，刘芸饰演的郭欣婷，双女主设定很带感。她们曾经在综艺《乘风破浪的姐姐2》中有过合作，这次的二度合作令人期待。加上姜嫄饰演的吴沛沛，组成铁三角闺蜜团。都说三个女人一台戏，更何况剧中有将近十个女人。该剧以中女时代为背景，以酒元素为契机，关注当代女性在职场和生活中的境遇，将她们
BEYOND BINARY REWARDS: TRAINING LMS TOREASON ABOUT THEIR UNCERTAINTY 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习人工智能语言模型自然语言处理机器学习深度学习
https://gist.github.com/josherich/8a30dbf3d6ae0cae1048c3331f38fe80https://gist.github.com/josherich/8a30dbf3d6ae0cae1048c3331f38fe801引言与此担忧一致，研究表明，即使最初校准良好的大型语言模型（LLMs）在RL训练后也会变得过度自信（Lengetal.,2
03月14日|Day76|每日复盘哆啦A宏
03月14日|Day76|每日复盘【03月14日我做了什么】01、06点30分准时起床；02、分发公益课课程链接至每位督导；03、家校共育学校推文，推两所学习，其余的学校等通知；04、羊皮卷一Day14每日语音诵读；05、论语第七集Day7语音诵读；06、10分钟极光英语Day18/Day180；07、佛学功课：药师经1部+药师佛号1080声+普门品3部；08、表妹一家人回来了，特别的开心；09、
Python 网络科学（三）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/3df7c5feb0bf40d7b9d88197a04b0b37译者：飞龙协议：CCBY-NC-SA4.0第八章：自我中心网络分析前一章内容非常丰富，我们学习了如何可视化和分析整个网络。相比之下，本章应该会感觉更简单，内容也会少得多。在之前的章节中，我们学习了如何获取和创建网络数据，如何从网络数据构建图形，如何清理图形数据，以及如何做一些有趣的事情
每日一思考20190425 一小玫
1-案例这周一我回家，奶奶给我煮了那种整个的鸭蛋吃，我很无奈，奶奶又不是不知道我不喜欢吃这种做法的鸭蛋，她还做给我吃。。之前不管是我回家，还是我爸妈，我弟弟，其他对奶奶来说重要的人回家去看他，她也会以同样的方式待客——煮鸡蛋。看到奶奶煮好了鸡蛋，除了无奈，还有一些懊恼，当时就拒绝了奶奶的好意，说我不喜欢吃，奶奶也说了一句:我也不喜欢这样吃鸡蛋，我喜欢煎蛋吃。那时候我本能反应回了一句:你不喜欢吃，还
2019-04-05 欢欢成长足迹
2019.4.5星期⑤天晴读经人员：妈妈、芷晴、芷翔读经第831天读经内容：妈妈、芷晴1、《伤寒论》2、《唐诗三百首》3、《庄子》读经内容：妈妈、芷翔1、《易经》2、《老子》天气如此灿烂，但心情却如此超糟糕，人最痛苦的是什么呢？我想，疼在表皮痛在心里，臭娃，今天一点都不听话，早晨和往常一样的读经汇报，本来是件很高兴的事情，值得很骄傲的事情，早晨起来一切都是那么的美好，但是糟糕的事情发生了，女儿本来
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少