Siomkos

CRF(条件随机场)知识整理

HMM建模序列学习问题时，由于引入了状态序列的马尔可夫性假设，限制了上下文特征的提取，相比之下，条件随机场(CRF)模型可以提供更多的上下文信息，且相比最大熵模型(MEM)，它也有效规避了标记偏置问题（具体请查看最大熵模型相关资料）。

一、马尔科夫网络

在马尔科夫链中，随机变量在时间上顺序产生，构成一个随机过程，那么，能不能将马尔科夫链的概念扩展到空间上呢？假设存在一组随机变量，它们之间存在着一些边连接，是否能假设它们所满足的马尔科夫性呢？

1.1 无向图和团

我们先简要回顾无向图的一些概念，在图论中，图由节点(node)集合和边(edge)集合构成，记作 $G = (V, E)$ ， $V=\{x_1,\dots,x_n\}$ 表示顶点集合， $E=\{(x_i,x_j)|x_i \rightarrow x_j\}$ 为边集合， $x_i \rightarrow x_j$ 表示节点 $x_i$ 能到达节点 $x_j$ ，在无向图中有 $x_i \rightarrow x_j$ 等价于 $x_j \rightarrow x_i$ 。
完全图指任意节点之间均存在一条边连接的无向图。一个无向图的子图指图节点集合和边集合的子集。无向图的完全子图称为一个团（clique）。
对于团，我们可以定义其节点上的非负函数，称为势函数。引入符号，记图 $C=(V_1,E_1)$ 为一个团，其中 $V_1=\{x_1,\dots,x_n\}$ 为节点变量，定义非负函数 $\phi_c(x_1,\dots,x_n)$ ，它称为团 $C$ 的势函数或势能函数，简记作 $\phi_c(\bold{x}_c)$ 。
到这里，可能会有些疑惑，势函数究竟具有怎样的物理意义呢？我个人理解，势函数描述了网络处于某种状态时的某一指标，可能是能量，如果将网络节点视为随机变量，并对势函数做归一化处理，也可将其视作概率。

1.2 马尔科夫网络的概念

现在，我们来回答本部分一开始提出的问题，在马尔科夫链中，我们假设的马尔科夫性认为当前时刻的随机变量分布仅与上一时刻的随机变量相关，如果给定一个无环网络，每个节点均代表一个随机变量，我们是否可假设该节点的概率分布仅与其邻居节点相关呢？这样，我们就得到了马尔科夫网络的基本定义，给定一个由随机变量构成的网络 $G = (V, E)$ ，节点 $x_i\in V$ 的条件分布满足：
$p(x_i|G \setminus \{x_i \})=p(x_i|N_i)$
这里， $N_i$ 表示节点 $x_i$ 的邻居节点集。那么，马尔科夫网络这样的性质带来了怎样的好处和便利呢？我们先来看一种新颖的分布函数。

1.3 吉布斯分布(Gibbs distribution)

上面提到过，团的势函数经过归一化后可以视为一种概率分布，现在我们来具体审视这种观点。同样，我们给定一个无环的随机网络（节点是随机变量） $G$ ，它可以分解为一些团（事实上都可以做到），团集合记作 $C=\{ c_1, \dots,c_m \}$ 。在其上定义势函数 $\{ \phi_{c_1}(\bold{x}_{c_1}),\dots,\phi_{c_m}(\bold{x}_{c_m}) \}$ ，则函数
$\Phi(G)=\frac{1}{\bold{Z}_{\phi}}\prod_{i=1}^m \phi_{c_i}(\bold{x}_{c_i})$
称为吉布斯分布。
这里，记 $\bold{x}=\bold{x}_{c_1}\cup\dots\cup\bold{x}_{c_m}$ ，
$\bold{Z}_\phi = \sum_{\bold{x}}\prod_{i=1}^m \phi_{c_i}(\bold{x}_{c_i})$
为归一化因子。

1.4 Hammersley-Clifford定理

下面我们来探究马尔科夫网络和吉布斯分布之间的关系。事实上，正如转移矩阵和初始分布完全描述了马尔科夫链的概率信息，吉布斯分布描述了马尔科夫网络的概率信息，我们自然要问，是不是任意给定的马尔科夫网络都能找到一个吉布斯分布与之对应？如果一个网络存在吉布斯分布，那么这个网络是否是马尔科夫网络呢？答案是肯定的，Hammersley-Clifford定理证明了马尔科夫网络和吉布斯分布之间的等价关系，该定理的证明过于复杂，请参考HC定理证明。

二、条件随机场的概念

上述马尔科夫网络又称作马尔科夫随机场。它考虑的是联合分布，而在序列学习问题中，我们通常都是给定观测序列，求状态序列的分布，因而，能否对条件分布也做类似假设呢？

2.1 一般定义

如果对条件分布也做类似假设，我们便得到了条件随机场的基本概念。与马尔科夫随机场不同的是，在条件随机场中我们考虑两组随机变量集，记为 $Y$ 和 $X$ ，且 $Y$ 构成一个随机网络 $G$ ，我们对条件分布 $p (Y ∣ X)$ 做如下假设，
$p(Y_v|X,G \setminus Y_v)=p(Y_v|X,Y_w\in N_v)$
这一假设类似于马尔科夫随机场中的假设，不同的是给定了另一组随机变量 $X$ ，我们大可不必理会它的作用，将其看做具有确定的状态即可。

2.2 线性链条件随机场

在NLP中，我们依然习惯于构建链式的模型，这一模型更适合于序列学习的情境，且具备更少的参数。基本假设如下
$p(Y_i|X, Y\setminus Y_i)=p(Y_i|X,Y_{i-1},Y_{i+1})$
在线性链条件随机场中，我们可以考虑更加简单的团和势函数形式，最简单的团有 $Y_{i-1}$ 和 $Y_i$ 构成，我们定义的势函数也具备更加简单的形式，即 $\phi(Y_{i-1},Y_i,X)$ ，注意这里由于是关于 $X$ 的条件分布，所以所有势函数都是关于整个序列 $X$ 的函数。条件随机场的结构图如下，

接下来，我们引入条件随机场（在接下来的部分，我们使用术语“条件随机场”时默认为“线性链条件随机场”）的吉布斯分布，这一过程称为参数化，我们重新规范以下符号以便于和序列学习中的符号一致，设标记序列为 $\bold{s}=\{s_1,\dots,s_T\}$ ，其中 $s_t \in S$ ，观测序列为 $\bold{o}=\{o_1,\dots,o_T \}$ ，其中 $o_t\in W=\{ w_i\}|_{i=1}^N$ ，则吉布斯分布为，
$p(\bold{s}|\bold{o})=\frac{1}{Z_o}\exp \left[ \sum_{t=1}^T\sum_{k} \lambda_kf_k(s_{t-1},s_t,\bold{o},t) \right]$
这里， $Z_o=\sum_{\bold{s}\in S^T}\exp \left[ \sum_{t=1}^T\sum_{k} \lambda_kf_k(s_{t-1},s_t,\bold{o},t) \right]$ 为归一化因子， $f_k(s_{t-1},s_t,\bold{o},t)$ 称为特征函数， $\lambda_k$ 是权重参数，它是定义势函数的关键所在，接下来，我们探讨一下特征函数的具体含义。

2.3 特征函数

要想理解特征函数，我们需要从标记序列和观测序列本身的含义考虑，也就是说在不同的模型应用场景下，特征函数的定义有着不同的方法，我们这里拿命名实体识别（NER）任务来举例，这一任务中，观测序列为单词序列，标记序列为当前词汇所属的命名实体类别（例如地区、人名、非实体等）。通常我们将特征函数定义为二值函数，简单来说，就是当 $s_{t-1},s_t$ 满足某一条件且观测序列 $\bold{o}$ 满足某一条件时，取1，否则取0。根据标记序列是否存在上下文联系，我们将特征函数又可以分类为两类，一类是Unigram特征，该特征和观测序列以及当前的状态 $s_t$ 相关；另一类是Bigram特征，该特征和观测序列以及 $s_{t-1}$ 和 $s_t$ 均相关。即
$\sum_{k} \lambda_kf_k(s_{t-1},s_t,\bold{o},t) =\sum_{k}\mu_kl_k(s_{t-1},s_t,\bold{o},t)+v_km_k(s_t,\bold{o},t)$
举一个具体的例子，有如下一个简单的标记序列和观测序列，

“Confidence in the pound is widely expected”
“B O B I O O O”

第一行为观测序列，第二行为标记序列，我们可以定义如下的一个特征函数，
$v(s_{t},\bold{o},t)=1$ ，若 $s_t=$ ’B’且 $o_t=$ ’Confidence’，否则为0。类似的，我们可以对词典中的每个单词都定义一个类似的特征函数。因此，给定一个语料库，我们无法给出所有特征函数的具体形式，但我们可以给出特征模板（具体请查看CRF++框架的使用教程）并且增加一个特征筛选程序。

显然，在定义了特征函数后，我们下一步需要做的就是推导CRF的训练过程。

三、前向后向算法

同样，条件随机场也面临组合爆炸的问题，但幸运的是条件随机场与隐马尔科夫模型之间存在结构相似性，于是我们考虑是否可以类似地定义前向变量和后向变量，用动态规划的方法来简化计算

3.1 前向向量

与HMM理论不同的是，在CRF中我们参数化了概率分布，推导的基本技术是吉布斯分布和团分解，在分布函数里，归一化因子 $Z_o$ 看起来似乎非常难以处理，由于它是一个常数，我们可以暂时不考虑它。
值得注意的是，在CRF理论中同样存在着状态（标签）的转移，因而我们是否可以类似地定义一个状态转移矩阵呢？答案是显然的，引入下面的符号
$M_t(y_i,y_j|\bold{o})=\exp\left[ \sum_k \lambda_k f_k(s_{t-1}=y_i,s_t=y_j,\bold{o},t)\right]$
它代表了非归一化的转移概率，简记为 $M_t(\bold{o})$ 。当然，为了书写方便，这里我们将两种特征函数合并。为了规范化，我们在原序列 $\bold{s}$ 中引入两个额外标记 $s_0$ 和 $s_{T+1}$ ，其状态索引分别为start和stop。我们定义一个向量序列 $\alpha_t(\bold{o})\in \mathbb{R}^N$ ， $N$ 为标签数，当 $t = 0$ 时，其第 $i$ 个元素 $\alpha_0(i|\bold{o})$ 满足满足
$\alpha_0(i|\bold{o})=\left \{ \begin{aligned} &1,\quad i=start \\ &0, \quad other \end{aligned} \right.$
且 $\alpha_t(\bold{o})$ 满足如下的迭代式，
$\alpha_t(\bold{o})=\alpha_{t-1}(\bold{o})M_t(\bold{o})$
稍加分析可知， $\alpha_t(j|\bold{o})$ 的概率意义是非规范化的 $\sum_{s_1,\dots,s_{t-1}}p(s_1,\dots,s_{t-1},s_t=y_j|\bold{o})$ 。事实上，上面的递推式之所以成立，其本质是由吉布斯分布的形式决定的。上述向量 $\alpha_t(\bold{o})$ 称为前向向量。

3.2 后向变量

类似地，我们定义后向向量 $\beta_t(\bold{o})$ ，其初始化为
$\beta_{T+1}(i|\bold{o})=\left \{ \begin{aligned} &1,\quad i=end \\ &0, \quad other \end{aligned} \right.$
它的递推式为
$\beta_t(\bold{o})^T=M_{t+1}(\bold{o})\beta_{t+1}(\bold{o})$
稍加分析，其概率意义为 $\sum_{s_{t+1},\dots,s_{T+1}}p(s_t=y_j,s_{t+1},\dots,s_{T+1}|\bold{o})$ 。

3.3 归一化因子的计算

接下来，我们考虑归一化因子 $Z_o$ 的计算，根据前向向量的定义，有
$\alpha_{T+1}(\bold{o})=\alpha_0(\bold{o})M_1(\bold{o})\dots M_{T+1}(\bold{o})$
且 $\alpha_{T+1}(\bold{o})$ 具有概率意义 $\sum_{\bold{s}\in S^T}p(\bold{s},s_{T+1}=y_j|\bold{o})$ ，而我们又知道 $s_{T+1}=y_{stop}$ ，因而 $\alpha_{T+1}(\bold{o})$ 的第 $s t o p$ 个元素应当被归一化为1，也就是说矩阵
$M_1(\bold{o})\dots M_{T+1}(\bold{o})$
的 $(s t a r t, s t o p)$ 处的元素为归一化因子，记作
$Z_o = \left( M_1(\bold{o})\dots M_{T+1}(\bold{o}) \right)_{(start, stop)}$
有了归一化因子的计算，我们能够推得下面这个重要结论，
$\begin{aligned} p(s_t=y_i|\bold{o})&=\sum_{s_1\dots s_{t-1},s_{t+1},\dots,s_T}p(\bold{s}|\bold{o}) &= \frac{\alpha_t(i|\bold{o})\beta_t(i|\bold{o})}{Z_o} \end{aligned}$
至此，训练模型前的一些准备工作已经完毕。

四、参数估计

接下来我们推导参数估计的方法，与HMM不同的是，CRF的训练是有监督的，即同时给定了训练集 $\{ (\bold{s},\bold{o})\}$ 。

4.1 参数梯度

我们首先构造如下的对数似然函数，其中参数为 $\Lambda=(\lambda_1,\dots,\lambda_k,\dots)$
$\begin{aligned} L(\Lambda)&=\log p(\bold{s|o})\\ &=\sum_{t=1}^T\sum_{k}\lambda_kf_k(s_{t-1},s_t,\bold{o},t)-\log(Z_o) \end{aligned}$
为了减少过拟合，我们这里引入 $l_2$ 正则项，当然，也可以引入 $l_1$ 正则。于是，有
$L(\Lambda)=\sum_{t=1}^T\sum_{k}\lambda_kf_k(s_{t-1},s_t,\bold{o},t)-\log(Z_o)-\sum_{k}\frac{\lambda_k^2}{2\sigma^2}$
现在，我们求偏导数，得
$\frac{\partial L}{\partial \lambda_k} =\sum_{t=1}^Tf_k(s_{t-1},s_t,\bold{o},t)-\sum_{t=1}^Tp(\bold{s}|\bold{o})f_k(s_{t-1},s_t,\bold{o},t)-\frac{\lambda_k}{\sigma^2}$
引入期望的记号，上式第一项为
$E[f_k]=\sum_{t=1}^Tf_k(s_{t-1},s_t,\bold{o},t)$
第二项为，
$\widetilde E_{\bold{s|o}}[f_k]=\sum_{t=1}^Tp(\bold{s}|\bold{o})f_k(s_{t-1},s_t,\bold{o},t)$
因此，梯度可以简记为
$\frac{\partial L}{\partial \lambda_k} =E[f_k]-\widetilde E_{\bold{s|o}}[f_k]-\sum_k\frac{\lambda_k}{\sigma^2}$
由于 $p(\bold{s|o})$ 的存在，上面的梯度很难求零点，因而也就难以得出CRF解的解析形式。

4.2 优化算法

需要说明的是，CRF的似然函数为凸函数，因而存在全局最优，我们考虑利用数值算法进行求解，比较快速的是牛顿法，但由于这里参数较多，内存开销较大，因而考虑拟牛顿法，性能较好的是L-BFGS算法，其基本原理可以参考我的另一个博客L-BFGS优化算法基本原理，它类似于一个黑盒子，需要传入变量值和梯度值就可以进行迭代运算。

五、可用的工具

CRF++是一个比较轻量级，速度也较快的线性链条件随机场工具，由C++语言实现，同时具有python接口。

[参考资料]
[1]: John Lafferty, Andrew McCallum, Fernando Pereira.Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data

Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
java学习笔记8 幸福，你等等我学习笔记 java
一、异常处理Error：错误，程序员无法处理，如OOM内存溢出错误、内存泄漏...会导出程序崩溃1.异常：程序中一些程序自身处理不了的特殊情况2.异常类Exception3.异常的分类:（1）.检查型异常(编译异常):在编译时就会抛出的异常(代码上会报错),需要在代码中编写处理方式(和程序之外的资源访问)直接继承Exception（2）.运行时异常:在代码运行阶段可能会出现的异常,可以不用明文处理
2025 最强 Agent 智能体学习笔记 (71) 一刀7段学习笔记人工智能
Agent智能体的系统学习与职业发展核心内容概览本集是《2025最强Agent智能体全套教程》的第72集，聚焦Agent智能体领域的系统学习方法与职业发展路径，系统梳理了从入门到专家的能力体系、关键学习资源、职业方向选择及行业发展机遇。内容结合技术趋势与职场需求，为不同背景的学习者（学生、开发者、转行人士）提供清晰的成长蓝图，帮助其在Agent智能体领域高效成长，实现职业目标。系统学习的能力体系与
【学习笔记】CBT工作坊第二天：动机驱动行为花团与芥末
什么叫动机?在认知行为疗法中，动机是引导我们行为的各种外在和内在的力量，唤起行为起始的力量，朝着一定目标与方向进行的力量，维持或停止的力量。也就是说，在我们的所有行为包括没有做的行为背后，都隐藏着某种动机。那么，动机一般有哪些呢?大家一般听说过的，是马斯洛的需求层次理论。在他的金字塔理论中，将动机需求分为了6个层次，从初级到高级分别是：生存(活着的必须条件)--安全(活下去)--爱--尊重--自我
图解系统的学习笔记--硬件结构什么蜜桃绵绵冰操作系统学习笔记
CPU是如何执行程序的？图灵机的工作方式图灵机的基本组成纸带：纸带由一个个连续的格子组成，每个格子可以写入字符，纸带就好比内存，而纸带上的格子的字符就好比内存中的数据或程序读写头：可以读取只带上任意格子的字符，也可以把字符写入到纸带的格子读写头上的部件-存储单元、控制单元、运算单元存储单元用于存放数据控制单元用于识别字符是数据还是指令、以及控制程序的流程等预算单元用于执行运算指令冯诺依曼模型计算机
Spring学习笔记07——SpringBoot中关于接口文档管理的注解 Shaoxi Zhang Java spring 学习笔记
一、Lombok注解@Data：生成所有字段的getter/setter、toString()、equals()和hashCode()。@Getter/@Setter：单独为所有字段或指定字段生成getter/setter。importlombok.Data;@DatapublicclassUser{privateLongid;privateStringname;}编译后，Lombok会为id和n
零基础入门uniapp Vue3组合式API版本鹤早早 uni-app
前言：小程序学习笔记，课程来源up主咸虾米_。仅记录笔记，大家想学习可以去关注他。1.已安装HBuiderX（目前是4.36版本），微信开发者工具（但还没注册小程序码），相关配置OK了。1.16相关架构学习1.pages-index-index.vuebox1box2.layout{border:1pxsolidred;.box1{border:1pxsolidgreen;}.box2{borde
JavaWeb（苍穹外卖）--学习笔记14 哈哈哈哈哈0627 学习笔记
前言终于开始学习做项目了，本篇文章是学习B站黑马程序员苍穹外卖的学习笔记。我的学习路线是Java基础语法-JavaWeb-做项目，管理端的功能学习完之后，就进入到了用户端微信小程序的开发，这篇文章是把我觉得JavaWeb的学习中比较重要的内容写一个总结（其实因为学到下单支付太难了我复习复习前面的）Controller层（这里只讲讲几个需要注意的注解）管理服务端的动态资源：SpringFramewo
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
Langchain学习笔记(十二)：Memory机制与对话管理 zhangsan0933 LangChain langchain 学习笔记
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建智能对话系统时，记忆功能是至关重要的。想象一下，如果每次与AI对话都像第一次见面一样，无法记住之前的交流内容，这样的体验将是多么糟糕。LangChain的Memory机制正是为了解决这个问题而设计的，它让AI能够"记住"对话历史，从而提供更加
OkHttp学习笔记5--Events 雪晨杰
EventsEventsallowyoutocapturemetricsonyourapplication’sHTTPcalls.Useeventstomonitor:事件允许您捕获应用程序HTTP调用的度量。使用事件来监控:ThesizeandfrequencyoftheHTTPcallsyourapplicationmakes.Ifyou’remakingtoomanycalls,oryour
CTF-Web学习笔记：SQL注入篇编程到天明 CTF sql 网络安全
目录引言一、SQL注入的基础概念1.什么是SQL注入？2.SQL注入的成因二、CTF中常见的SQL注入类型1.按参数类型分类2.按注入方式分类3.其他进阶类型三、CTF实战技巧：从找注入点到拿Flag1.如何判断是否存在注入？2.快速确定数据库类型3.常用工具辅助4.绕过WAF（Web应用防火墙）四、CTF题目示例：一道报错注入实战题目背景解题步骤五、总结与提升引言在CTF（CaptureTheF
Linux驱动开发学习笔记-设备树
1、设备树1)将描述板级硬件信息的内容都从Linux内中分离开来，用一个专属的文件格式来描述，这个专属的文件就叫做设备树，文件扩展名为.dts。一个SOC可以作出很多不同的板子，这些不同的板子肯定是有共同的信息，将这些共同的信息提取出来作为一个通用的文件，其他的.dts文件直接引用这个通用文件即可，这个通用文件就是.dtsi文件，类似于C语言中的头文件。.dts描述板级信息(也就是开发板上有哪些I
进阶向:基于Python的本地文件内容搜索工具超级小识 Python进阶有趣的项目 python 开发语言
概述大家好！今天我们将一起学习如何用Python创建一个简单但强大的本地文件内容搜索工具。这个工具特别适合处理大量文本文件时的快速检索需求。为什么要学习这个工具如果你刚接触编程，完全不用担心！我会从零开始讲解，确保每一步都清晰易懂。想象一下这个常见场景：你有一个装满各种文档的文件夹（可能是工作文档、学习笔记或项目文件），现在想快速找到所有包含"重要笔记"或"项目需求"等关键字的文件。手动逐个打开文
Freertos学习笔记（一）-----FreeRTOS基本知识努力搬砖的扁鱼嵌入式开发学习笔记
RTOS“realtime”（实时）指的是系统对外部事件能够在规定的、可预测的时间内作出响应。具体含义如下：确定性（Determinism）：FreeRTOS强调事件响应的可预测性。无论系统有多少任务，关键操作（比如任务切换、中断处理）都能在已知的最坏情况下完成。这意味着开发者可以预估任务的最大响应延迟。任务优先级与抢占：FreeRTOS支持任务优先级和抢占调度。高优先级任务可以在更低优先级任务运
# Linux学习笔记 - 4 Norvyn_7 Linux学习 linux 学习笔记
Linux学习笔记-4本篇将介绍Linux中root用户管理、用户与用户组操作、权限控制信息以及chmod/chown命令的使用。1.root用户（超级管理员）root用户拥有最大的系统操作权限，可执行所有操作。1.1su和exitsu命令：切换用户语法：su[-][用户名]-表示切换后加载目标用户的环境变量（建议添加）。不加用户名时默认切换到root用户。示例：su-root#切换到root用户
动态链接库(Dynamic Link Library)学习笔记 peixian2003 编程
经常忘记http://blog.csdn.net/yxin1322/article/details/638156动态链接库(DynamicLinkLibrary)学习笔记作者：yxin1322blog：http://blog.csdn.net/yxin1322转载请注明出处我对动态链接和动态链接库的概念并不陌，但一直以来就停留在概念的层面上，没有更深入的了解。今天抽空看了一下有关动态链接和动态链接
2022-10-28晨间日记明心279
今天是什么日子起床：6.00就寝：天气：多云心情：开心纪念日：任务清单昨日完成的任务，最重要的三件事：改进：习惯养成：周目标·完成进度学习·信息·阅读八字笔记整理紫微斗数学习笔记健康·饮食·锻炼耳功八法81站桩35早上小米醪糟汤圆荷包蛋中午馒头蔬菜汤晚上煮泡面人际·家人·朋友工作·思考最美好的三件事1.我是最善良，最可爱，最大度，最宽容，最仁慈，最宽厚，最有魅力的优雅知性女子。我每天都很开心，都很
java23种设计模式-外观模式千里码！设计模式设计模式外观模式
外观模式（FacadePattern）学习笔记定义外观模式属于结构型设计模式，提供一个统一的接口来访问子系统中的多个接口。它通过定义一个高层接口简化客户端与复杂子系统的交互。适用场景为复杂子系统提供简单入口解耦客户端与子系统分层构建系统（各层通过外观类交互）遗留系统重构（用外观类封装旧接口）模式结构类图ClientFacade-subsystemA:SubsystemA-subsystemB:Su
语言合成模型Spark-TTS-0.5B学习笔记 tutgxuzyj spark 学习笔记
语言合成模型Spark-TTS-0.5B学习笔记语言合成是通过计算机技术将文字信息转换为自然流畅的语音输出，模拟人类语音。一、下载Spark-TTS-0.5B项目下载链接：https://github.com/SparkAudio/Spark-TTS.git注：需要科学网络。进入Spark-TTS文件夹，启动命令行窗口。创建Conda环境：condacreate-nsparktts-ypython
编程与数学 03-002 计算机网络 10_应用层协议明月看潮生编程与数学第03阶段计算机网络编程与数学青少年编程
编程与数学03-002计算机网络10_应用层协议一、常见的网络应用（一）Web应用（二）电子邮件（三）文件传输二、Web应用协议（HTTP/HTTPS）（一）HTTP协议的请求与响应格式（二）HTTPS的安全机制三、电子邮件协议（SMTP、POP3、IMAP）（一）邮件发送与接收的协议工作原理（二）各协议的功能特点四、总结摘要：本文是计算机网络课程中关于应用层协议的学习笔记。应用层协议是计算机网络
泷羽sec专题课笔记-- Linux作业--开机自启动方法以及破解 grrrr_1 笔记 web安全网络
本笔记为泷羽sec《红队全栈课程》学习笔记，课程请可自行前往B站学习，课程/笔记主要涉及网络安全相关知识、系统以及工具的介绍等，请使用该课程、本笔记以及课程和笔记中提及工具的读者，遵守网络安全相关法律法规，切勿进行违法违规违纪的操作。写在最前面的话，我们为什么要学习网络安全这门技术：维护国家安全防范网络攻击：网络安全威胁已成为国家安全的重要挑战。学习网络安全有助于识别和防范来自国内外的网络攻击，防
编程与数学 03-002 计算机网络 07_路由算法明月看潮生编程与数学第03阶段计算机网络算法智能路由器青少年编程编程与数学
编程与数学03-002计算机网络07_路由算法一、静态路由算法（一）手工配置路由表的方法（二）静态路由的优缺点二、动态路由算法原理（一）距离矢量算法（如贝尔曼-福特算法）（二）链路状态算法（如迪杰斯特拉算法）三、路由算法的性能比较（一）收敛速度（二）开销（三）适用场景四、总结摘要：本文是计算机网络课程中关于路由算法的学习笔记。路由算法是网络层的重要组成部分，用于选择最佳路径将数据包从源节点传输到目
Vue 框架学习笔记
作为初学者对于Vue框架的学习笔记总结了Vue框架的核心知识点，包括：1.基础概念：渐进式框架、两种使用方式、Vue实例创建流程、模板语法和响应式特性。2.常用指令：详细介绍了v-html、v-show/v-if、v-for、v-on、v-bind、v-model等10个指令的功能和用法。3.组件开发：组件结构、注册方式（全局/局部）、数据传递（Props）、组件通信（自定义事件/插槽）、生命周期
JavaWeb（苍穹外卖）--学习笔记11（Filter（过滤器）和 Interceptor（拦截器））哈哈哈哈哈0627 JavaWeb（苍穹外卖）学习笔记
前言本篇文章是学习B站黑马程序员苍穹外卖的学习笔记。我的学习路线是Java基础语法-JavaWeb-做项目，管理端的功能学习完之后，又进入用户端的登陆界面的开发，我们可以看到在后续的请求当中，都会在请求头中携带能验证身份的凭证到服务端，而服务端需要统一拦截所有的请求，从而判断是否携带的有合法的JWT令牌，下面主要来说说负责拦截的Filter（过滤器）和Interceptor（拦截器）（感觉整个项目
编程与数学 03-002 计算机网络 08_网络层的IP地址
编程与数学03-002计算机网络08_网络层的IP地址一、IP地址的分类与特点（一）IPv4地址的分类（A、B、C、D、E类）（二）各类地址的范围与用途二、子网划分与超网划分（一）子网划分的方法与目的（二）超网划分的原理与应用三、特殊IP地址（一）广播地址（二）回环地址（三）网络地址（四）私有地址（五）多播地址四、总结摘要：本文是计算机网络课程中关于网络层IP地址的学习笔记。IP地址是网络层的核心
【前端学习笔记】CSS的两种盒子模型花上
CSS有两种盒子模型。一种是W3C的标准盒子模型。另一种是IE的盒子模型。W3C的标准盒子模型中width包括了width+padding+border。IE的盒子模型的width只有width，不包含padding和border。box-sizing的作用如果想要切换盒子模型，可以使用box-sizing属性。例：box-sizing:content-box是W3C盒子模型 box-sizin
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

CRF(条件随机场)知识整理

目录

CRF(条件随机场)知识整理

一、马尔科夫网络

1.1 无向图和团

1.2 马尔科夫网络的概念

1.3 吉布斯分布(Gibbs distribution)

1.4 Hammersley-Clifford定理

二、条件随机场的概念

2.1 一般定义

2.2 线性链条件随机场

2.3 特征函数

三、前向后向算法

3.1 前向向量

3.2 后向变量

3.3 归一化因子的计算

四、参数估计

4.1 参数梯度

4.2 优化算法

五、可用的工具

你可能感兴趣的:(学习笔记)