Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classification

1 标题+作者

KPT，将知识引入Prompt Verbalizer 处理文本分类任务，清华大学

2 摘要

在低数据场景下，Prompt-tuning（PT）比fine-tuning（FT）效果好，PT将分类问题转为带掩码的语言模型问题，关键就在于如何构建一个verbalizer实现标签空间到标签词空间的映射。现有的verbalizer大多由人工构建或者基于梯度下降进行搜索得到，不足在于标签词的覆盖范围小、存在巨大的偏差（bias） 。

KPT通过引入额外的知识扩展标签词空间，为了更好的利用知识利用PLM重新定义了扩展后的标签词空间，并在zero-shot和few-shot的文本分类任务中表现出色

3 结论

在zero-shot和few-shot学习中KPT都有不错的性能

Open questions：
（1）用更精细化的方法从verbalizer中选择有用的标签词
（2）在模板构造和verbalizer设计方面用更好方法结合知识库和prompt-tunig
（3）探索KPT在其他任务上的应用

4 导言

PLM在预训练过程中获得了丰富的知识，如何有效利用PLM中的知识越来越受关注

fine-tuning

增加额外的分类器，在分类的目标函数下继续训练模型，有监督任务中且有足够的训练实例情况下表现好

在zero-shot和few-shot学习场景下应有fine-tuning仍是挑战，而prompt-tuning在zero-shot和few-shot任务中能有出色的表现

prompt-tuning

使用方法是将输入语句嵌入自然语言模板，让PLM进行掩码语言建模

举例（对句子x进行主题分类）
x：“What’s the relation between speed and acceleration?”-----class：SCIENCE

prompt-tuning template：
“A [MASK] question: x” — 预测在[MASK]中填入标签词science — class：SCIENCE

从标签词science映射到类标签SCIENCE就需要用到verbalizer

Verbalizer

人工制作：设计者对每一类标签写单个标签词对应（one-to-one），不足在于标签词包含的信息有限
如：{science} $\to$ SCIENCE，但没考虑到信息更丰富的相关词“physics”和“maths”

使用梯度下降自动搜索最佳的verbalizer：归纳出一些在词义上与类名相似但在表面形式上不同于类名的单词，不足在于这种基于优化的扩展很难跨粒度推断单词，比如从“science” $\to$ “physics”

knowledgeable prompt-tuning：不基于优化，更加适用于zero-shot学习

KPT

（1）Construction：引入额外知识为每一个类标签生成对应的一个标签词集，扩展的标签词并不仅仅是彼此的同义词，而且涵盖了不同的粒度和方面，因此比类名更全面、更公正
（2）Refinement：使用PLM对扩展的标签词进行降噪，对于zero-shot学习，使用contextualized prior剔除先验概率低的词，来自KB的词可能存在极其不同的先验概率，提出了一种鲁棒的校正方法contextualized calibration；对few-shot学习，对每个标签词分配一个可学习的权重。
（3）Utilization：使用普通的平均损失函数或一个加权平均损失函数，expended verbalizers将一组标签单词的分数映射到标签的分数

5 相关工作

相关工作主要涉及：prompt-tuning, verbailizer construction, knowledge-enhanced PLMs, zero-shot and few-shot text classification

Prompt-tuning

在大规模预训练模型GPT-3使用、小规模语言模型使用、在文本分类和SuperGLUE任务及其他任务中使用

Verbalizer Construction

human-written verbalizers、自动的方法搜寻最佳的verbalizers（缺点在于标签词最多不超过10个，且大部分是类别名称的同义词，不全面），KPT可以跨粒度为每个类生成和有效利用100多个相关标签词且能有效应用在zero-shot学习中

Knowledge Enhanced PLMs

在知识增强应用在预训练阶段、fine-tuning阶段、文本分类任务。KPT在prompt-tuning阶段进行数据增强

6 KPT模型

$\mathcal{M}$ ：为在大规模语料上预训练后的语言模型

输入句子： $X=(x_0,x_1,...,x_n)$

句子 $X$ 属于类标签 $y\in\mathcal{Y}$

原始问题：classify the sentence x =“What’s the relation between speed and acceleration?” into label SCIENCE (labeled as 1) or SPORTS (labeled as 2)

prompt-tuning template:

$X_p=[CLS]\quad A \quad[MASK] question : X$

对每一个填入 $[M A S K]$ 的词 $v$ 计算概率： $P_{\mathcal{M}}([MASK]=v|X_p)$

定义一个 $v e r b a l i z e r$ 映射： $f:\mathcal{V}\mapsto\mathcal{Y}$ 及 $\mathcal{V}$ 的一个子集 $\mathcal{V_y}$ 映射到标签 $y$ 即 $\cup_{y\in\mathcal{Y}}\mathcal{V}_y=\mathcal{V}$

函数 $g$ ：将标签词的概率转换到标签的概率，如一般的prompt-tuning中定义 $\mathcal{V}_1=\{“science”\}$ , $\mathcal{V}_2=\{“sports”\}$ ，如果 “science”的概率远大于“sports”的概率，则判为SCIENCE类

Verbalizer Construction

标签词应有两个特性：覆盖范围广、偏差小

对于主题分类任务
选择 Related Words 库（来源word embeddings, ConceptNet, WordNet）

$N_\mathcal{g}(v)$ 表示Related Words中与词 $v$ 相关系数 $s>\eta$ （阈值）的相关词集合

于是有 $\mathcal{V}_y=N_\mathcal{g}(v)\cup\{v\}$

对于情感分类任务
引入positivewords、negativewords知识库，尽可能多地选择出关于positive和negative的表达

举例

Verbalizer Refinement

因为知识库的词汇不是为PLM量身定制的，所以收集到的知识丰富的词汇分析器可能会存在噪声

Zero-shot Refinement

（1）OOV (out-of-vocabulary)：有些词对PLM来说是词表外的，但是这些词可能也包含信息，为了能用PLM预测出这些词，使用每个token被填充到掩码位置的平均概率作为这些单词的概率

（2）rare words：使用上下文先验剔除低于一定阈值的稀有词

$\quad\quad$ 对于文本分类任务

定义句子 $X$ 在语料库中的分布为 $\mathcal{D}$ ，
对每个句子计算每个标签词 $v$ 在掩码位置的预测概率 $P_{\mathcal{M}}([MASK]=v|X_p)$ ，
通过对整个句子分布求期望，可得到在掩码位置的标签词的先验分布：
$P_{\mathcal{D}}(v)=\mathbb{E}_{X\sim\mathcal{D}}P_{\mathcal{M}}([MASK]=v|X_p)$
同时根据经验得到，从训练集中采样得到一个小规模的无标签支持集也能估算 $P_{\mathcal{D}}(v)$
假设输入样本 $\{x\in\tilde{C}\}$ 具有均匀的先验分布，于是contextualized prior可由下式计算：
$P_{\mathcal{D}}(v)\approx\dfrac{1}{\tilde{|C|}}\sum_{x\in\tilde{C}}P_{\mathcal{M}}([MASK]=v|X_p)$

（3）标签词先验概率的差异大：使用标签词的contextualized prior校正预测的分布

$\quad\quad$ contextualized calibration (CC)
$\tilde{P_{\mathcal{M}}}([MASK]=v|X_p)=\dfrac{P_{\mathcal{M}}([MASK]=v|X_p)}{P_{\mathcal{D}}(v)}$

使用contextualized calibration (CC)的优势在于只需要使用一个小规模的无标签支持集即可得到更好且更稳定的结果

Few-shot Refinement

已得到识别每个标签词对预测的影响，首先剔除归属多个标签的词，并给每个标签词 $v$ 分配可学习的权重 $\omega_v$ ，权重组合成一个向量 $W\in\mathbb{R}^{|V|}$ ，以零向量作为初始化

在每个标签词集 $\mathcal{V}_y$ 内对权重进行归一化处理：
$\alpha_v=\dfrac{exp(\omega_v)}{\sum_{u\in\mathcal{V}_y}exp(\omega_u)}$
在训练阶段，期望噪声词的权重尽可能小，以减少对预测的影响
在few-shot设置中，不需要进行校正，标签词的概率能被训练到所期望的大小
如 $\tilde{P_{\mathcal{M}}}([MASK]=v|X_p)=P_{\mathcal{M}}([MASK]=v|X_p)$

Verbalizer Utilization

将每个refine的标签词的预测概率映射到类标签y上

Average

假设 $\mathcal{V}_y$ 中每个词 $v$ 对类标签 $y$ 的贡献相同，用在 $\mathcal{V}_y$ 上的预测得分的平均值作为标签 $y$ 的预测得分：
$\hat{y}=argmax_{y\in\mathcal{Y}}(\dfrac{1}{|\mathcal{V}_y|}\sum_{v\in\mathcal{V}_y}\tilde{P_{\mathcal{M}}}([MASK]=v|X_p))$

Weighted Average

将标签词得分的加权平均作为预测得分
$\hat{y}=argmax_{y\in\mathcal{Y}}\dfrac{exp(s(y|X_p))}{\sum_{y'}exp(s(y'|X_p))}$
其中 $s(y|X_p)=\sum_{v\in\mathcal{V}_y}\alpha_vlogP_{\mathcal{M}}([MASK]=v|X_p)$
可应用交叉熵损失进行优化

Experiments

Datasets and Template

由于人工设计的模板已被证明比自动学习出的模板更加有效，每个数据集使用了4个人工设计的模板，报告4个模板的评价结果和最佳结果

AG’s News数据集模板

DBPedia数据集模板

Amazon数据集模板

IMDB数据集模板

Setting

PLM：RoBERTa $_{large}$
Metrics：Mircro-F1
Zero-shot：无标签支持集大小： $|\tilde{C}|=200$ ，选取5次，去除稀有词的阈值 $\eta=0.5$
Few-shot：设置5、10、20-shot

Baseline

Regular prompt-tuning（标签词只有类名称）
Prompt-tuning（CC）（无few-shot实验）
Fine-tuning（无zero-shot实验）
文本分类任务SOTA：LOTClass（unsupervised）、UDA（semi-supervised）

Main Results

Zero-shot

KPT始终优于PT和PT+CC基线，这表明了方法的有效性
通过所有模板的平均性能或最佳性能模板实现了优于LOTClass的性能，即使没有利用大量的未标记的训练集，主题分类比情感分类需要更多的外部知识
在DBPedia数据集上，CC提供了巨大的改善，PT+CC比PT提高了高达7.4%

Few-shot

KPT始终优于PT，特别是在5-shot和10-shot实验中
对于20-shot，认为标签实例的数量足以优化标签词的嵌入，使其远离原来的词嵌入，从而使知识丰富的语义，所以引入知识的verbalizer提供较少的帮助
KPT在各个任务中的表现都相对稳定，且其所用的数据更少

Analysis

CC对zero-shot的影响

现有的方法提出Domain Conditional PMI（ $PMI_{DC}$ ）来校准分布，它直接测量给定原始模板的[MASK]位置预测的标签词的先验概率，而不使用语料库中的实例填充模板

将我们的方法与PMIDC进行比较，并进一步评估需要多少实例才能产生令人满意的校准结果

我们发现 $|\tilde{C}|\sim100$ 足以产生令人满意的校准结果，并且利用这样一个小的未标记支持集产生比 $PMI_{DC}$ 更好的结果

CC对few-shot是否有帮助

假设标签词的后验概率只需要少量的训练实例即可以被训练到所需的大小，在10-sot场景下进行实验结果如下，CC对few-shot的只有少量的影响

Top预测词的多样性

KPT可通过不同粒度生成多样的标签词，不仅类似于类名，还涉及topic的各方面

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
LeetCode1047：删除字符串中的所有相邻重复项一个小猴子｀ LeetCode 算法数据结构 c++leetcode
题目描述给出由小写字母组成的字符串S，重复项删除操作会选择两个相邻且相同的字母，并删除它们。在S上反复执行重复项删除操作，直到无法继续删除。在完成所有重复项删除操作后返回最终的字符串。答案保证唯一。示例：输入：“abbaca”输出：“ca”解释：例如，在“abbaca”中，我们可以删除“bb”由于两字母相邻且相同，这是此时唯一可以执行删除操作的重复项。之后我们得到字符串“aaca”，其中又只有“a
学习JavaEE的日子 Day32 线程池 A 北枝学习JavaEE 学习 java-ee java 线程池
Day32线程池1.引入一个线程完成一项任务所需时间为：创建线程时间-Time1线程中执行任务的时间-Time2销毁线程时间-Time32.为什么需要线程池(重要)线程池技术正是关注如何缩短或调整Time1和Time3的时间，从而提高程序的性能。项目中可以把Time1，T3分别安排在项目的启动和结束的时间段或者一些空闲的时间段线程池不仅调整Time1，Time3产生的时间段，而且它还显著减少了创建
llama.cpp 编译安装@Ubuntu skywalk8163 项目实践人工智能 llama ubuntu linux 人工智能
在Kylin和Ubuntu编译llama.cpp，具体参考：llama模型c语言推理@FreeBSD-CSDN博客现在代码并编译：gitclonehttps://github.com/ggerganov/llama.cppcdllama.cppmkdirbuildcdbuildcmake..cmake--build.--configRelease#可选安装makeinstall#或可选添加路径ex
使用多线程的方式模拟高并发请求接口，用于自测接口的稳定性【项目】还算善良_ 私有代码库工具类 java list 数据结构
packagecom.gitee.taven.test;importcom.gitee.taven.ApiResult;importcom.gitee.taven.aop.RepeatSubmitAspect;importorg.slf4j.Logger;importorg.slf4j.LoggerFactory;importorg.springframework.beans.factory.an
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
枚举使用笔记万变不离其宗_8 项目笔记笔记
1.java枚举怎么放在方法上面的注释里面/***保存*@paramuserId用户id*@paramtype见枚举{@linkcom.common.enums.TypeEnum}*@return*/voidsave(LonguserId,Stringtype);
2019-04-02 雨弄风
预约羽毛球2个小时，外面下着雨，影响了打羽毛球的心情，因为雨点打在室内羽毛球室的顶棚上，顶棚是一层铁皮，故而声音很大，有些位置还漏雨呢。11个人打2个场地，几乎没有什么休息时间，感觉还行吧，赢多输少。回家后喝了1小瓶LEObeer,一点点炒米饭，感觉还行吧。但晚上很久也睡不着，也许是之前喝了一瓶能量饮料，也许是太累了，身体的一种机能反应吧。中午和晚上看了2遍欢乐喜剧人第5季20190331，第一个
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
第七章索引及执行计划，存储引擎执笔为剑 #MySQL运维篇编辑器 mysql
第七章索引及执行计划，存储引擎1，索引及执行计划1，作用：提供类似书目录的作用，目的是优化查询2，所用的种类（根据算法）B树索引Hash索引R树FulltextGIS3，B树基于不同的查找算法分类介绍B-tree：在范围查询方面提供了更好的性能（>showengines;#存储引擎作用在表上，不同的表可能有不同的存储引擎mysql>select@@default_storage_engine;#查
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
COMP315 JavaScript Cloud Computing for E Commerce zhuyu0206girl javascript 开发语言 ecmascript
Assignment1:Javascript1IntroductionAcommontaskincloudcomputingisdatacleaning,whichistheprocessoftakinganinitialdatasetthatmaycontainerroneousorincompletedata,andremovingorfixingthoseelementsbeforeform
kafka-eagle 配置文件修改使用自带的数据库 bright future cheer kafka 数据库分布式
######################################multizookeeper&kafkaclusterlistSettingsprefixedwith‘kafka.eagle.’willbedeprecated,use‘efak.’instead######################################efak.zk.cluster.alias=clu
二叉树|617.合并二叉树亦小河算法
力扣题目链接classSolution{public:TreeNode*mergeTrees(TreeNode*t1,TreeNode*t2){if(t1==NULL)returnt2;if(t2==NULL)returnt1;//重新定义新的节点，不修改原有两个树的结构TreeNode*root=newTreeNode(0);root->val=t1->val+t2->val;root->lef
C语言-数据在内存存储白榆maple c语言开发语言
目录一、整数在内存中存储1.整数在内存中的存储2.大小端字节序2.为什么有大小端3.大小端判断二、浮点数在内存中的存储1.V=(−1)^s∗M*2^EIEEE754规定：2.浮点数存的过程3.浮点数取的过程E不全为0或不全为1E全为0E全为1题⽬解析一、整数在内存中存储1.整数在内存中的存储在内存中存储的数据是二进制，整数的2进制表示方法有三种，即原码、反码和补码有符号的整数，三种表示方法均有符号
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
并发环境下wait与sleep的区别才艺のblog java 数据库
1、归属问题sleep是Thread类的静态方法而wait是object的成员方法2、唤醒问题执行sleep(long)和wait(long)的线程都会在等待相应毫秒后醒来wait(long)/wait()可以被notify()/notifyAll()唤醒，但sleep(long)只会等待时间结束3、锁释放问题wait方法的调用必须先获取wait对象的锁，而sleep则无此限制wait方法执行后会
基于PIL实现亮度、噪声、随机黑块数据增强小陈phd python numpy 人工智能
importosimportshutilfromPILimportImage,ImageEnhanceimportnumpyasnpimportrandomfromtqdmimporttqdm#ColorJitteringfunctiondefapply_color_jitter(image,brightness=0.5,contrast=0.5,saturation=0.5):"""Applyc
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
第六届蓝桥杯大赛软件赛省赛Java 大学C组题解爱跑步的程序员~ 刷题蓝桥杯省赛
文章目录A隔行变色思路解题方法复杂度CodeB立方尾不变思路解题方法复杂度CodeC无穷分数思路解题方法复杂度CodeD奇妙的数字思路解题方法复杂度CodeE移动距离思路解题方法复杂度CodeF垒骰子思路解题方法复杂度CodeA隔行变色思路这是一个简单的计数问题。我们需要找出21到50之间的奇数数量。奇数行将被染成蓝色，偶数行将被染成白色。解题方法我们可以使用一个for循环从21遍历到50，然后使
零基础机器学习(5)之线性回归模型的性能评估一只特立独行猪机器学习机器学习线性回归人工智能
文章目录线性回归模型的性能评估1.举例1-单一特征2.举例2-多特征线性回归模型的性能评估评估线性回归模型时，首先要建立评估的测试数据集（测试集不能与训练集相同），然后选择合适的评估方法，实现对线性回归模型的评估。回归任务中最常用的评估方法有均方误差、均方根误差和预测准确率（确定系数）。1.举例1-单一特征分别对两个模型进行评估，输入的测试集如表所示。面积/（m2）售价/（万元）面积/（m2）售价
408-计算机组成原理-注意点猫毛已经快要掉光的小猫系统架构
数据的表示IEEE754标准的特殊情况：阶码全为0，尾数不全为0表示非规格化的数值，0.M×2^(-126)阶码全为0，尾数也全为0，表示±0阶码全为1，尾数全为0，表示正负无穷大阶码全为1，尾数不全为0，表示非数符Nan存储器Cache：多少组相联指的是一组有多少个。LRU标记为一组有n个，就需要用logn表示区分计算cache数据区与cache容量，cache容量需要包括标志位。标志位大体包括
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
freertos3 地中海的小岛 java 开发语言
CMSIS的作用：1.提供了接口标准，便于移植和管理。2.提供了很多第三方固件，便于业务开发。3.因为统一了接口，使底层硬件和上层应用耦合降低，更换硬件平台时只需开发人员改变底层硬件的驱动即可，上层业务应用程序无需做改动。创建任务函数：osThreadId_tosThreadNew(osThreadFunc_tfunc,void*argument,constosThreadAttr_t*attr)
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classification

1 标题+作者

2 摘要

3 结论

4 导言

fine-tuning

prompt-tuning

Verbalizer

KPT

5 相关工作

Prompt-tuning

Verbalizer Construction

Knowledge Enhanced PLMs

6 KPT模型

prompt-tuning template:

Verbalizer Construction

举例

Verbalizer Refinement

Zero-shot Refinement

Few-shot Refinement

Verbalizer Utilization

Average

Weighted Average

Experiments

Datasets and Template

Setting

Baseline

Main Results

Zero-shot

Few-shot

Analysis

CC对zero-shot的影响

CC对few-shot是否有帮助

Top预测词的多样性

你可能感兴趣的:(EE,机器学习,深度学习,自然语言处理)