论文题目:Joint Constrained Learning for Event-Event Relation Extraction
论文来源:EMNLP 2020
论文链接:https://arxiv.org/pdf/2010.06727.pdf
代码链接:https://cogcomp.seas.upenn.edu/page/publication_view/914

文档D表示为一个token序列 D = [ t 1 , . . . , e 1 , . . . , e 2 , . . . , t n ] D=[t_1,...,e_1,...,e_2,...,t_n] D=[t1,...,e1,...,e2,...,tn],其中一些token为注释事件的触发词,目标是抽取时间事件关系(BEFORE, AFTER, EQUAL, VAGUE)和子事件关系(PARENT-CHILD, CHILD-PARENT, COREF,NOREL)。其中模型的整体框架如上图,主要包括下面几部分:
对事件对进行编码,同时加入常识知识,最后使用两个不同的分类器,得到具体任务的标签。
首先使用RoBERTa进行上下文编码,然后加入one-hot的词性标签,然后通过BiLSTM进行编码,最后对于一个事件对 ( e 1 , e 2 ) (e_1,e_2) (e1,e2),特征包括 e 1 e_1 e1的上下文编码 h e 1 h_{e_1} he1、 e 2 e_2 e2的上下文编码 h e 2 h_{e_2} he2、Hadamard product (对应元素相乘)和subtraction。
使用ConceptNet知识,分别为时间关系和子事件关系训练一个MLP编码器,表示常识特征。
分为下面三种约束:
|
|
|
|
|
|
|
|
总的学习目标如下:

取得到的最高分数的关系,作为该事件对的关系标签,其中预测子事件关系有更高的优先级。
时间关系数据集为MATRES,子事件关系数据集为HiEve,数据统计如下:

|
|
|
|
|
|
|
|