生成相似问题工具和阅读文章生成问答工具

一、首先描述一个场景:比如机器人问答时候、如果自定义问答或者添加知识库类似的功能,如下举例:

Q:JAVA开发需要哪些技术?—— 这个是问题.
A:JDK、数据库等    —— 这个是答案

那么问题来了? 我想生成更多的类似Q的问题。
最近找了几个方式,但是效果不是很理想。
采用:
回译(效果比较好)
原理:将中文翻译成英文,再通过英文翻译成中文。
EDA(同义词替换、插入、交换和删除)(效果还行)
原理:在句子中找到同义词,然后进行替换、得到其他句子。
HMM-marko(质量较差)
原理:利用马尔可夫链,首先提取出一个关键词,这样就可以进行句子生成了。
syntax(依存句法、句法、语法书)(简单句还可)
原理:交互语法树,一棵语法树可以用来描述句子的产生规则,配合句子模拟器可以生成若干模拟句子。
bert——seq2seq(深度学习同义句生成,效果不理想)
原理:bert作为特征提取器,然后通过seq2seq生成句子类
GAN
原理:生成式对抗网络(GAN)是近年来大热的深度学习模型,生成句子。
transformer——Attention——seq2seq
原理:这个不怎么清楚。

二、利用文章进行生成问答(机器阅读)

allennlp阅读理解
https://github.com/allenai/allennlp-reading-comprehension

Graphbrain:AI开源软件库和科研工具,目的是促进自动意义提取和文本理解以及知识的探索和推断
https://github.com/graphbrain/graphbrain

中文阅读理解数据集
https://github.com/ymcui/Chinese-RC-Datasets

QANet+DuReader中文机器阅读理解
https://github.com/SeanLee97/QANet_dureader

机器阅读理解

其他的暂时没有效果比较好的答案或者工具

你可能感兴趣的:(机器人)