收藏本站
《武汉大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于预训练模型的条件文本生成框架

段誉  
【摘要】:文本生成无论是在实际应用中、还是在学术研究中,都是一种十分重要的任务,而条件文本生成更是其中一种重要的任务。大多数现有的基于深度学习的工作都需要丰富的样本参与模型的训练,并且一旦有新增的条件只能重新训练模型,无法灵活的进行扩展,这些缺点对于日新月异的互联网时代是不够效率的。对于人类而言,我们常常事先学习了足够的知识,有能力在更高的抽象层面对新问题进行思考,并不需要“从零开始”,而且可以根据少数几次经验就能够很好的学习一个崭新的任务。从这一点出发,我们针对现有工作的不足,决定探讨一种灵活、有效的,仅仅需要少量标注样本的条件文本生成框架,我们的核心思路是借助预训练模型,将字符级别的文本生成学习过程抽象成更高层面的特征空间学习过程,这样不仅可以减少我们对于大量标注样本的依赖,同时在面对新的条件时,也不再需要重新训练预训练模型,大大节省了时间。通过在真实数据集上的详细实验比较,发现我们所提出的方法在少量标注样本上的单条件、多条件文本生成任务上都能取得良好的表现,在多数的任务中可以超越较强的对比方法,这些实验同时证明了在高层特征上进行文本生成的学习是具备合理性和有效性的,这也对未来的文本生成工作提供了一点小小的想象空间。
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP181

免费申请
【相似文献】
中国期刊全文数据库 前10条
1 汪明霓;BASIC文本系统[J];计算机应用研究;1988年01期
2 易树鸿;张为群;;一种基于粗集的文本数据特征信息的挖掘方法[J];计算机科学;2002年08期
3 娄道国;李若斌;刘冰;张冬冬;;云计算下各分散文本数据的全方位集成融合方法[J];科技通报;2019年02期
4 潘大胜;;不确定噪声下海量文本数据的模糊挖掘算法研究[J];微电子学与计算机;2017年09期
5 李柯;佐々木勇和;;基于多维小波聚类的空间文本数据情感分布分析[J];数据分析与知识发现;2019年07期
6 王珊珊;冯利鑫;;基于新词识别的大数据聊天文本舆情热点挖掘[J];电子商务;2018年01期
7 陈晓峰;如何在flash中读入外部文本数据[J];电脑知识与技术;2004年13期
8 马欣欣;林克;;大文本数据快速分析统计理论与算法[J];电子元器件与信息技术;2019年01期
9 施瑞朗;;基于社交平台数据的文本分类算法研究[J];电子科技;2018年10期
10 张玉红;陈伟;胡学钢;;一种面向不完全标记的文本数据流自适应分类方法[J];计算机科学;2016年12期
中国重要会议论文全文数据库 前10条
1 易天元;叶春生;;工业锅炉图纸输入的文本数据处理[A];1997中国控制与决策学术年会论文集[C];1997年
2 陈光强;杨树强;张晓辉;李润恒;贾焰;;面向海量文本数据的多任务并行调度加载技术研究与实现[A];第15届全国信息存储技术学术会议论文集[C];2008年
3 周纯洁;黎巎;徐翼龙;;文本情感分析研究[A];中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集[C];2018年
4 刘伟;陈春林;;基于注意模型深度学习的文本情感倾向性研究[A];第19届中国系统仿真技术及其应用学术年会论文集(19th CCSSTA 2018)[C];2018年
5 丁兆云;贾焰;周斌;;基于文本数据的多维层次式舆情计算模型的研究与实现[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
6 谭立;赵茜瑶;李倞;;基于NLPIR平台大数据文本分析的北京市典型建成绿道绩效评价[A];中国风景园林学会2018年会论文集[C];2018年
7 李洋;倪丽萍;李莹;;电子商务平台在线评论对冰箱销量的影响——基于文本情感分析方法[A];第十三届(2018)中国管理学年会论文集[C];2018年
8 李锋刚;张亚南;汪兵;;基于词向量和AP聚类的短文本主题演化分析[A];第十三届(2018)中国管理学年会论文集[C];2018年
9 李诗;陈建平;向杰;;基于卷积神经网络的地学文本大数据分类与可视化——以四川拉拉铜矿为例[A];2018年中国地球科学联合学术年会论文集(四十三)——专题93:超深层(油气)重磁电震勘探技术、专题94:深部预测方法[C];2018年
10 苏变萍;侯筱婷;;文本数据的非线性降维方法研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
中国重要报纸全文数据库 前1条
1 通讯员 王成弟 刘欢 本报记者 廖志林;肺部常见疾病AI诊断产品呼之欲出[N];健康报;2018年
中国博士学位论文全文数据库 前10条
1 宋扬;基于上下文位置的文本匹配若干关键技术研究[D];华东师范大学;2019年
2 徐康;基于主题模型的文本情感和话题建模的研究[D];东南大学;2017年
3 胡卉芪;空间文本数据的量质融合与推送[D];清华大学;2016年
4 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
5 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
6 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
7 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
8 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
9 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
10 龚才春;短文本语言计算的关键技术研究[D];中国科学院研究生院(计算技术研究所);2008年
中国硕士学位论文全文数据库 前10条
1 周凯;基于深度学习的文本情感分析算法研究[D];贵州大学;2019年
2 师睿;英语口语文本的可朗读性自动评估研究[D];华东师范大学;2019年
3 冀先朋;多标签文本分类算法的研究与应用[D];山东大学;2019年
4 庞雪;基于MapReduce的深度学习混合模型文本分类研究[D];齐鲁工业大学;2019年
5 袁泉;融合外部知识库信息的文本推理研究[D];北京邮电大学;2019年
6 胡均毅;文本的分层表示及情感分类方法研究[D];中国科学技术大学;2019年
7 季立堃;基于深度学习的文本情感分析技术研究[D];北京邮电大学;2019年
8 李作潮;基于关键词语义控制的文本生成算法研究[D];北京邮电大学;2019年
9 段誉;一种基于预训练模型的条件文本生成框架[D];武汉大学;2019年
10 连亚飞;基于深度学习模型的社交文本情感分析研究[D];福建师范大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026