收藏本站
《重庆大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

聊天机器人知识库自动抽取算法的研究与实现

黄际洲  
【摘要】: 聊天机器人(chatbot)是一种通过自然语言同人进行交流的人机交流对话智能系统(conversational agent),人机之间的对话交流往往都局限于某个领域或者主题。聊天机器人一般都基于刺激——反应原理:用户提出一个问题,聊天机器人回答问题;或者用户做出某些评论,聊天机器人做出相应的反应。为了增加对话的连续性,聊天机器人往往还会在聊天过程中主动向用户提出新的问题。通常,聊天机器人都含有一个聊天知识库以及对话控制模块,聊天知识库就像聊天机器人的大脑,存储着回复用户输入的聊天知识,而对话控制模块则用于控制对话进程。一般而言,典型的聊天知识库都由一系列的模板组成,模板用于匹配用户的输入并根据一定的规则产生相应的机器人回复。但是目前用在聊天机器人中的模板,都是由人来手工构建的,因此聊天知识库的构建是一件费时费力的工作,并且缺乏灵活性,由此导致这种人工书写的方法在应用到新的知识领域或者新语言时,困难重重,比如一旦聊天机器人的知识领域发生了变化,就需要重新构建知识库。 本文提出并实现了一种新颖的聊天知识库构建方法,通过该方法,就能自动从在线论坛中抽取出形式为帖子标题,回复对的聊天知识。使用该方法,就能快速、有效地为聊天机器人构建某个领域的聊天知识。本文介绍的这种方法,是一种瀑布式模型(cascaded framework),给定一个论坛,经过以下步骤的处理,就能自动从中抽取出高质量的帖子标题,回复对。首先,通过使用一个基于回复和帖子标题之间的各种关系(如结构和内容特征)的SVM分类器,将所有和帖子标题在逻辑上相关的回复抽取出来。接着,再根据回复的内容质量等特征对这些抽取出来的帖子标题,回复对进行排序(采用的排序模型为ranking SVM)。最后,将排在前N的帖子标题,回复对选用为聊天知识。通过在一个电影论坛中进行的相关实验得到的结果表明,本文提出的自动抽取聊天知识的方法能快速、有效地构建聊天知识库。 本文的主要贡献为:1.本文第一个提出了使用在线论坛为聊天机器人自动抽取聊天知识;2.本文设计并实现了一种瀑布式模型来从在线论坛中抽取出高质量的形式为帖子标题,回复对的聊天知识。瀑布式模型可以在不同的阶段优化使用不同的特征,因此保证了抽取出来的聊天知识具有很高的质量;3.实验结果表明,在判别相关回复时,结构特征是最有效的特征,而在识别高质量回复时,作者信息是最有效的特征。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP393.09;TP301.6

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 郭书杰;黄明;梁旭;;陪护机器人口语对话系统设计与实现[J];网络安全技术与应用;2010年12期
中国硕士学位论文全文数据库 前2条
1 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
2 杨哲萍;网络聊天机器人在少数民族汉语教学中的关键技术研究[D];中央民族大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
2 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
3 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
4 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
5 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
6 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期
7 邹心遥;姚若河;;基于LSSVM的小子样元器件寿命预测[J];半导体技术;2011年09期
8 李卓远,吴为民,王旸,洪先龙;一种新的光学临近校正方法(英文)[J];半导体学报;2003年12期
9 王一丁;杨虹;;基于多目标线性规划的人脸识别方法[J];北方工业大学学报;2009年01期
10 梁万路;;代价敏感支持向量机的投影次梯度求解方法[J];兵工自动化;2011年04期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
5 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
6 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
7 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 刘友强;李斌;奚宁;陈家骏;;基于双语平行语料的中文缩略语提取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 陈龙;吴志勇;袁春;蒙美玲;蔡莲红;;面向数字版权管理的声纹辅助认证系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
10 颜七笙;;基于PCA-SVM的动态联盟候选伙伴绩效评价方法[A];第十三届中国管理科学学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
3 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
4 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
5 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
6 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
7 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
8 吴锋;基于GPU并行计算的数值模拟与燃煤锅炉系统的优化研究[D];浙江大学;2010年
9 向国齐;支持向量回归机代理模型设计优化及应用研究[D];电子科技大学;2010年
10 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
3 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
4 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
5 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
6 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
7 林天威;基于视频流的人脸识别系统研究[D];哈尔滨工程大学;2010年
8 韩艳;基于支持向量机的发酵过程建模研究[D];大连理工大学;2010年
9 马稳;基于支持向量机的模拟电路故障诊断研究[D];大连理工大学;2010年
10 梁怀志;基于嵌入式的车型分类系统的设计与实现[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 盛锦华,张巧;人工智能研究的进展与发展趋势[J];安徽大学学报(自然科学版);1996年01期
2 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
3 樊孝忠,李宏乔,李良富,叶江;银行领域汉语自动问答系统BAQS的研究与实现[J];北京理工大学学报;2004年06期
4 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
5 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
6 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报;1999年03期
7 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
8 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
9 刘红芝;;中文分词技术的研究[J];电脑开发与应用;2010年03期
10 唐晓文;基于本体论的文本特征提取[J];电脑与信息技术;2005年01期
中国博士学位论文全文数据库 前2条
1 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
2 吴尉林;可移植的稳健口语理解方法研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前5条
1 吴曾;文本主题切分技术和ROCCHIO模型在信息检索中应用的研究[D];中国科学院研究生院(软件研究所);2004年
2 王彬;汉语人机对话系统中口语处理的研究[D];清华大学;2004年
3 倪丹;信息技术主题学习实践研究[D];东北师范大学;2007年
4 武旭晶;活知识的本质和形成[D];陕西师范大学;2007年
5 丁宏伟;内容知识库的研究和应用[D];北京信息控制研究所;2006年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 高琦;基于Bootstrapping的本体标注方法研究[D];重庆大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 周志华;;通过集成学习进行知识获取[J];重庆邮电大学学报(自然科学版);2008年03期
2 李敏强,寇纪淞;基于数据库的层次概念知识体系的一种获取方法[J];控制与决策;1999年S1期
3 周力嘉;通过例子学习构造属性集[J];微电子学与计算机;1991年05期
4 赵荣珍;李超;张优云;;机械故障智能诊断的诊断知识获取新发展问题[J];振动与冲击;2007年09期
5 周宇光;陈松乔;;一种具有学习和求精功能的知识自动获取系统KAAS的设计[J];中南大学学报(自然科学版);1993年06期
6 王强;沈永平;陈英武;;支持向量机规则提取[J];国防科技大学学报;2006年02期
7 黄考利;连光耀;杨芳涛;;基于仿真技术的故障知识获取方法研究[J];弹箭与制导学报;2004年S5期
8 狄林林;赵祎;姚青;;应用遗传算法思想进行知识库自学习的研究[J];计算机工程与设计;2009年22期
9 陈新中,王道平,王建斌;故障诊断专家系统中机器学习方法的研究[J];西安建筑科技大学学报(自然科学版);2000年01期
10 王继成,吕维雪;一种基于符号神经网络的知识获取方法[J];计算机学报;1995年12期
中国重要会议论文全文数据库 前10条
1 周强;;汉语句法知识的自动获取研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 吴东亚;王南华;党蓉;田禾;范宇;;航天器控制系统故障诊断知识获取辅助系统(SCDKAS)[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
3 马建军;陈文伟;;IDSS中知识获取的一种新方法[A];1996中国控制与决策学术年会论文集[C];1996年
4 吕韶义;刘复岩;;基于决策树的规则获取[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
5 许春义;魏艳红;刘爱国;;新型焊接工艺设计专家系统[A];第十次全国焊接会议论文集(第2册)[C];2001年
6 石照辉;史忠植;周树夏;黄瑞;封兴华;;颌面战创伤救治智能决策支持系统的设计和实现[A];2007中国口腔医院管理与信息化研讨会论文集[C];2007年
7 史天运;贾利民;王信义;;遗传算法在故障诊断中的应用[A];1999中国控制与决策学术年会论文集[C];1999年
8 王重鸣;陆兴海;王世潮;王叶毅;;决策知识结构获取与表征的多方法分析[A];全国第七届心理学学术会议文摘选集[C];1993年
9 蒋文科;杨云森;许文华;邝朴生;;基于模糊神经网络的知识获取系统[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
10 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
中国重要报纸全文数据库 前10条
1 飞雪马;恋上MSN聊天机器人[N];电脑报;2004年
2 李楠;聊天机器人 孕育新商机[N];中华工商时报;2004年
3 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
4 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
5 冯小民;和聊天机器人面对面[N];中国电脑教育报;2004年
6 ;聊天机器人暗藏玄机?[N];中国高新技术产业导报;2004年
7 葛秋芳;英国高智能聊天机器人,会说40种语言[N];新华每日电讯;2006年
8 赢思软件CEO 袁辉;一切源于PC的优化[N];中国电脑教育报;2008年
9 刘勇;机器人:互联网的下一桶金[N];中国电脑教育报;2007年
10 本报记者  杨琳桦;机器人入侵微软[N];21世纪经济报道;2006年
中国博士学位论文全文数据库 前10条
1 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
2 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
3 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
4 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
5 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
6 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
7 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
8 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
9 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
10 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
2 范宇中;智能信息系统中的知识获取研究[D];武汉大学;2004年
3 郝海峰;基于WEB的常识性知识共享平台的研究与实现[D];华中科技大学;2007年
4 杨峻;机器学习技术在医疗保险决策知识获取中的应用[D];国防科学技术大学;2010年
5 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
6 向光;基于机器学习和数据挖掘的入侵检测技术研究[D];东北大学;2005年
7 亢华爱;入侵检测系统中基于代价敏感分类算法的研究[D];太原理工大学;2005年
8 张金伟;基于Agent网络答疑系统的设计与实现[D];华东师范大学;2006年
9 王晶;支持向量机及其在癌症诊断中的应用研究[D];东北师范大学;2006年
10 万辉;自主载体语义级环境建模和规划的研究与实现[D];沈阳工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026