收藏本站
《南京理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

面向开放域的中文问答系统问句处理相关技术研究

张亮  
【摘要】:问答系统是信息检索分支,属于精确检索,是国外信息技术的研究热点,但在国内还处于起步阶段。信息检索是信息社会的重要特征,各种检索引擎对人们帮助很大,但是如何使计算机更好地理解人的检索需求,如何获得精确检索结果,这些目前还处于探索阶段,问答系统正是这个方面的重要研究内容。本文系统地介绍了问答系统的研究内容及现状,对中文问答系统与问句处理相关的关键技术进行了较为深入的分析与探讨,实质性工作和创新点如下: 1) 研究中文问答系统的理论框架和系统结构,从总体上对问答系统形成一个较为清晰的认识,对其中的研究重点和难点进行具体的分析。 2) 建立一个小规模的问句句法标注语料库(目前国内在该方面还是空白,没有现成的资源可资利用),在此基础上,研究相应算法,派生出句法截断数据库和句法片段数据库,其中基于截断的片段和片段组合抽取算法具有很高的独创性和实用价值。为高效地建立句法标注语料库,设计研发了一个实用的中文句法编辑与分析辅助系统。 3) 在标注语料库的基础上,根据中文问句在语法语义上的特性,结合现有的语料库理论和方法,应用句法片段技术和语言学中关于句法截断理论,研究出一套基于DOP(Data-Oriented Parsing)的问句句法分析算法,实验表明,与其它句法分析技术相比,准确率有较大提高。 4) 根据中文问句的结构特征,结合文本分类技术中较为成熟的Baves计算模型等,对问句的归类进行处理,建立一个准确率较高的中文问句分类算法模型。 5) 在中文句法标注语料库的基础上,对中文问句句型进行统计分析,研究设计出一个问句句型自动识别和获取算法。 6) 对中文问答系统中的问句形式化处理、形式化扩展、信息搜索、检索结果的分析与筛选等进行具体的分析,并研究相关的实现算法。 7) 对问与答之间的关系作了初步的探讨,提出了陈述句派生疑问句的假设,并研究了各种不同的派生情况,讨论了基于ontology的复杂问题分解,初步分析了简单中文句式之间转换的技术方法和关键因素。
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP391.1;TP18

【引证文献】
中国期刊全文数据库 前4条
1 王文晶;李茹;;基于汉语框架网的问句分析及本体知识库推理[J];电脑开发与应用;2011年09期
2 郭海旭;吕国英;李茹;;面向数据分析的中文问句句法研究[J];计算机工程与科学;2009年10期
3 王文晶;宋小香;李茹;;面向问题分类的汉语框架网特征选择[J];计算机与现代化;2011年08期
4 苏小虎;杨思春;;基于改进VSM的中文问答系统研究[J];情报理论与实践;2008年04期
中国博士学位论文全文数据库 前3条
1 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
2 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年
3 张志昌;开放域阅读理解关键技术研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
2 孙凯;自动答疑系统中的问句理解与个性化推荐算法研究[D];南京信息工程大学;2011年
3 毛帆;基于本体的领域问答系统的研究与实现[D];重庆大学;2010年
4 张晓孪;中文问答系统中问题理解与信息检索的研究与实现[D];西北大学;2007年
5 董晓春;基于本体的Internet中文问答系统若干关键技术的研究与实现[D];华东师范大学;2008年
6 王波;基于移动学习的智能答疑系统的研究与设计[D];东北师范大学;2009年
7 陈海光;HNC理论和随机模糊在问答系统中的应用研究[D];江苏大学;2009年
8 王文晶;基于汉语框架网的旅游问答系统中询问类型及其处理策略研究[D];山西大学;2009年
9 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
10 宋小香;基于汉语框架网的中文问句分类研究[D];山西大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 曹翔;汉语语法变换分析与变换类型研究述评[J];河海大学学报(哲学社会科学版);2003年03期
2 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
3 张卫丰;徐宝文;周晓宇;许蕾;李东;;Web搜索引擎综述[J];计算机科学;2001年09期
4 徐菁,张辉,陆汝占;汉语语料的切分标注加工系统[J];计算机工程;2003年09期
5 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
6 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
7 徐辉,何克抗,孙波;书面汉语自动分词专家系统的实现[J];中文信息学报;1991年03期
8 张玥杰,朱靖波,张跃,姚天顺;基于DOP的汉语句法分析技术[J];中文信息学报;2000年01期
9 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
10 孟遥,李生,赵铁军,曹海龙;四种基本统计句法分析模型在汉语句法分析中的性能比较[J];中文信息学报;2003年03期
中国重要会议论文全文数据库 前1条
1 王树西;刘群;白硕;王斌;程学旗;姜吉发;;基于动态知识库的问答系统研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前10条
1 曹翔;;汉语语法变换分析的产生与发展[J];阿坝师范高等专科学校学报;2007年02期
2 丁俊苗;;不足与需要:论标点符号的语法功能[J];安徽大学学报(哲学社会科学版);2008年04期
3 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
4 李龙澍;;PROLOG线性归结的研究与设计[J];安徽大学学报(自然科学版);1997年03期
5 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
6 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
7 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
8 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
9 朱力平,丰国炳;用基于内容的Web图像搜索引擎设计消防电子化道路水源手册[J];安全与环境学报;2004年03期
10 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
3 雷育生;甘仞初;杨军;;一种基于用户偏好的虚拟网站信息结构自适应调整算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
4 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
5 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
6 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
7 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
8 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
9 ;Image Classification with Ant Colony Based Support Vector Machine[A];中国自动化学会控制理论专业委员会A卷[C];2011年
10 毛存礼;余正涛;线岩团;郭剑毅;雷雄丽;;基于短信的旅游景点酒店问答系统研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
4 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
5 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
6 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
7 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
8 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
9 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
10 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
4 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
5 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
6 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
7 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
8 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
9 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
10 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 丁俊苗;;不足与需要:论标点符号的语法功能[J];安徽大学学报(哲学社会科学版);2008年04期
2 李季,迟呈英;中文问答系统的研究[J];鞍山科技大学学报;2003年06期
3 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
4 周宏宇;张政;;中文分词技术综述[J];安阳师范学院学报;2010年02期
5 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
6 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
7 樊孝忠,李宏乔,李良富,叶江;银行领域汉语自动问答系统BAQS的研究与实现[J];北京理工大学学报;2004年06期
8 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
9 李良富,樊孝忠,李宏乔;语义相似计算驱动领域自动问答[J];北京理工大学学报;2005年11期
10 张仰森;曹元大;俞士汶;;最大熵方法中特征选择算法的改进与纠错排歧[J];北京理工大学学报;2006年01期
中国重要会议论文全文数据库 前3条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 韩先培;齐振宇;田野;王渝丽;赵军;;基于领域语义信息的百科问答系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 骆正虎;移动Agent系统若干关键技术问题研究[D];合肥工业大学;2002年
2 黄逸民;基于多Agent的智能管理信息系统理论与应用研究[D];浙江大学;2002年
3 张蕾;概念结构及其应用[D];西北工业大学;2001年
4 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
5 郝宇;基于Kolmogorov复杂性的知识获取方法研究[D];清华大学;2005年
6 龚勇;多Agent联盟形成技术在组合贸易电子商务中的应用研究[D];国防科学技术大学;2005年
7 王树西;基于文本模式推理的问答系统研究[D];中国科学院研究生院(计算技术研究所);2005年
8 朱海平;基于概念图匹配的语义搜索[D];上海交通大学;2006年
9 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年
10 李鑫;问题回答系统中的问题分类研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
2 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
3 付卉;移动学习系统的设计与开发[D];华中师范大学;2005年
4 叶凌;基于语义的中文搜索引擎[D];吉林大学;2005年
5 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
6 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
7 吴海燕;Agent协商策略与联盟机制研究[D];福州大学;2006年
8 谭伟;面向网络的中文问答系统相关技术的研究与系统初步实现[D];清华大学;2005年
9 古华贞;基于本体的移动问答系统研究[D];大连理工大学;2006年
10 陈玉;基于事实性问题中文问答系统的研究与实现[D];山西大学;2006年
【二级引证文献】
中国期刊全文数据库 前5条
1 罗长寿;张峻峰;孙素芬;魏清凤;;基于改进VSM的农业实用技术自动问答系统研究[J];安徽农业科学;2009年28期
2 唐朝霞;;多特征融合的中文问答系统答案抽取算法[J];贵州大学学报(自然科学版);2011年05期
3 王文晶;宋小香;李茹;;面向问题分类的汉语框架网特征选择[J];计算机与现代化;2011年08期
4 路青;崔新春;胡艳波;;基于文献计量的国内语义角色标注研究现状分析[J];情报杂志;2012年04期
5 金贵荣;;提高网络信息搜索匹配准确率的相关研究[J];科技资讯;2012年31期
中国博士学位论文全文数据库 前1条
1 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
2 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
3 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
4 王少华;基于手机的课程答疑系统的设计与实现[D];宁波大学;2011年
5 马渊;短文本情感分析技术研究[D];重庆大学;2011年
6 韩璐;基于MVC模式的在线答疑系统设计与实现[D];辽宁科技大学;2012年
7 刘岩;基于概念图的中文语义分析系统的研究与实现[D];西北大学;2008年
8 王银丽;限定领域内智能问答系统的研究与实现[D];内蒙古大学;2008年
9 马莉;基于动态本体知识库的问答系统的研究与实现[D];广西师范大学;2009年
10 王文晶;基于汉语框架网的旅游问答系统中询问类型及其处理策略研究[D];山西大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡裕树;试论句子类型的研究[J];汉语学习;1995年05期
2 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
3 赵军,黄昌宁;汉语基本名词短语结构分析模型[J];计算机学报;1999年02期
4 张玥杰,朱靖波,张跃,姚天顺;基于DOP的汉语句法分析技术[J];中文信息学报;2000年01期
5 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
6 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
7 朱靖波,姚天顺;面向数据的句法分析技术[J];中文信息学报;1998年01期
8 刘挺,王开铸;关于歧义字段切分的思考与实验[J];中文信息学报;1998年02期
9 孙茂松,左正平,邹嘉彦;高频最大交集型歧义切分字段在汉语自动分词中的作用[J];中文信息学报;1999年01期
10 邹涛,王继成,张福炎;基于WWW的资料搜集系统的设计与实现[J];情报学报;1999年03期
中国重要会议论文全文数据库 前3条
1 杨沐昀;赵铁军;于浩;;自底向上的汉语句法标注体系设计与实践[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 朱晓丹;刁倩;周富秋;;汉语词语的两字hash算法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【相似文献】
中国期刊全文数据库 前10条
1 苏明明;宋文;;基于本体的语义搜索引擎解决方案研究新进展[J];现代图书情报技术;2008年11期
2 卢炳卫;;关于自动问答技术的研究[J];农业图书情报学刊;2006年01期
3 熊文新;信息检索的嬗变[J];软件世界;2004年11期
4 张莉;李东生;肖燕峰;;基于Web的受限领域问答系统研究及应用[J];电脑开发与应用;2007年05期
5 陈玉;;基于关键词距离的中文问答系统研究[J];电脑开发与应用;2011年01期
6 李秋青;;基于问答(Q&A)系统原理的WAP信息检索[J];科技广场;2006年01期
7 王慧慧;;提高网络信息检索效率的几种策略[J];科技资讯;2009年30期
8 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
9 曾庆鹏;吴水秀;;网络教学平台中问答系统的关键技术研究[J];计算机与现代化;2010年07期
10 张亮;黄河燕;胡春玲;;中文问答系统模型研究[J];情报学报;2006年02期
中国重要会议论文全文数据库 前10条
1 罗伟;李陶深;;一种基于本体的个性化搜索引擎模型[A];广西计算机学会2006年年会论文集[C];2006年
2 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
3 褚蓓蓓;刘丹;;垂直搜索引擎:搜索引擎发展方向[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
4 梁婷婷;张志强;谢晓芹;;搜索引擎评估算法综述[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
5 王灿辉;张敏;马少平;;Web作弊与反作弊技术综述[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 李智超;余慧佳;马少平;;使用支持向量机进行作弊页面识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 孙斌;;使用内存汇集的新闻搜索索引更新[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 赵庆亮;穗志方;;一种基于WWW的Ontology属性值自动提取方法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 骆正华;;基于E-Chunk问句实例库问答系统的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
中国重要报纸全文数据库 前10条
1 魏琳;儒豹手机搜索入围2008中国新媒体年度评选名单[N];江苏科技报;2008年
2 陈沛 刘学习编译;门户与搜索日渐融合[N];计算机世界;2006年
3 赵敏;“鱼群理论”破解搜索营销谜局[N];中国企业报;2007年
4 钱铮;日本下一代搜索引擎开发路途崎岖[N];中华新闻报;2006年
5 林海;“鱼群理论”破解搜索营销迷局[N];中国高新技术产业导报;2007年
6 本报记者 马文方;Yebol:从思维科学导出搜索引擎[N];中国计算机报;2010年
7 ;李彦宏:从小就是一个很倔的人[N];财经时报;2005年
8 西平;搜索厂商呼吁:明确区分自然结果与广告[N];中国经济时报;2007年
9 ;购物搜索成为最实用搜索功能[N];人民邮电;2004年
10 赵敏;“鱼群理论”破解搜索营销迷局[N];中国工业报;2007年
中国博士学位论文全文数据库 前10条
1 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
2 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
3 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
4 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
5 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
6 黎新;面向问答系统的段落检索技术研究[D];中国科学技术大学;2010年
7 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
8 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
9 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
10 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年
中国硕士学位论文全文数据库 前10条
1 蔡刚山;中文自动问答系统研究[D];华中科技大学;2007年
2 卜文娟;基于概念图的中文问答系统的研究与实现[D];西北大学;2010年
3 牛彦清;中文问答系统的问句分类研究[D];太原理工大学;2011年
4 李旭锋;中文问答系统中问句理解和相似度计算的研究与实现[D];华南理工大学;2010年
5 贺阳剑;基于格语法和VerbNet的问答系统研究[D];中南大学;2007年
6 黄波;中文问答系统中答案抽取的研究与实现[D];吉林大学;2010年
7 刘桥妹;基于开放域问答系统的问题分类技术研究与实现[D];华南理工大学;2010年
8 徐东;基于本体的领域智能搜索技术研究[D];哈尔滨工程大学;2007年
9 齐波;基于自然语言理解的智能搜索方法研究[D];重庆大学;2007年
10 王银丽;限定领域内智能问答系统的研究与实现[D];内蒙古大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026