收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

NLP技术在中文全文信息处理中的应用研究

黄默丽  
【摘要】: 论文以NLP(Natural Language Processing,自然语言处理)技术的发展现状为研究背景,系统全面地分析NLP技术在中文全文信息处理中的应用。 论文内容主要分为三大部分,第一部分主要介绍NLP技术的发展现状以及中文信息处理所涉及的几项关键技术。 第二部分主要从用户查询分析,信息源处理和检索匹配三个领域剖析NLP技术在中文全文信息处理中的应用情况,其中涉及几个关键的应用领域,主要是未登录词的识别、自动标引、自动文摘、文本分类以及概念检索等相关领域。 第三部分主要针对目前自然语言检索系统中存在的问题和不足,根据第二部分中介绍的NLP技术在信息检索系统中应用的三个领域,提出相应的优化检索效果的方法:1)构建正确理解用户查询需求的处理框架,提高检索系统对用户提问的理解程度;2)在信息源处理部分分析目前的自动标引的局限,建立一种通用的自动标引评价模型,并把基于机械匹配的分词方法和基于概率统计的分词方法结合起来改进自动标引的质量;3)针对检索匹配这一过程,引入概念控制的方法,建立一个基于概念控制的自然语言检索系统的理论模型,通过概念匹配来提高检索系统的质量。


知网文化
【相似文献】
中国重要会议论文全文数据库 前10条
1 章成志;周冬敏;苏新宁;;自动标引通用评价模型研究[A];2007年中国索引学会年会暨学术研讨会论文集[C];2007年
2 王兰成;;基于MM最小回溯和词义规则的知识标引研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 王佳;;对中文屋思想实验四个主要版本的考察[A];第三届全国科技哲学暨交叉学科研究生论坛文集[C];2010年
6 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
8 王兰成;田梅;侯双;;PLS:一种基于信息自动标引的最小推进分词算法及其实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 计峰;邱锡鹏;黄萱菁;;中文不确定性句子的识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 朱麟;中国人说英语的节奏模式及在教学中的运用[D];中央民族大学;2007年
2 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
3 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
4 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
5 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
6 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
7 储节旺;企业应对危机的知识管理问题研究:能力、体系、机制与技术[D];南昌大学;2006年
8 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
9 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
10 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
中国硕士学位论文全文数据库 前10条
1 黄默丽;NLP技术在中文全文信息处理中的应用研究[D];郑州大学;2010年
2 陈成海;评塞尔的中文屋论证[D];浙江大学;2010年
3 崔涛;基于检准率分析中文自动标引方式存在问题及对策[D];河北大学;2011年
4 刘冬平;面向中文歌词的音乐情感分类研究[D];广东工业大学;2011年
5 李丽娜;中文专家检索关键技术研究[D];昆明理工大学;2011年
6 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
7 张山山;中文XML压缩技术研究[D];华中科技大学;2011年
8 汤明达;基于近邻传播算法的中文文本聚类的研究[D];广西师范大学;2012年
9 罗绵川;基于PS格式数字报刊标引反解技术研究[D];华南理工大学;2010年
10 秦路芳;基于中文互联网环境的IP净荷压缩的研究和实现[D];电子科技大学;2012年
中国重要报纸全文数据库 前10条
1 记者 胡光耀;全美第二届中文大会开幕[N];人民日报海外版;2009年
2 泰国南美有限公司副总经理 陈美琪 整理 本报实习生 杨冰;泰国新一代学中文热潮到来[N];中国新闻出版报;2009年
3 记者 王建刚 吴志强;美国 中文电视举办20周年台庆[N];人民日报海外版;2010年
4 晓路;美国“中文热”遭遇教师荒[N];中国文化报;2011年
5 本报记者 韩言铭;中文在线 全媒体版权运营[N];中国经营报;2011年
6 本报驻外记者 吴乐珺 张旸 本报记者 韩硕 崔悦 姜波;商务中文考试酝酿改革[N];人民日报;2011年
7 记者 古隆媛;中文媒体共携手 发挥更大影响力[N];中国新闻出版报;2009年
8 记者 向杰;网络化中文办公平台获“核高基”立项[N];科技日报;2011年
9 本报记者 任涛;李裕里:中文给了我未来[N];人民日报海外版;2010年
10 汪融;美国人到底有多爱中文[N];中国文化报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978