收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

信息检索中用户需求的概念分析研究

刘慧  
【摘要】: 当今信息时代人们从海量信息中获取自己所要的信息已经成为日常生活和工作所需。目前信息检索系统只能提供给使用者有限的帮助,局限性在于检索准确率低下,即检索返回结果中大量不需要的信息给用户带来的不是帮助而是困扰,是一种噪声。问题的症结在于现有的检索系统采用布尔模型“与”、“或”运算这类“离散型”处理方式,从用户需求和文档中抽取出离散的关键词进行匹配,割断了关键词之间在语义概念上的联系,从而丧失了这些词表达主题思想在概念上的完整性,由此产生大量噪声。关注这一现象和问题是本文的应用背景及其研究起始点。问题的瓶颈首先不在于提高效率的算法上,首要关注点在于如何在整个检索过程中保证用户需求概念完整性(整体性)。因此至关重要的起步是探索如何用概念分析方法标引需求。标引的基本单位不再是纯属形式上的字串而是由汉语词汇所表示的概念及其关联关系构成的完整整体。 本文研究汉语用户需求的概念分析及其标引,是概念检索系统及其创新思想的首要组成部分。本质上还原了用户的检索意图,刻画了概念之间的内在联系,旨在保证概念的完整性,直接影响检索性能和实效。与文档分析不同,需求分析的目的不仅是得出用户需求的一个完整的概念(图)表示,更重要的是能准确刻画用户脑海中检索需求所揭示的概念内涵特征。本文注重于用户需求实际现象研究,即实际需求所揭示的概念的分析及其表示形式的归纳,建立了一些探索性方法,处理受限需求分析问题,以期之后可能扩展到整个需求分析领域。 本文研究工作是概念检索模型的重要组成部分,为需求概念语义分析提供了有价值的思路和方法。此外对于自然语言处理领域中的一些热点问题,如命名实体识别、语法调试、语义分析等研究有积极意义。 本文的创新性有以下几方面: 1.用户需求表达式分析充分体现汉语本体的特点,概念分析及其表示凸现了汉语命名实体直接表现概念内涵的特点,实体命名形式反映了概念直接耦合:实体类名加上凸现必要区分特征。概念语义分析有创新。 2.选择汉语复合结构作为汉语词语表达式的核心结构,极大的优点在于能简洁扼要表征表达式的概念语义,并且其前瞻性在于适合于多语种翻译自动对齐时简化、省略形态变化,这是基于人类语言体系不同但认知概念可以相通的基本假设。 3.提出了针对部分需求的概念模型。需求概念分析基于需求表达式本身的研究分析。本文基于大量真实需求实例分析,总结了需求分析的原则要点,以及需求概念类型。归纳了一部分需求中常见的属性名,用以标引概念之间关联理据。 4.提出了一种全新的合一文法调试方法。方便地改造一个已有的基于合一文法的句法分析器,使之适用于新的领域,特别是针对需求表达式的分析。本文将一个合一文法建模成Kripke结构,通过模型检测的方法形式化验证。调试方法能够自动发现文法错误,从而大大降低调试的复杂度。 5.针对需求中高频出现的复杂命名实体,提出了一种基于网络挖掘的命名实体识别方法。由此构建了一个两层的关键词形式需求原型分析系统。该系统先将需求表达式中分析出的概念匹配到概念框架图上,框架图反映了领域知识;再余下未匹配的需求概念附着到框架图上以构成最终的概念图。该系统较好地平衡了对于领域知识和通用知识的分析。 6.提出了一种基于实例的问句形式需求的概念分析方法,该方法将一个问句的概念分析问题转化为一个机器翻译的问题,其中问句作为源语言,概念图作为目标语言。实际语料分析表明,即使实例集较小,该方法仍能取得较好结果。问句的相似度计算考虑了词汇语义和句法等多种信息,词汇的语义相似度计算采用了混合多种计算模型的集成方法。有利于句子相似度的计算并在现有常用评测集合上取得非常好结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杜伟林;苗夺谦;李道国;张年琴;;概念格与粒度划分的相关性分析[J];计算机科学;2005年12期
2 夏凌翔;黄希庭;;古籍中自立涵义的概念分析[J];心理学报;2006年06期
3 赫枫龄;JUP用多级知识表示结构处理英语中动词的过去式和过去分词同形的问题[J];吉林大学学报(理学版);1992年04期
4 郑定;;概念分析在图书馆信息化中的应用[J];软件导刊;2009年02期
5 秦昆;李振宇;杜鹢;;基于概念分析的空间数据挖掘研究进展[J];地球信息科学学报;2009年01期
6 毛华;李斌;;等价关系约束属性的形式概念分析[J];计算机工程与应用;2010年36期
7 白龙飞;;十年:追寻媒介素养教育本土化的轨迹[J];电化教育研究;2006年02期
8 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
9 张晓风;陈平;崔伟勇;;一种结合扇入和概念分析技术进行Aspect挖掘的方法[J];计算机科学;2006年08期
10 尹晓霈;张博;李丹;;基于领域本体的垃圾邮件过滤器的研究[J];自动化仪表;2008年08期
11 韩娜;王洋;关明山;;面向特定领域的软件构件库构件检索机制研究[J];中国科技信息;2009年02期
12 武晋南;高建华;;基于用户会话的Web测试集简化方法[J];计算机工程与设计;2010年06期
13 赫枫龄,姚玉川;基于层次知识表示结构的集成化概念分析方法[J];吉林大学学报(理学版);1990年03期
14 李成贵;概念分析初探[J];四川图书馆学报;1982年04期
15 简睿,俞勇;基于形式化概念分析的XML Schema映射[J];上海交通大学学报;2005年04期
16 常春;;数字图书馆概念分析[J];农业图书情报学刊;2006年11期
17 吉呈花;;信息资源管理与建设的关联分析[J];情报探索;2008年07期
18 陈欣;高建华;;基于用户会话的Web测试集约简[J];计算机工程;2011年06期
19 王厚峰;自然语言理解及其结构[J];华中师范大学学报(自然科学版);1992年02期
20 李心科;张磊磊;;基于概念分析的用户会话约减技术研究[J];计算机工程;2009年07期
中国重要会议论文全文数据库 前10条
1 梁爱林;;从“风险”术语的个案研究看术语词典的编撰工作[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
2 武晋南;高建华;;基于user session的Web测试集简化方法[A];第五届中国测试学术会议论文集[C];2008年
3 陈伟萍;王琳;封化民;杨鼎才;方勇;;一种基于语义概念的中文文本分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 袁发顺;刘郁馨;;隔层悬挂楼盖结构新体系及其数值分析[A];第五届全国结构工程学术会议论文集(第三卷)[C];1996年
5 王金星;蒋向前;马利民;徐振高;李柱;;新一代GPS标准体系的关键概念分析[A];第五届海峡两岸计量与质量学术研讨会论文集[C];2004年
6 王爱华;;语言不完备性:明达语言与语言自救[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
7 迭格芬·弗罗斯达尔;周武;;分析哲学:是什么以及为什么应当从事[A];时代与思潮(7)——20世纪末的文化审视[C];2000年
8 王志乔;金明;;大变形纯扭转基本概念分析[A];第十二届全国结构工程学术会议论文集第Ⅰ册[C];2003年
9 高扬;;洛仑兹力推进的带电卫星:轨道运动和推进概念分析[A];中国空间科学学会第七次学术年会会议手册及文集[C];2009年
10 张庆鹏;;建构青少年亲社会行为测量维度的思路[A];北京市社会心理学会2006年学术年会论文摘要集[C];2006年
中国博士学位论文全文数据库 前10条
1 郭兰坤;幂形式概念分析和模糊概念格研究[D];湖南大学;2011年
2 齐红;基于形式概念分析的知识发现方法研究[D];吉林大学;2005年
3 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
4 杨凌云;形式概念分析和粗糙集理论的代数及拓扑式研究[D];扬州大学;2010年
5 刘叶深;论法律的概念分析[D];中国政法大学;2008年
6 沈映涵;新分析法学中的方法论问题研究[D];吉林大学;2009年
7 邱昭继;法律、语言与法律的不确定性[D];中国政法大学;2008年
8 张卓;基于形式概念分析的Web数据库抽取研究[D];武汉大学;2011年
9 张云中;基于形式概念分析的Folksonomy知识发现研究[D];吉林大学;2012年
10 王利东;基于粗糙集与公理模糊集的形式概念分析[D];大连理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 王笑琨;基于形式概念分析的聚焦爬虫算法[D];中央民族大学;2013年
2 高俊峰;基于形式概念分析的开放存取资源组织方法研究[D];吉林大学;2011年
3 杨磊;基于形式概念分析的多光谱遥感图像分类研究[D];解放军信息工程大学;2012年
4 杨帆;基于形式概念分析的粒计算模型研究[D];山西大学;2012年
5 牛雪松;基于概念分析的程序重构技术研究[D];吉林大学;2004年
6 孙洪宇;基于形式概念分析的教育Web资源聚类研究[D];吉林大学;2011年
7 张春艳;基于形式概念分析的证名域方法的研究[D];燕山大学;2012年
8 王立政;基于本体的知识检索模型优化研究[D];吉林大学;2011年
9 丁悦梅;基于形式概念分析的Web信息资源聚类研究[D];吉林大学;2012年
10 刘晓今;概念三元格构造算法及应用研究[D];西安电子科技大学;2013年
中国重要报纸全文数据库 前10条
1 上海中远蓝天律师事务所 岳文辉 高颖睿;计算机犯罪的概念分析[N];民主与法制时报;2003年
2 陈军;婚内侵权之概念分析[N];江苏经济报;2010年
3 上海社会科学院 罗义俊;熊十力:重建中国哲学之“体”[N];社会科学报;2008年
4 中国政法大学教授 舒国滢;寻求法治的技术之路[N];法制日报;2003年
5 廖四平 张玉亮;诗与思的完美结合[N];光明日报;2005年
6 贵州省天柱县工商局远口工商所 赵玉娥;商品过度包装的概念分析及治理思考[N];中国工商报;2006年
7 张卜天;哲学:沟通科学与常识[N];中华读书报;2007年
8 雷光程;驰名商标的概念分析[N];中国知识产权报;2006年
9 陈新建 戴红星;建筑物区分所有权的概念分析[N];江苏法制报;2011年
10 江向东;“名家”界说献议[N];中国社会科学院院报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978