收藏本站
《中国科学院研究生院(计算技术研究所)》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

个性化信息分发及概念检索的研究

张磊  
【摘要】:因特网的迅速发展导致了信息的爆炸式增长,面对海量的信息,如何使用户能准确快捷地找到所需的信息(What You Get Is What You Want)成为一个迫切需要解决的问题。本文讨论了个性化信息分发及概念检索的技术,在现有语义资源(知网、WordNet)的基础上,提出多视图概念网络模型(Concept Network-Views Model)作为文档表达和用户兴趣模型,利用概念间的联系来提高信息检索的精度。同时综合考虑个性化中的诸多要素,对用户访问模式和反馈进行聚类分析,设计和开发了系统原型框架,从而使个性化信息分发系统更为有效。在概念检索的研究中,我们则是利用领域本体将半结构化数据和结构化数据关联起来,为用户的查询提供概念级的检索结果。实验表明,利用概念间的联系可以有效提高信息检索的精度。 多视图概念网络模型是本文的核心内容,它的生成可以划分为两个阶段:(1)从词空间到概念空间的变换;(2)从概念到多视图概念网络的扩展。在第一阶段中我们给出了基于统计和规则的分词及词性标注、词义排歧方法,提出了扩展短语的定义及其序列模板挖掘算法,以解决目前分词方法的不足;在第二阶段中提出了能量传播的ConceptRank算法和枢纽概念识别算法,用于准确抽取描述用户兴趣和文档的主题概念,并降低枢纽概念产生的噪声。在此模型的基础上提出两种相关度的计算方法:能量消减算法和概念向量的余弦距离。 对个性化信息分发的研究包括三个方面:用户兴趣建模、潜在兴趣的发现和协同过滤技术。(1)本文提出了基于多视图概念网络的用户兴趣建模方法,阐述和分析了个性化的影响因素。(2)通过分析用户的访问模式可以挖掘出用户的潜在兴趣,本文给出潜在兴趣挖掘的流程和算法,从客户端和服务器端收集个性化数据,进行数据预处理后利用Web日志对用户访问过的内容聚类,并将挖掘出的用户潜在兴趣同样用多视图概念网络表示出来,用于信息推荐过程。(3)协同信息过滤技术同样可以支持个性化信息分发,本文提出了基于用户反馈的用户兴趣小组发现算法,使用ISODATA聚类算法对用户的反馈结果进行聚类,调整用户与文档的兴趣度。作为用户兴趣模型的补充,以解决用户兴趣描述的不完备性。 文档的表达同样以多视图概念网络模型为基础,并通过对HTML文件格式的分析来改善网页内容表达的有效性,给出高性能的词典访问方法和倒排文件索引方法。 要实现概念级的检索,就要解决传统检索方法中的如下问题:(1)传统的信息检索是基于关键词的匹配,面临着一词多义和一义多词的问题。(2)由于Internet上包含了半结构化和结构化信息,在检索过程中如何将它们关联集成起来也是非常必要的。本文对半(无)结构化信息进行了分级表达,从原始信息中抽取出词、短语和概念,并引入领域本体以支持文本与数据库的信息关联,从而实现概念检索。文本分类是信息检索中的重要基础,本文提出基于概念的分类方法,修正向量空间模型中单词正交性的错误前提。
【学位授予单位】:中国科学院研究生院(计算技术研究所)
【学位级别】:博士
【学位授予年份】:2002
【分类号】:TP391.3

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 程英迅;基于军事本体的智能检索引擎研究[D];电子科技大学;2010年
2 毛平;基于领域本体的文本信息语义检索研究[D];南京理工大学;2007年
3 段寿建;基于本体的语义检索原型系统的设计与实现[D];云南师范大学;2008年
【参考文献】
中国期刊全文数据库 前10条
1 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
2 廖明宏;本体论与信息检索[J];计算机工程;2000年02期
3 金燕,李建华,杨宇航;WWW上的全文信息检索技术[J];计算机应用研究;1999年01期
4 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
5 刁倩,王永成,张惠惠,何骥;文本自动分类中的词权重与分类算法[J];中文信息学报;2000年03期
6 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
7 成颖,史九林;自动分类研究现状与展望[J];情报学报;1999年01期
8 刘树勋,李卫华,区益善;Internet网上智能检索Agent的信息检索方法[J];微电子学与计算机;2000年01期
9 黄昌宁;中文信息处理中的分词问题[J];语言文字应用;1997年01期
10 董振东;语义关系的表达和知识系统的建造[J];语言文字应用;1998年03期
【共引文献】
中国期刊全文数据库 前10条
1 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
2 宁小红;;Web Usage Mining在电子商务中的应用[J];安徽农业科学;2007年13期
3 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
4 时雷;席磊;虎晓红;段其国;;基于支持向量机的农业数据分类研究[J];安徽农业科学;2009年05期
5 时雷;虎晓红;席磊;;基于Naive Bayes算法的大豆病害诊断研究[J];安徽农业科学;2009年11期
6 张杰,战学刚,冯金平,陈文亮;中文文本分类器的评价[J];鞍山科技大学学报;2005年Z1期
7 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
8 赵晓凡;胡顺义;;基于正向最大匹配的汉语分词[J];安阳师范学院学报;2010年05期
9 刘晓志;黄厚宽;尚文倩;;带专业词库的特征选择[J];北京交通大学学报;2006年02期
10 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
4 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 盛作国;胡红;;情报推理的逻辑理论工具——制约逻辑在情报科学中的应用[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
6 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
7 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
8 田苗;李红;;商业银行MIS总体构架及实现步骤[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
9 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
10 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
中国博士学位论文全文数据库 前10条
1 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
2 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
3 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
4 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
5 靳延安;社会标签推荐技术与方法研究[D];华中科技大学;2011年
6 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
7 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
8 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
9 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
10 马春山;移动增值业务的个性化推荐研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
5 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
6 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
7 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
8 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
9 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
10 景向永;电子资源使用统计标准化研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
3 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
4 马颖华,王永成,苏贵洋,韩客松,赵海;自动标引中基于概念层次树的主题词轮排选择的算法实现[J];高技术通讯;2003年06期
5 朱礼军,陶兰,刘慧;领域本体中的概念相似度计算[J];华南理工大学学报(自然科学版);2004年S1期
6 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
7 王东海;赵伟;陈洁;梁贺;;基于隐Markov模型汉语词性自动标注的若干分析与改进[J];长春工业大学学报(自然科学版);2007年01期
8 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
9 栾艳 ,丁二玉 ,骆斌;基于Ontology的语义检索技术[J];计算机工程与应用;2005年28期
10 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
中国博士学位论文全文数据库 前10条
1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
2 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
3 强保华;异构数据库语义集成技术研究[D];重庆大学;2005年
4 黄茂军;地理本体的形式化表达机制及其在地图服务中的应用研究[D];武汉大学;2005年
5 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
6 于海波;基于规则和本体的应用安全策略研究[D];吉林大学;2006年
7 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
8 林松涛;模块化本体建设研究[D];北京邮电大学;2006年
9 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
10 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前10条
1 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
2 艾丹祥;基于本体论的知识检索研究[D];武汉大学;2004年
3 甘健侯;基于本体的语义Web知识发现及其应用的研究[D];云南师范大学;2004年
4 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
5 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
6 邹景华;语义万维网在智能信息检索中的应用研究[D];重庆大学;2005年
7 陈琮;基于Jena的本体检索模型设计与实现[D];武汉大学;2005年
8 陈建;领域本体的创建和应用研究[D];对外经济贸易大学;2006年
9 王晓燕;面向特定领域的需求获取与分析技术研究[D];山东大学;2006年
10 熊晶;P2P环境下基于Ontology的搜索引擎[D];中国海洋大学;2006年
【二级引证文献】
中国期刊全文数据库 前4条
1 王知津;王丽娜;胡玲玲;;智能检索环境下的索引编制[J];图书馆杂志;2011年01期
2 黄微;陈玲;范轶;;数字图书馆知识组织系统热点分析[J];图书情报工作;2009年15期
3 闻中慧;;数据挖掘中的本体应用研究综述[J];软件导刊;2012年07期
4 林贵霞;胡德敏;;基于本体的语义检索模型设计与实现[J];微计算机信息;2011年03期
中国博士学位论文全文数据库 前1条
1 牟冬梅;数字图书馆知识组织语义互联策略及其应用研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 朴红吉;基于分布式多索引融合的专利信息检索研究[D];大连理工大学;2010年
2 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
3 颜婷;基于本体的语义搜索技术研究与实现[D];杭州师范大学;2011年
4 马中杰;基于领域本体的语义检索系统研究[D];安徽大学;2011年
5 马玲;基于本体的监控视频描述与检索研究及流媒体发布平台开发[D];上海交通大学;2010年
6 白冰;基于多层向量空间的语义信息检索研究[D];重庆大学;2011年
7 刘茜;基于Scorm与本体的教育资源语义检索系统的设计与实现[D];重庆大学;2011年
8 韩欣;基于本体论的生物信息学领域资源语义检索研究[D];中北大学;2012年
9 毛玉才;基于语义网技术的语义检索系统模型研究[D];黑龙江大学;2008年
10 刘爱军;基于领域本体的语义信息检索及相关技术研究[D];西北大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 梁南元;书面汉语的自动分词与一个自动分词系统—CDWS[J];北京航空学院学报;1984年04期
2 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
3 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
4 王挺;陈火旺;史晓东;;语料库和机器翻译[J];计算机科学;1996年02期
5 梁南元;书面汉语自动分词综述[J];计算机应用与软件;1987年03期
6 刘源,梁南元;汉语处理的基础工程——现代汉语词频统计[J];中文信息学报;1986年01期
7 关英春 ,秦蓓;汉语文字自动统计系统CWSS[J];中文信息学报;1986年01期
8 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
9 姚天顺,张桂平,吴映明;基于规则的汉语自动分词系统[J];中文信息学报;1990年01期
10 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
【相似文献】
中国期刊全文数据库 前10条
1 胡兆芹,张士靖;概念检索在检索网络信息中的应用[J];中华医学图书情报杂志;2005年02期
2 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
3 李蕾,王楠,钟义信,郭祥昊,韩鹏,贾自燕,高清霞;基于语义网络的概念检索研究与实现[J];情报学报;2000年05期
4 李平,田桂斌,何巍;概念检索实现的研究[J];长春光学精密机械学院学报;2001年02期
5 逄焕利,周连吉吉,刘寒梅,计小宇;基于概念检索的中文搜索引擎[J];吉林工学院学报(自然科学版);2002年01期
6 徐海燕;网上中文概念检索系统[J];情报杂志;2003年01期
7 李诚德;文献标引与概念检索法[J];世界标准化与质量管理;1995年11期
8 程立倩;基于知识库的概念检索[J];山东农业大学学报(自然科学版);2003年02期
9 罗威;基于向量空间的中文概念检索技术研究[J];情报理论与实践;2003年03期
10 盛秋艳,何文广;基于Hopfield神经网络的概念检索技术[J];情报科学;2004年03期
中国重要会议论文全文数据库 前6条
1 李信利;;基于关键词聚类的论文相似性检索[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
2 汪明;熊璋;吴晶;;基于LDAP的多语言概念检索模型的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 任慧玲;胡铁军;李丹亚;钱庆;李军莲;诸文雁;杨滨;;结合CBM的十年发展历程谈医学网络数据库及其检索系统的发展趋势[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 章成志;章成敏;王萍;;基于语义的同义词识别算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 王洪俊 ;沈水荣 ;黄翬 ;;“人民金典”语义检索系统实现方法和技术[A];中国新闻技术工作者联合会2011年学术年会论文集(上篇)[C];2011年
中国重要报纸全文数据库 前5条
1 赵志荣;专题性搜索引擎[N];计算机世界;2000年
2 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
3 钱平;我国农业网站的差距[N];农民日报;2001年
4 张颖;拯救被信息“淹没”的企业[N];计算机世界;2003年
5 戴丽昕;轻轻点击:掌握世界知识产权信息[N];上海科技报;2009年
中国博士学位论文全文数据库 前7条
1 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
2 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
3 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
4 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年
5 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
6 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
7 蒋玲;面向学科的知识元标引关键技术研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 董锦霞;基于菱形思维的概念检索模型研究[D];大连理工大学;2011年
2 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年
3 贾自艳;中文智能搜索引擎关键技术研究[D];北京工业大学;2001年
4 李欣;基于概念检索的智能信息检索技术研究[D];华中师范大学;2004年
5 陈先;智能搜索引擎关键技术研究与实现[D];哈尔滨工程大学;2003年
6 徐芳;利用概念检索实现专业搜索引擎的智能化[D];北京化工大学;2008年
7 钟伶;基于本体的益气健脾方的知识表示与应用初探[D];福建中医学院;2005年
8 韦佳;语义Web在概念检索中的研究与应用[D];哈尔滨工业大学;2006年
9 唐成;答疑系统中基于概念的搜索引擎的设计与实现[D];国防科学技术大学;2007年
10 谭德坤;文本挖掘及其在UDDI Registry智能检索中的应用[D];昆明理工大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026