收藏本站
《郑州大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于概率模型的名人网页相关度评价研究

贾玉祥  
【摘要】:个性化检索是当前信息检索的研究热点之一。它根据用户的个性化需求,实现信息的自动收集、分析和推送等服务。与一般的信息检索相比,服务的针对性更强,质量更高。相关网页排序结果的优劣是检索服务质量好坏的最根本体现,因此网页的相关度评价是个性化检索系统的关键环节。概率模型在用户兴趣建模上有独特的优势,它引入概率参数,可以更准确地刻画用户的需求,适合个性化检索的相关度评价。 本文以名人网页为基础,研究实体网页的个性化检索,旨在提高实体网页的相关度评价准确率。本文设计并实现了基于概率模型的名人网页相关度评价算法,探讨了概率模型的训练、模型的改进及查询扩展等三方面问题,总结了概率模型的规律,提出了多种提高网页相关度评价准确率的方法,并给出了翔实的实验结果。 本文研究工作的主要创新点有: (1)提出了一种实体网页的概率模型的训练集选择方法,提高训练效果的同时降低了算法开销。 (2)改进模型的概率计算公式,引入更细致的用户反馈信息,优化特征项的分布概率;改进相关度计算公式,引入词频、网页长度、HTML标记等网页信息,提出对实体分类定制相关度计算公式的思想。 (3)针对实体属性信息的特点,提出相关网页和用户查询相结合抽取相关特征项进行查询扩展的方法。 实验表明,与名人网页相关度评价的原有模型相比,本文模型在很大程度上提高了相关度评价的准确率,并且可以直接应用到其他类型实体网页的检索,文中的方法和结论为实体网页的个性化检索研究提供了参考。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 曹晓龙;个性化搜索引擎及其关键技术研究[D];江南大学;2012年
2 张腾宇;元搜索引擎中结果聚合排序方法的研究[D];北京工业大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 昝红英,俞士汶;CCD及其应用[J];广西师范大学学报(自然科学版);2003年01期
2 昝红英,苏玉梅,孙斌,俞士汶;名人网页的相关度评价[J];中文信息学报;2003年05期
3 俞士汶,段慧明,朱学锋,张化瑞;综合型语言知识库的建设与利用[J];中文信息学报;2004年05期
4 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期
5 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
6 王家钺;信息检索中“相关性”概念的研究[J];现代外语;2001年02期
【共引文献】
中国期刊全文数据库 前10条
1 康海燕;任俊玲;陈昕;王鹤沩;;基于自然语言处理的多级网页过滤器研究[J];信息安全与技术;2011年10期
2 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
3 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
4 索娟娟;;信息时代计算语言学在英语教学中的应用[J];毕节学院学报;2008年01期
5 明均仁;张帆;;网络文本信息过滤的意义及其模型初探[J];图书与情报;2007年04期
6 王雅坤;成全;;信息检索相关性研究综述及发展趋势[J];图书与情报;2012年01期
7 尚福华;韩开旭;;基于相关术语群和同义词的查询扩展研究[J];长江大学学报(自然科学版)理工卷;2010年03期
8 熊德兰,柴玉梅,昝红英;基于内容的名人网页褒贬性评价[J];平顶山工学院学报;2005年04期
9 何海江;凌云;;由向量空间相关模型识别博客文章的垃圾评论[J];长沙大学学报;2008年02期
10 沈竞;蒋侨;;DSTFA分布式短文本过滤算法[J];四川兵工学报;2011年10期
中国重要会议论文全文数据库 前10条
1 苏新春;王惠;卢伟清;秦少康;;语言知识库的内化与细化——完善词义知识库之设想[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 张威;张博刚;廖飞雄;陈月宁;;基于软件运行记录的交互测试研究[A];第六届中国测试学术会议论文集[C];2010年
4 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 俞士汶;段慧明;朱学锋;;词语兼类暨动词向名词漂移现象的计量分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 郑德权;赵铁军;李生;于浩;;基于内容的词义本体知识自动获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
3 成颖;信息检索相关性判据及应用研究[D];南京大学;2011年
4 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
5 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
6 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
7 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
8 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
9 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
10 WANG Jiayue;[D];广东外语外贸大学;2003年
中国硕士学位论文全文数据库 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
3 杨海南;基于语义词典和局部分析的查询扩展研究[D];武汉理工大学;2010年
4 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
5 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
6 杨玉珍;基于统计与规则的特征权重计算方法研究与应用[D];山东师范大学;2011年
7 李欣;基于校园网的网络信息过滤系统的设计与实现[D];山东师范大学;2011年
8 曾芳;混合式教学支撑系统的设计与实现[D];西北大学;2011年
9 崔争艳;中文短文本分类的相关技术研究[D];河南大学;2011年
10 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 路海明,卢增祥,李衍达;基于多Agent混合智能实现个性化信息推荐[J];高技术通讯;2001年04期
2 尹中航,王永成,蔡巍;应用支持向量机进行网上信息自动分类[J];高技术通讯;2001年11期
3 战立强;刘大昕;;频繁项集快速挖掘算法研究[J];哈尔滨工程大学学报;2008年03期
4 王继民,陈翀,彭波;大规模中文搜索引擎的用户日志分析[J];华南理工大学学报(自然科学版);2004年S1期
5 罗武;方逵;朱兴辉;;网络搜索引擎排序算法研究进展[J];湖南农业科学;2010年07期
6 罗三定,陆文彦,王浩,贾维嘉;基于概念的文本类别特征提取与文本模糊匹配[J];计算机工程与应用;2002年16期
7 王远定;梁久祯;;利用关键词倒排表实时检索中文网页[J];计算机工程与应用;2010年28期
8 邵华;高凤荣;邢春晓;蒋丽华;;基于VSM的分层网页推荐算法[J];计算机科学;2006年11期
9 盖杰,王怡,武港山;基于潜在语义分析的信息检索[J];计算机工程;2004年02期
10 张亮;冯志勇;;个性化搜索引擎[J];计算机工程;2006年18期
中国硕士学位论文全文数据库 前5条
1 蔺继国;基于点击数据分析的个性化搜索引擎研究[D];国防科学技术大学;2010年
2 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
3 许琦;个性化信息服务技术研究[D];浙江大学;2007年
4 种梅;元搜索引擎中的关键技术研究[D];山东师范大学;2008年
5 张志军;基于本体的个性化元搜索技术的研究和实现[D];江西师范大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
2 昝红英,俞士汶;CCD及其应用[J];广西师范大学学报(自然科学版);2003年01期
3 俞士汶;中文输入中语法分析技术的应用[J];中文信息学报;1988年03期
4 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
5 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期
6 尤昉,李涓子,王作英;基于语义依存关系的汉语语料库的构建[J];中文信息学报;2003年01期
7 昝红英,苏玉梅,孙斌,俞士汶;名人网页的相关度评价[J];中文信息学报;2003年05期
8 孙茂松;关于词汇使用度的初步研究[J];语言文字应用;2000年01期
9 俞士汶,段慧明,朱学锋;汉语词的概率语法属性描述[J];语言文字应用;2001年03期
10 靳光瑾,郭曙纶,肖航,章云帆;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[J];语言文字应用;2003年04期
中国重要会议论文全文数据库 前2条
1 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 刘扬;俞士汶;;CCD构造模型及VACOL辅助软件的设计与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
中国重要报纸全文数据库 前1条
1 本报记者 温红彦;[N];人民日报;2002年
【相似文献】
中国期刊全文数据库 前10条
1 陈争艳;朱保锋;;名人网页相关度评价的概率模型研究[J];河南教育学院学报(自然科学版);2008年01期
2 马治飞;徐望;王炳锡;王兴斌;;基于概率模型和倒谱差分的特征补偿算法[J];计算机工程;2006年18期
3 陈东用;梁艳超;周永权;李陶深;;基于概率模型的遗传规划在故障诊断中的应用[J];计算机工程与设计;2006年22期
4 廖翠玲;余昭平;;A5/1算法的概率模型分析[J];计算机工程;2010年23期
5 孙泽宇;丁国强;张永胜;;一种概率模型无线传感器网络覆盖算法[J];计算机应用研究;2010年12期
6 郑红;隋强强;陈磊;;运动小目标检测最优图像帧数概率模型[J];系统工程与电子技术;2011年01期
7 陈莹;艾春璐;;基于均衡化概率模型的特征匹配及其应用[J];光电工程;2011年02期
8 Isola Ajiferuke;吴显庆;;原作者分布的概率模型[J];情报科学;1992年03期
9 孙捷先;智能控制系统的信息集成与建模[J];计算技术与自动化;1994年03期
10 符小卫;高晓光;;基于概率分析进化算法的飞行航迹规划[J];计算机工程与应用;2006年28期
中国重要会议论文全文数据库 前10条
1 贾玉祥;昝红英;范明;;基于概率模型的网页相关度研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 张少华;言茂松;;抽水蓄能电站调峰效益的经济评价[A];1995中国控制与决策学术年会论文集[C];1995年
3 王世忠;;公路桥梁恒载的概率模型[A];全国桥梁结构学术大会论文集(上册)[C];1992年
4 段权;;压力容器用16MnR钢焊接接头疲劳裂纹扩展规律的研究[A];疲劳与断裂2000——第十届全国疲劳与断裂学术会议论文集[C];2000年
5 王冰洁; 沈玉清;;中国上市公司被收购风险概率模型的实证分析[A];中国灾害防御协会风险分析专业委员会第二届年会论文集(一)[C];2006年
6 谢柏桥;戴光明;郑蔚;王剑文;;有指导的多目标演化算法在区域星座设计中的应用[A];中国宇航学会深空探测技术专业委员会第四届学术年会论文集[C];2007年
7 陈学前;肖世富;刘信恩;;基于概率模型的圣地亚结构动力学问题模型确认[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
8 李俊薇;杨青;张连发;黄宇颖;;基于贝叶斯定理的个性化体检网站的研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
9 马治飞;徐望;王炳锡;王兴斌;;一种基于概率模型和倒谱差分的特征补偿算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 那键;刘文芬;;乘加型钟控组合生成器的符合率问题[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前10条
1 李必德(Peter Zimmerli);亚洲台风模型需要精益求精[N];中国保险报;2006年
2 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
3 万云;以信用风险管理的名义[N];中国经营报;2006年
4 张宗新朱伟骅;防范公司管理层利用重大事件侵害外部投资者[N];中国证券报;2007年
5 应晓敏 窦文华;他山之石[N];计算机世界;2003年
6 郝莉;个性化数字图书馆[N];网络世界;2003年
7 程实;世界杯,如何影响全球股市[N];第一财经日报;2006年
8 于发修;寻找搜索的技巧[N];中国计算机报;2001年
9 记者郭均忠;结构可靠度理论为桥梁护驾[N];中国交通报;2002年
10 王一琳 夏峰 王立伟;亚太区银行离巴塞尔Ⅱ很远[N];东方早报;2005年
中国博士学位论文全文数据库 前10条
1 刘扬;混凝土斜拉桥施工期的时变可靠性研究[D];湖南大学;2005年
2 李富民;氯盐环境钢绞线预应力混凝土结构的腐蚀效应[D];中国矿业大学;2008年
3 黄晓英;钟控生成器概率模型输出序列的性质研究[D];中国人民解放军信息工程大学;2003年
4 吴晶晶;PKI关键理论与应用技术研究[D];中国科学技术大学;2008年
5 孙庆杰;静态图像中人体检测技术研究[D];中国科学院研究生院(软件研究所);2004年
6 郭丽峰;电梯导轨不平顺度测量、建模及轿箱水平振动特性的研究[D];天津大学;2005年
7 余怀忠;地震前兆物理模型与地震预测初步研究[D];中国地震局地质研究所;2006年
8 黄玉娟;基于k词的DNA序列分析的模型研究及应用[D];大连理工大学;2012年
9 沈照伟;基于可靠度的海洋工程随机荷载组合及设计方法研究[D];浙江大学;2004年
10 王慧琼;计算机视觉中的二分光问题研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 贾玉祥;基于概率模型的名人网页相关度评价研究[D];郑州大学;2006年
2 蒋冬初;遗传算法及其在函数优化问题中的应用研究[D];湖南大学;2004年
3 柳群义;构皮滩水电站边坡岩体结构面概率模型与岩体质量分级研究及应用[D];中南大学;2005年
4 明永涛;泛广义自缩减生成器的设计与分析[D];解放军信息工程大学;2007年
5 赵欣庆;高中概率教学研究[D];西北师范大学;2005年
6 尹明霞;高中数学新课程概率教学研究[D];首都师范大学;2006年
7 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年
8 张剑锋;规则与统计相结合的中文分词方法研究[D];山西大学;2008年
9 杨礼敏;高中数学概率统计教学复习策略研究[D];河北师范大学;2007年
10 杨斐斐;基于群组的个性化检索技术研究及应用[D];西北大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026