收藏本站
《浙江大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

个性化技术及其在数字图书馆中应用的研究

张寅  
【摘要】:近年来,国内外多个大规模图书数字化计划进展顺利,在大规模数字图书馆环境下的个性化技术研究已成为一个重要的研究方向。作者参与了“高等学校中英文图书数字化国际合作计划(CADAL)”的建设,主要负责研发CADAL百万册图书服务平台,为服务平台实现了图书推荐与搜索应用。 本文工作围绕个性化技术研究及其在百万册图书上的应用而展开。针对推荐系统,研究了针对单维度评分以及多维度评分的协同过滤技术:但是在百万册图书服务平台服务过程中,发现读者很少为图书打分,导致基于评分的推荐系统不能够正常工作;为此研发了基于图书点击日志挖掘的图书实时推荐系统,并在个人空间中提供了基于自定义多媒体规则的个性化推荐系统。针对图书搜索,注重设计用户友好的人机交互界面。研究成果如下: (1)提出了针对单维度评分推荐系统的吸收随机行走模型:将单维度评分数据转换成为二部图,引入和每个用户或物品节点相连接的空节点,在增强二部图上运用高斯随机场进行建模,将top-N推荐问题建模成基于图的半监督分类问题,在考虑每个节点的度的情况下推导出一种有效的吸收随机行走模型。在两种真实数据集上的实验结果证明了该吸收随机行走模型的有效性。 (2)提出了针对多维度评分推荐系统的两种概率隐含语义分析模型:扩展了著名的单维度评分概率隐含语义分析模型(pLSA),在保留pLSA引入的隐含变量的情况下,采用了两种不同的多元概率分布来建模每个用户的多维度评分。在Yahoo! Movies真实评分数据上的实验结果表明了两种多维度评分概率隐含语义分析模型在预测和推荐任务中的表现显著好于单维度pLSA以及其它对比方法。 (3)研发了基于可伸缩紧凑浏览模式树的图书实时推荐系统:提出了红黑头节点树索引的紧凑浏览模式树,该数据结构使用前缀共享树来增量式处理新日志,使用红黑头节点树来显著地提高系统可伸缩性;提出了可伸缩紧凑浏览模式树的构建算法,以及基于该浏览模式树的分治式实时推荐算法。在CADAL服务平台的图书点击日志上的实验结果表明了该方法的有效性和高可伸缩性。 (4)研发了百万册服务平台中的图书搜索服务和个性化空间:实现了交互界面友好的多资源库图书统一并行检索系统;研发了支持查询扩展和探索式浏览的图书章节检索系统;为个性化空间开发了基于自定义多媒体规则的个性化推荐系统,读者可以设置图书、图像和书法字三种多媒体规则,系统按照内容相似度以及从日志或用户反馈中挖掘出来的群体阅读倾向,主动推送合适的数字内容。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:G250.76

【参考文献】
中国期刊全文数据库 前1条
1 章夏芬;庄越挺;吴江琴;吴飞;;Hierarchical Approximate Matching for Retrieval of Chinese Historical Calligraphy Character[J];Journal of Computer Science & Technology;2007年04期
中国硕士学位论文全文数据库 前2条
1 王春贺;个性化推荐技术研究及其在数字图书馆中应用[D];浙江大学;2007年
2 袁川;基于用户点击行为的数字图书搜索系统研究与实现[D];浙江大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 宋威;刘宇;李晋宏;;基于数据库垂直表示的高效用项集挖掘算法研究[J];北方工业大学学报;2011年01期
2 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期
3 白昊;王崑声;胡昌振;张刚;经小川;;基于FP-Growth算法及补偿性入侵证据的攻击意图识别[J];北京理工大学学报;2010年08期
4 张帆;林建;;智能搜索引擎信息过滤机制研究[J];图书与情报;2007年04期
5 万隆昌;聂承启;;基于FP-Tree的遍历算法[J];江西师范大学学报(自然科学版);2005年06期
6 栗晓聪;滕少华;;频繁项集挖掘的Apriori改进算法研究[J];江西师范大学学报(自然科学版);2011年05期
7 纪良浩;;协作过滤信息推荐技术研究[J];重庆邮电大学学报(自然科学版);2012年01期
8 刘独玉;杨晋浩;钟守铭;;关联规则挖掘研究综述[J];成都大学学报(自然科学版);2006年01期
9 孙智勇;刘星;;基于关联规则挖掘方法的结构性减税实证研究[J];重庆大学学报(社会科学版);2010年01期
10 张星;李蓓;;FP-Growth关联规则挖掘的改进算法[J];平顶山工学院学报;2008年01期
中国重要会议论文全文数据库 前8条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 ;An Analysis on the Personalized Recommendation Architecture of Mobile Commerce Application[A];第六届(2011)中国管理学年会——管理科学与工程分会场论文集[C];2011年
3 ;A Fuzzy MCDM Based Approach for Hybrid Recommender Systems[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
4 ;COLLABORATIVE FILTERING RECOMMENDATION ALGORITHM BASED ON LOOK-AHEAD SELECTIVE SAMPLING[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
5 陈子军;李伟;李霞;王鑫昱;;基于投影编码的频繁子树挖掘算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 何星星;谢伙生;;流数据中一种高效剪枝的频繁序列挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 张宇;个性化移动内容服务的模型和支持技术研究[D];华中科技大学;2010年
2 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
3 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
4 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
5 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
6 贺利坚;多Agent系统中信任和信誉模型的研究[D];北京交通大学;2011年
7 马晓普;角色工程中的角色与约束生成方法研究[D];华中科技大学;2011年
8 靳延安;社会标签推荐技术与方法研究[D];华中科技大学;2011年
9 胡慕海;面向动态情境的信息推荐方法及系统研究[D];华中科技大学;2011年
10 刘倩;基于客户关系发展阶段的推荐系统特性需求分析[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
2 吴则则;支持动态演进的用户兴趣模型挖掘方法研究[D];山东科技大学;2010年
3 王芳;基于EVS相似度的邮件社区划分方法研究[D];郑州大学;2010年
4 李威;多参数扰动的隐私保护关联规则挖掘算法研究[D];哈尔滨工程大学;2010年
5 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年
6 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
7 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
8 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年
9 何克勤;基于标签的推荐系统模型及算法研究[D];华东师范大学;2011年
10 韩璐;针对推荐系统中信息共享需求下隐私保护机制的研究与实现[D];华东师范大学;2011年
【二级参考文献】
中国期刊全文数据库 前4条
1 陈艳梅;基于元数据的数字图书馆信息资源组织[J];大学图书情报学刊;2003年01期
2 周登朋;谢康林;;Lucene搜索引擎[J];计算机工程;2007年18期
3 徐志明,王晓龙;A New Linguistic Decoding Method for Online Handwritten Chinese Character Recognition[J];Journal of Computer Science and Technology;2000年06期
4 张敏,马少平,宋睿华;DF还是IDF?主特征模型在Web信息检索中的使用[J];软件学报;2005年05期
中国硕士学位论文全文数据库 前4条
1 马睿;元数据检索及两种挖掘算法在图书个性化推荐中的应用研究[D];吉林大学;2006年
2 李向云;Web日志挖掘技术的研究[D];大庆石油学院;2007年
3 孙启明;基于Web日志挖掘的搜索引擎排序算法的改进[D];哈尔滨工程大学;2007年
4 药成刚;基于链接结构的中文网页排序算法研究[D];哈尔滨工业大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 张欣;21世纪的图书馆——数字图书馆及其实现的要素[J];外交学院学报;1999年02期
2 王萍;;数字图书馆初露端倪[J];科学大众(中学版);1999年11期
3 李春茜,万坚军;数字图书馆及其信息组织与检索浅识[J];图书馆理论与实践;2001年01期
4 段梅,李小梅;浅谈数字图书馆[J];太原科技;2001年02期
5 宁淑华;数字图书馆与著作权保护[J];现代情报;2001年05期
6 刘志贤;论数字图书馆的合理使用[J];情报杂志;2002年09期
7 邱文杰;高校发展数字图书馆的对策浅谈[J];桂林航天工业高等专科学校学报;2002年04期
8 刘畅;数字图书馆人财两得[J];互联网周刊;2002年15期
9 王鑫鑫;曹高辉;;XML及其在数字图书馆中的应用[J];图书情报论坛;2002年02期
10 ;国家十五规划教育部重点课题项目“中小学数字图书馆”[J];中国电化教育;2002年12期
中国重要会议论文全文数据库 前10条
1 刘颖;;论数字图书馆的信息构建[A];华北地区高校图协第二十四届学术年会论文(文章)汇编[C];2010年
2 郭启智;;关于数字图书馆有关问题的探讨[A];山西省科学技术情报学会学术年会论文集[C];2004年
3 符翠;;数字图书馆建设探讨[A];新环境下图书馆建设与发展——第六届中国社区和乡镇图书馆发展战略研讨会征文集(下册)[C];2007年
4 王爱华;张铭;陈捷;杨冬青;唐世渭;;基于形式本体的数字图书馆内容元数据的创建[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 高翔;;浅谈网站模式下的数字图书馆资源建设[A];华北地区高校图协第二十四届学术年会论文(文章)汇编[C];2010年
6 喻浩;潘薇;;数字图书馆支撑技术及其发展[A];数字图书馆资源建设与发展学术研讨会暨中国农学会农业图书馆分会理事工作会议会议资料[C];2007年
7 潘淑春;喻浩;;数字图书馆建设及其运行模式研究[A];数字图书馆资源建设与发展学术研讨会暨中国农学会农业图书馆分会理事工作会议会议资料[C];2007年
8 林英;;谈谈中国数字图书馆的研究、开发与建设[A];福建省图书馆学会2002年学术年会论文集[C];2002年
9 延宏;;数字图书馆:服务如何个性化[A];新观点新学说学术沙龙文集24:数字时代图书馆的创新与共享[C];2008年
10 来雪玲;;数字图书馆的定位与对策[A];图书馆与西部大开发[C];2002年
中国重要报纸全文数据库 前10条
1 本报记者 延宏;数字图书馆:服务如何个性化[N];科技日报;2008年
2 本报记者 洪黎明;数字出版与数字图书馆的互动[N];人民邮电;2008年
3 本报记者 诸葛漪;国内数字图书馆为何“起大早赶晚集”[N];解放日报;2009年
4 张宇;走在“云端”的数字图书馆[N];中国文化报;2010年
5 通讯员 邓尚新;洛浦数字图书馆正式启动[N];和田日报(汉);2010年
6 本报记者 姜天骄 文化部副部长 杨志今;让数字图书馆资源惠及更多基层群众[N];经济日报;2010年
7 本报记者 吴娜;让每个县都有数字图书馆[N];光明日报;2010年
8 记者 牛春梅;数字图书馆将覆盖全国[N];北京日报;2010年
9 记者 陈磊;我国数字图书馆侵权盗版现象普遍存在[N];科技日报;2010年
10 通讯员 傅晨琦 记者 叶辉;杭州数字图书馆率先实现网站、手机、电视“三网融合”[N];光明日报;2010年
中国博士学位论文全文数据库 前10条
1 周丽霞;数字图书馆版权获取研究[D];吉林大学;2011年
2 陆颖隽;虚拟现实技术在数字图书馆的应用研究[D];武汉大学;2013年
3 于晓燕;基于网格的数字图书馆模式构建研究[D];南开大学;2010年
4 伍革新;基于关联数据的数字图书馆资源聚合与服务研究[D];华中师范大学;2013年
5 彭双五;数字图书馆的著作权法律问题研究[D];武汉大学;2013年
6 孙坦;数字图书馆理论与发展模式研究[D];中国科学院文献情报中心;2000年
7 关欣;数字图书馆知识管理研究[D];吉林大学;2010年
8 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
9 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
10 韩毅;语义网格环境下数字图书馆知识组织策略与应用研究[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 罗宏;数字图书馆著作权风险规避研究[D];四川大学;2004年
2 罗龙艳;数字图书馆资源主题信息门户的设计与实现研究[D];四川大学;2004年
3 董正伟;Google数字图书馆所引发的著作权问题思考[D];中国政法大学;2011年
4 田艳芳;数字图书馆中数据预处理子系统的设计与实现[D];国防科学技术大学;2001年
5 戴洪霞;数字图书馆信息资源建设研究[D];东北师范大学;2002年
6 阚忠良;数字图书馆中基于结构和内容的文本信息检索技术的研究[D];黑龙江大学;2002年
7 贺玲玲;数字图书馆运行机制与管理模式研究[D];国防科学技术大学;2003年
8 曹树新;图书馆自动化管理信息系统[D];大连理工大学;2005年
9 李东涛;数字图书馆环境下的著作权问题研究[D];中国政法大学;2005年
10 辛霄恩;网络文献数字化方案[D];华东师范大学;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026