收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向Blog的自动摘要与搜索排序算法研究

陈明  
【摘要】:随着信息技术的不断发展,Blog应用正在不断普及和深化。庞大的Blog用户群所形成的海量信息源使得Blog成为一个极其丰富而有价值的信息资源库。面对如此巨大的信息资源,优秀的Blog搜索引擎显得十分重要,这一需求使得Blog搜索引擎受到越来越多研究人员的关注。在与之相关的研究中,合理的自动摘要能够让用户迅速判断出信息的有效性,良好的搜索排序算法能够优先返回给用户质量更高的结果,这两部分对Blog搜索引擎的好坏无疑有着决定性的作用。 本文主要针对面向Blog的自动摘要和搜索排序算法进行了较深入的研究,主要研究工作概括如下: 1)描述了Blog相关概念,介绍了和本文研究相关的国内外研究现状,分别对面向Blog的自动摘要和搜索排序算法的相关方法进行了详细分析。 2)根据本文应用需求,对Blog中的信息进行了两方面预处理,包括:将评论识别成讨论型评论、关注型评论、垃圾评论三类,并根据类型挖掘对应的价值;利用贝叶斯文本分类方法,融合博文、标签和评论三种特征对博文进行分类。 3)提出了一种基于特征信息的Blog自动摘要方法。该方法在充分利用Blog特征信息的基础上,基于潜在语义相关性来融合评论中的关注点,生成对读者更为友好的摘要,同时通过摘要复选的方法平衡了主题覆盖与信息冗余。 4)利用博主之间的各种关注关系评价博主的影响力,继而计算博文的内容价值,并考虑评论因素,给出博文的静态得分。然后考虑博文新鲜度,查询相似性等多方面因素来对搜索结果进行合理排序。 5)利用上述研究成果,设计并实现了一个能够适应用户对评论偏好的Blog搜索引擎原型系统,该原型系统同时提供了分类浏览功能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王伟;Blog在基于网络的研究性学习中的作用[J];中国远程教育;2005年03期
2 ;博客展示[J];信息技术教育;2005年03期
3 刘雪梅;网络Blog——写作催生的新闻报道新形式[J];新闻与写作;2004年04期
4 张良图;谈谈Blog在图书馆中的应用[J];图书馆工作与研究;2004年06期
5 徐丽萍;Blog走向企业[J];中国电子商务;2003年07期
6 徐丽萍;Blog走向企业[J];中国电子商务;2003年04期
7 窦荣军;如何安装Blog服务器[J];计算机教与学;2004年Z1期
8 梁海燕,黄艳娟;基于Blog的企业知识共享的探讨[J];情报探索;2005年01期
9 ;建造Blog[J];个人电脑;2003年08期
10 佚名;什么是“博客”[J];教师博览;2004年05期
11 刘雪梅;网络Blog——新闻爱好者催生的媒体新宠[J];新闻爱好者;2003年09期
12 孙志国;Blog,知识共享与个人知识管理[J];农业网络信息;2004年10期
13 蓝颖;网上思想交流的栖息地[J];新电脑;2004年06期
14 毛向辉;2003:创新技术将引领企业E-learning方向[J];软件工程师;2003年01期
15 龚颖,朱祎;Blog:现代远程教育下建构主义的新实践[J];江苏广播电视大学学报;2004年06期
16 ;环球观察[J];电子商务世界;2002年10期
17 ;音乐随车行[J];个人电脑;2003年10期
18 吴英劼;博客传播模式探究[J];当代传播;2004年06期
19 眼镜猪 ,王争强;玩转RSS天下信息随心看[J];电脑爱好者;2005年05期
20 ;Blog小资料[J];中国研究生;2003年05期
中国重要会议论文全文数据库 前10条
1 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 毕景刚;韩颖;;班级Blog在亲师沟通中的应用研究[A];Proceedings of 2011 National Teaching Seminar on Cryptography and Information Security(NTS-CIS 2011) Vol.1[C];2011年
3 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 郁笑春;;Blog——现代高校图书馆服务育人之创新模式[A];现代图书馆服务:浙江省图书馆学会第十一次学术研讨会论文集[C];2008年
6 朴星海;赵铁军;郑德权;张迪;;面向Blog的网络爬行器设计与实现[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 于亮;尚久华;;教学Blog的辅导模式在《运动生理学》课程教学中的应用[A];2009全国运动生理学发展与学科建设研讨会论文集[C];2009年
8 段秀婷;何婷婷;宋乐;;基于PMI-IR算法的Blog情感分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 刘赣洪;危文斌;;教育叙事支持教师专业发展研究[A];中国教育技术协会2004年年会论文集[C];2004年
10 夏振;;浅析博客在企业知识管理中的应用[A];山西省科技情报学会2004年学术年会论文集[C];2005年
中国博士学位论文全文数据库 前9条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 曹锦丹;多视角信息组织模式研究[D];吉林大学;2006年
4 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
5 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
6 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
7 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
8 生龙;二型模糊系统理论及应用[D];电子科技大学;2012年
9 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 苗家;Blog文档的自动文摘方法研究[D];山东大学;2011年
2 曹红;Blog社区的发现与演变追踪技术研究[D];哈尔滨工业大学;2010年
3 罗方;基于社会网络分析的Blog社区发现[D];安徽工业大学;2011年
4 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
5 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
6 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
7 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
8 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
9 甄涛;基于社团发现的Blog信息收集原型系统的研究[D];解放军信息工程大学;2009年
10 王向东;Blog系统的设计与实现[D];电子科技大学;2009年
中国重要报纸全文数据库 前10条
1 曲槛;草根Blog[N];中国经济导报;2005年
2 阿杰;一段代码击溃Bo-Blog[N];电脑报;2005年
3 电脑虎;个人传媒时代的序幕:Blog[N];中国电脑教育报;2004年
4 飞翔鸟;消逝的“博客公车”[N];中国电脑教育报;2004年
5 ;一句话经验[N];中国计算机报;2004年
6 江苏省张家港市东莱小学 黄利锋;Blog让网络探究更精彩[N];中国电脑教育报;2005年
7 陈青;谁在阻止RSS的普及[N];中国电脑教育报;2005年
8 见习记者 杨琳桦;博客要来一场Tag革命[N];21世纪经济报道;2005年
9 本报记者 杨琳桦;WEB2.0的资金驱动与技术内核[N];21世纪经济报道;2005年
10 寒生;聊得过瘾 玩得新奇[N];中国计算机报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978