收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

主题搜索引擎聚类算法的研究

李群  
【摘要】:当互联网走入我们的生活并逐渐改变这个世界的时候,搜索引擎,作为信息检索最有效的工具也逐渐被我们熟悉和使用。互联网给我们带来了信息共享的一次巨大革命,搜索引擎给这场革命注入了鲜活的血液。面对浩如烟海的网络资源,搜索引擎就好像是航船的指南针,引领着人们在网络中冲浪。根据最近统计,在中国搜索引擎使用率达到81.9%,用户规模3.75亿。搜索引擎已经成为第一大网络应用服务,是用户获取信息的首要途径。 本文首先介绍了国内外搜索引擎技术的发展及研究现状,总结了目前常用的全文检索搜索引擎的基本工作原理和存在的问题,接着详细讨论了文本聚类的原理以及几种常有聚类算法和改进方向。本文通过大量实验,提出了词频变差的理论,并将该理论应用于主题词的提取。通过对聚类算法的研究,提出了最优密度选择聚类算法。并将此算法和层次聚类算法结合在一起进行文本聚类,优化了文本聚类技术,提升了搜索引擎查询性能。在此基础上实现了面向主题的文本聚类算法的搜索引擎。该搜索引擎与同类搜索引擎相比,更具有专业化特点,查询信息的准确度也有所提升。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
2 梁跃进;;水利计算软件开发的基本方法[J];广西水利水电;1993年03期
3 李帮义;数据传输选择问题:算法设计和复杂性分析[J];系统工程学报;2005年03期
4 王俊松,吴真,储健;直流电路CAI系统的算法设计[J];仪器仪表学报;2005年S2期
5 冯昭昭,程学先;课表编排系统的设计与实现[J];湖北工业大学学报;2005年04期
6 朱永松,程曦;导线网平差算法设计与实现[J];湖北工业大学学报;2005年04期
7 何跃,蒋国银,苏应生;基于WEB的工作流管理系统设计与实现[J];计算机工程与应用;2005年33期
8 陈海山;吴芸;;广义表的二叉链式存储表示及其算法设计[J];计算机工程与应用;2005年35期
9 李海伦;唐全;;“程序设计”课程教学改革的研究与实践——加强算法设计教学,提高学生编程能力[J];计算机教育;2005年07期
10 唐建国;;浅谈C语言的教学[J];福建电脑;2006年04期
11 霍建;刘鸿雁;段秀铭;;手工拍发的莫尔斯码信号种类识别算法设计[J];鞍山科技大学学报;2006年04期
12 华东;;一种新的除法器算法的研究[J];浙江工贸职业技术学院学报;2006年03期
13 姚志宏;杨勤科;吴喆;崔琰;;区域尺度降雨径流估算方法研究Ⅰ-算法设计[J];水土保持研究;2006年05期
14 殷荣庆;;高校排课算法的分析与设计[J];安徽教育学院学报;2006年06期
15 闭应洲;卢远;;利用启发性知识降低交叉算子破坏性的研究[J];广西师范学院学报(自然科学版);2006年04期
16 陈海山;钱锋;田英;雷鸣;;Josephus问题的算法设计与应用研究[J];计算机工程与应用;2007年01期
17 孙玉强;顾玉宛;孙富琴;;基于随机码数列的文件加密算法的实现[J];微计算机信息;2007年06期
18 闭应洲;丁立新;杨小雄;;基于免疫学原理降低交叉算子破坏性的研究[J];计算机工程与应用;2007年18期
19 张银南;张建荣;方志刚;;CAD可听化数据映射算法及其应用研究[J];计算机工程;2007年09期
20 井田;;栈在“迷宫问题”算法中的应用和实现[J];淮南师范学院学报;2007年03期
中国重要会议论文全文数据库 前10条
1 李永强;刘杰;李允公;李祥;;Daubechies小波基的算法设计[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
2 钟章建;黄玮;马万经;姚佼;;面向协调控制的交通小区划分算法设计与实现[A];2008第四届中国智能交通年会论文集[C];2008年
3 陈家照;罗寅生;;群智能优化算法研究[A];第三届中国智能计算大会论文集[C];2009年
4 张家超;孔媛媛;;结合SVM与免疫遗传算法设计IDS的检测算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
5 张晋;;嵌入式电脑鼠运行算法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
6 孔垂柳;田地;;基于程序设计思想的C语言教学方案[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年
7 宁泽洪;董占勇;徐达旺;;基于CCDF的微波功率统计测量的算法设计[A];2011年全国微波毫米波会议论文集(下册)[C];2011年
8 洪露;穆志纯;;一种新的克隆混沌调节算法的研究[A];第二十六届中国控制会议论文集[C];2007年
9 苟刚;黄伶俐;;电子地图安全显示算法设计与实现[A];全国计算机安全学术交流会论文集(第二十三卷)[C];2008年
10 赵保军;史采成;朱梦宇;张弘;;低信噪比红外图象信号处理系统算法设计[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
中国博士学位论文全文数据库 前10条
1 胡扬;人工代谢算法若干问题研究[D];中南大学;2010年
2 张常淳;基于MapReduce的大数据连接算法的设计与优化[D];中国科学技术大学;2014年
3 孙贺;算法设计中的若干前沿问题[D];复旦大学;2009年
4 廖鑫;高效隐写算法的设计研究[D];北京邮电大学;2012年
5 任志磊;组合优化问题的特化与泛化算法设计[D];大连理工大学;2013年
6 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
7 王赞;基于染色体自交叉Memetic算法的教学调度问题研究[D];天津大学;2010年
8 尤明厚;MIMO接收机技术与编码优化研究[D];北京邮电大学;2010年
9 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
10 牛云云;求解计算困难问题的膜计算模型与算法研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈熠;基于代谢路径的生物网络比对算法[D];西安电子科技大学;2009年
2 陈丹;基于遗传聚类的社团发现算法研究[D];西南交通大学;2014年
3 王丽;图论在算法设计中的应用[D];西安电子科技大学;2010年
4 王双记;类电磁机制算法的改进与应用[D];西安电子科技大学;2012年
5 苏联钦;基于局部信息的重叠社团发现算法研究[D];华中科技大学;2013年
6 李超;基于蚁群算法的移动Agent服务选择[D];山东大学;2014年
7 王胜训;蚁群算法的改进及TSP仿真研究[D];西安电子科技大学;2014年
8 熊卫卫;高校排课系统算法设计与实现[D];吉林大学;2004年
9 李海生;蜂群算法及其在垂直Web搜索中的应用[D];广州大学;2010年
10 刘旭;人工植物算法向地性算子的设计[D];太原科技大学;2013年
中国重要报纸全文数据库 前10条
1 ;算法设计的策略[N];电脑报;2003年
2 杨杨;姚期智:归去来兮[N];人民日报海外版;2007年
3 李剑 朱延峰 吴畏;勇于挑战“最高峰”[N];新清华;2007年
4 PALADIN;化整为零,变繁为简[N];电脑报;2003年
5 覃特;上海交大的胜利,谁的隐忧?[N];中国计算机报;2005年
6 ;突破五道“关”[N];计算机世界;2003年
7 王慧芳;江苏首届大学生程序设计竞赛举行[N];中国电子报;2008年
8 中国消费者报 胡军;国产DC品牌面临困局[N];中国消费者报;2005年
9 陈学宏;程序设计教学中的“紧”与“松”[N];中国电脑教育报;2003年
10 梅贤明 卓小康;研究生叫板高校的“及格线”[N];今日信息报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978