收藏本站
《西安电子科技大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

搜索引擎的研究与实现

刘琨  
【摘要】: 本文在深入分析网页获取、索引生成、级别系统、索引检索等搜索引擎核心技术的基础上,设计并实现了一种新的搜索引擎。该搜索引擎使用分布式技术实现网页获取模块;通过词法分析、中文分词、无用词汇删除、词干提取、索引词条选择和词典等技术建立索引数据库;该搜索引擎的级别系统使用了新的网络访问模型和级别计算模型,大大降低了搜索引擎对于计算机资源的要求。Cache技术的使用提高了用户访问效率。开放的体系结构使搜索引擎成为相关技术可靠和灵活的平台。 在分析了众多优秀的网页排序算法的基础上,本文设计了新的网站级别系统。通过这个新的系统,搜索引擎能够实现更大规模的网页覆盖和更快的索引更新,从而提高更好的搜索服务。 搜索引擎是建立在集群系统之上的,因此可以建立大规模的索引系统和提供高速用户访问的支持。搜索引擎的体系结构是开放的,相关技术能以它作为平台,实现灵活的集成。搜索引擎的各种配置和规则都是字典化的,它可以通过灵活的配置来实现扩展和伸缩。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP393.09

【引证文献】
中国期刊全文数据库 前1条
1 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
中国博士学位论文全文数据库 前1条
1 郑文良;基于简单本体的农业P2P搜索引擎关键技术研究[D];沈阳农业大学;2013年
中国硕士学位论文全文数据库 前4条
1 丁邦旭;基于P2P的分布式中文搜索引擎的应用研究[D];南昌大学;2006年
2 徐耀;基于Agent的智能化搜索引擎系统[D];北京化工大学;2006年
3 王娟娟;企业内部网络资源搜索解决方案的研究和设计[D];对外经济贸易大学;2007年
4 张园园;基于用户兴趣的个性化搜索引擎的分析与研究[D];燕山大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 彭玉容;杨捧;高媛;;农业搜索引擎的发展现状及关键技术研究[J];安徽农业科学;2010年20期
2 张晓波,王蕾,韩永国;基于智能Agent的个性化信息检索系统[J];安阳师范学院学报;2004年02期
3 袁伟,丛荣华;网络资源建设的思考[J];长春师范学院学报;2003年02期
4 赵洋;滕桂法;张玉新;何冬梅;;基于Internet的农业信息垂直搜索引擎的设计[J];河北农业大学学报;2009年06期
5 侯孟书,卢显良,周旭,詹川;非结构化P2P系统的路由算法[J];电子科技大学学报;2005年01期
6 程立考;李绍静;;对等网络的研究与应用[J];电脑与信息技术;2006年04期
7 沈洁,胡金初;P2P网络中的信息搜索技术[J];福建电脑;2005年06期
8 彭绪富,邹友宽,邓荣华;INTERNET搜索引擎探解[J];高等函授学报(自然科学版);2001年01期
9 原庆能,唐培和;一种基于XML的索引查询方法[J];广西工学院学报;2004年01期
10 苗海;张仰森;岳明;;基于聚类算法的垂直搜索引擎技术研究[J];北京信息科技大学学报(自然科学版);2013年01期
中国博士学位论文全文数据库 前7条
1 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
2 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
3 杨舰;对等网络有效搜索机制研究[D];复旦大学;2004年
4 李庆虎;基于P2P架构的网格文件系统研究[D];清华大学;2004年
5 段迅;对等网络路由算法研究[D];贵州大学;2007年
6 王向辉;P2P网络拓扑结构研究[D];哈尔滨工程大学;2008年
7 马冠骏;基于网络编码的P2P文件分发的研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 王芳芳;基于Agent的网络信息检索[D];沈阳工业大学;2011年
2 王自洋;基于多策略的Chord算法研究[D];中北大学;2011年
3 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年
4 乔冬梅;搜索引擎现状与发展研究[D];郑州大学;2002年
5 赵志荣;个性化搜索引擎的研究、设计与实现[D];四川大学;2002年
6 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
7 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年
8 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
9 孙登峰;XML文档信息检索技术研究与实现[D];中国人民解放军国防科学技术大学;2002年
10 陈先;智能搜索引擎关键技术研究与实现[D];哈尔滨工程大学;2003年
【二级引证文献】
中国期刊全文数据库 前5条
1 刘春英;吴德华;宋烨;;一种基于统计的数字电视信息过滤算法[J];电视技术;2010年07期
2 岳盼盼;王小正;王伊玲;;教育资源语义搜索引擎的研究与设计[J];福建电脑;2014年03期
3 李首洪;;基于P2P搜索技术的研究[J];邵阳学院学报(自然科学版);2007年03期
4 刘东飞;白瑾;;基于群用户兴趣模型的搜索结果排序研究[J];武汉理工大学学报(信息与管理工程版);2011年06期
5 李军;李松斌;王玲芳;倪宏;王劲林;;一个基于P2P技术的分布式视频检索系统[J];微计算机应用;2010年08期
中国硕士学位论文全文数据库 前10条
1 郭世胜;基于Agent的搜索引擎的研究与实现[D];大连海事大学;2010年
2 焦英楠;高性能视频检索平台中网络性能优化设计与实现[D];北京邮电大学;2011年
3 田姗;基于web模式的教学管理系统的设计与开发[D];山东大学;2011年
4 吕上;P2P网络中考虑交易时间间隔的信任管理模型[D];北京邮电大学;2012年
5 冯华威;基于Witness的集装箱码头物流系统Agent建模方法研究[D];武汉理工大学;2007年
6 杨静;基于用户兴趣的P2P搜索机制研究[D];西安电子科技大学;2010年
7 张璇;基于用户兴趣的个性化搜索引擎技术研究[D];湖南大学;2010年
8 王钦为;面向用户的个性化搜索引擎算法研究与系统设计[D];华南理工大学;2012年
9 肖瑜;基于用户兴趣模型的个性化搜索算法研究[D];太原科技大学;2013年
10 王美霞;面向主题的元搜索引擎技术研究与系统实现[D];天津理工大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 林珊,宁国宁,赵之霖;中文分词在邮件过滤系统中的应用[J];华南理工大学学报(自然科学版);2004年S1期
2 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
3 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
4 王坚,赵恒永;专业搜索引擎的实现与研究——中文分词算法[J];电子科学技术评论;2005年03期
5 许敏;周伟灿;;CAD电子图管理系统中全文检索的研究[J];微计算机信息;2006年19期
6 山岚;赵英;徐耀;王坚;张莹莹;;专业搜索引擎系统的设计与实现[J];微计算机信息;2007年06期
7 祁文青;;一种改进的中文分词算法[J];黄石理工学院学报;2007年04期
8 佟晓筠;宋国龙;刘强;张俐;姜伟;;中文分词及词性标注一体化模型研究[J];计算机科学;2007年09期
9 熊桂喜;李政;;基于规则和语料库的中文姓名识别研究[J];计算机与信息技术;2007年12期
10 徐飞;孙劲光;;基于一种粗切分的最短路径中文分词研究[J];计算机与信息技术;2007年11期
中国重要会议论文全文数据库 前10条
1 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 彭辉;翟翔;;AutoCAD 2008自动翻译软件研发[A];全国冶金自动化信息网2010年年会论文集[C];2010年
6 赵海;揭春雨;;基于子串标注的中文分词:寻找更佳的标注单元[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 马永亮;赵铁军;;统计机器翻译中多分词结果的融合[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 黄居仁;;瓶颈,挑战,与转机:中文分词研究的新思维[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 李寿山;黄居仁;;基于词边界分类的中文分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 姜文斌;王志洋;刘群;吕雅娟;;基于马尔可夫间隔标注的中文分词算法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前10条
1 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
2 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
3 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
4 贺俊;汇聚亿万草根智慧 奇虎发布经验搜索[N];证券日报;2006年
5 记者 杨朝晖;医药搜索:不再“众里寻他千百度”[N];科技日报;2007年
6 记者 吴苡婷;用技术挖出网络信息中“金子”[N];上海科技报;2009年
7 丁鸿;百度掀起财富浪潮 中国互联网不再“青涩”[N];中国工业报;2005年
8 王翌;互联网2005:个性化生存[N];计算机世界;2005年
9 王宾;加速争夺中国搜索市场[N];北京商报;2006年
10 高雪娟;企业搜索要为决策服务[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 修驰;适应于不同领域的中文分词方法研究与实现[D];北京工业大学;2013年
2 何嘉;基于遗传算法优化的中文分词研究[D];电子科技大学;2012年
3 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
5 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
6 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
7 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
8 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
9 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
10 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
2 刘琨;搜索引擎的研究与实现[D];西安电子科技大学;2004年
3 翟凤文;统计与字典相结合的中文分词[D];吉林大学;2005年
4 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
5 马莉;基于SVM的垃圾邮件过滤的研究[D];山东大学;2005年
6 朱军;中文垃圾邮件过滤技术研究及应用[D];合肥工业大学;2005年
7 张晓淼;基于神经网络的中文分词算法的研究[D];大连理工大学;2006年
8 谢骋超;基于语义的数据库全文检索系统[D];浙江大学;2006年
9 杨彦;基于Hash结构的机械统计分词系统[D];中南大学;2005年
10 王新梅;基于内容挖掘的垃圾邮件过滤技术[D];武汉理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026