收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

网站搜索引擎的设计与实现

马蓉平  
【摘要】:随着互联网的日益发展与普及,互联网中的信息量也在迅猛的增加,这使得大家想快速查询所需内容成为一种奢望。为了解决这一问题,搜索引擎技术出现了,并越来越成为人们关注的焦点。 互联网中的搜索引擎主要有三种基本类型:全文搜索引擎、目录索引类搜索引擎、元搜索引擎。前两类搜索引擎的功能是相互借鉴和互为补充的,两者之间的界限也渐趋模糊,而元搜索引擎没有自己的数据,是将用户的查询请求同时向多个搜索引擎递交,把返回的结果进行重新排序和重复删除后反馈给用户。 本文分析了中文分词、文本预处理和压缩、搜索引擎的原理、工作流程、查询处理流程等技术。同时以目录搜索为目标,使用PHP+MySQL数据库实现目录搜索。在设计过程中,以人工方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类中,再对重要内容建立索引。在进行搜索的同时自动连接数据源之后,首先对用户输入的索引词进行格式处理,删除出现在关键字前后的空格,而且把无效字改成空格,接下来把它与数据库内容进行近似匹配,并使用递归方法把所有相关内容作为结果进行输出。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴伟民;可并行递归算法的递归多线程实现[J];现代计算机;1998年09期
2 何大中;递归程序变换的实现方法[J];微电子学与计算机;1994年02期
3 刘琚,彭丽芳,于夫章;用递归预测误差(RPE)算法估计谐波信号的基频[J];山东电子;1995年04期
4 杨选民;用C语言实现目录的递归复制[J];现代电子技术;1997年04期
5 张永梅,马礼;程序设计中的递归算法教学探讨[J];华北工学院学报(社科版);2001年03期
6 薛联凤;李为相;;消除文法左递归的算法探讨[J];信息技术与信息化;2007年01期
7 郑君曜;递归层析法——超大规模网络问题的CAA[J];自然杂志;1985年05期
8 陈觉婷,陈文英;堆栈在递归调用中的应用[J];鹭江职业大学学报;1996年04期
9 肖琳;从汉诺塔问题再谈递归算法[J];电脑知识与技术;2003年32期
10 夏淑梅;《数据结构》学习指导[J];内蒙古电大学刊;2004年03期
11 李丽姝;;利用遍历序列还原二叉树算法的研究与实现[J];电大理工;2010年01期
12 马维祯,殷瑞祥;DFT(2~m)通用递归分解算法[J];电子学报;1988年02期
13 赵平亚,张先萌;二维非因果滤波器系数的一种空间递归自适应快速算法[J];电子学报;1991年05期
14 方易圆,林争辉;基于递归卷积的有耗互连线瞬态模拟[J];上海交通大学学报;1997年01期
15 陈巍,吴捷;递归神经网络的卡尔曼滤波及分层学习算法[J];华南理工大学学报(自然科学版);1998年04期
16 陈佳,苗英恺;程序设计课程中的递归算法分析[J];安阳师范学院学报;2002年02期
17 梁志强,谢菁;用递归算法实现BOM展开的树型结构操作[J];机械;2004年03期
18 陶文兵,刘李漫,田金文,柳健;采用递归门限分析的红外目标分割[J];光电工程;2004年10期
19 田社平,姜萍萍,颜国正;应用递推神经网络的传感器动态建模研究[J];仪器仪表学报;2004年05期
20 胡可,张大力;一类广义隐马尔科夫模型的建模与参数估计(英文)[J];中国科学院研究生院学报;2005年02期
中国重要会议论文全文数据库 前10条
1 周傲英;施伯乐;;逻辑数据库的递归有界性[A];第十届全国数据库学术会议论文集[C];1992年
2 郑文;崔耀东;周密;;一种基于递归技术的一维下料算法[A];广西计算机学会2010年学术年会论文集[C];2010年
3 沈清波;;基于遗传算法的递归神经网络非线性自适应控制器[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
4 赵振磊;耿则勋;王兰;闫兆婵;;基于自适应递归LPA-ICI的图像去噪算法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
5 陈鹤松;张建军;张利;张维勇;;PDM中图形化产品结构树的实现[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
6 李军辉;朱巧明;李培峰;;一个基于最大熵模型的文本分类方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 韩敏;王晨;席剑辉;;基于改进RBF神经网络的非线性时间序列预测[A];中国仪器仪表学会第五届青年学术会议论文集[C];2003年
8 王晓晖;张喜乐;梁贵书;崔翔;;基于网络函数的VFTO下变压器绕组过电压的计算[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
9 周飞;王晨升;;基于Canny算法的一种边缘提取改进算法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
10 沈艳;谢美萍;;基于递归神经网络的船舶运动极短期建模预报[A];第二届全国信息获取与处理学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 沈宇键;变参数图像回归处理方法的研究[D];中国科学院长春光学精密机械与物理研究所;2000年
2 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
3 莫玮;神经网络在自适应均衡中的应用研究[D];西安电子科技大学;2000年
4 范孟华;基于域、分岔以及递归投影方法的电力系统稳定性分析[D];天津大学;2010年
5 文敦伟;面向多智能体和神经网络的智能控制研究[D];中南大学;2001年
6 水鹏朗;广义内插小波和递归内插小波理论及应用的研究[D];西安电子科技大学;1998年
7 徐治非;视频监控中运动目标检测与跟踪方法研究[D];上海交通大学;2009年
8 王豪;纳米尺度MOS器件的量子模拟方法研究[D];武汉大学;2009年
9 郑建忠;无线通信中空时自适应接收机的研究[D];西安电子科技大学;2003年
10 杨亚敏;分形的测度、维数,Lipschitz等价性和开集条件[D];清华大学;2009年
中国硕士学位论文全文数据库 前10条
1 马蓉平;网站搜索引擎的设计与实现[D];沈阳工业大学;2006年
2 秦爱丽;递归神经网络在非线性时延中和过程控制中的应用[D];浙江大学;2002年
3 朱祎莉;基于递归效用函数的投资组合选择和最优消费及其应用[D];华东师范大学;2004年
4 霍纬纲;一种对魔集转换的分解优化算法[D];山西大学;2004年
5 邱四海;数字化交流电机智能控制系统的研究[D];湖南大学;2003年
6 叶娜;面向信息抽取的文本预处理和规则自动学习技术研究[D];东北大学;2005年
7 李永明;NA随机变量递归密度核估计的渐近性质[D];广西师范大学;2002年
8 何金凤;基于中文信息检索的文本预处理研究[D];电子科技大学;2008年
9 杨庆红;递归问题循环不变式开发新策略的研究与应用[D];江西师范大学;2003年
10 房道伟;基于“背包问题”的公钥加密算法的研究[D];南京理工大学;2004年
中国重要报纸全文数据库 前10条
1 武汉 邓蔚;求24点,学递归[N];电脑报;2002年
2 PALADIN;化整为零,变繁为简[N];电脑报;2003年
3 曾庆瑞;絮语闲话铸心史[N];文艺报;2003年
4 PALADIN;算法演义[N];电脑报;2003年
5 湖南 杨立强;解答“八皇后问题”[N];电脑报;2004年
6 四川 周鸣扬;奇妙的分形世界[N];电脑报;2001年
7 李浩;量变到质变[N];中国证券报;2008年
8 山东 赵玉勇;用循环和递归解决小猴吃枣问题[N];电脑报;2001年
9 千石;开放的DNS服务器令人担心[N];网络世界;2006年
10 力子;投递归班的检查内容[N];中国邮政报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978