收藏本站
《大连理工大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

桌面搜索引擎的设计与实现

孟美华  
【摘要】: 随着互联网的普及,搜索引擎得到了快速的发展,对人们的生活产生了巨大的影响。现在随着个人电脑中硬盘容量的越来越大,硬盘里所包含的文件的数量也越来越多,于是如何在海量文件中快速准确的找到自己需要的文件,成为PC用户的一个重要需求,因此桌面搜索引擎的设计与开发变得极其重要。基于此,本文设计与实现了一款桌面搜索引擎,具体如下: 首先设计了桌面搜索引擎的整体框架,将整个桌面搜索引擎分为四个模块:文件解析模块,中文分词模块,查询模块和用户界面模块。 其次设计了文件解析模块,用来实现文件格式的转化。该模块针对多种文件格式进行解析,可解析的文件格式除了常用的office文件,文本文件,.cpp文件,.h文件,还包括PDF文件,CHM文件,HLP文件,XML文件,INF文件,CSV文件等,并且对于PDF文件本文改进了其解析算法,对其加入了解密处理。通过本模块的设计可以满足公司对多种文件格式进行查询的需求。 再次设计了中文分词模块。该模块主要是对解析后的文件加入中文分词处理,采用的是基于层叠隐马尔可夫模型的汉语词法分析系统,通过本模块的设计桌面搜索引擎提高了其查询的准确性和查询的速度。 然后设计了查询模块和用户界面模块。查询算法为KMP算法,其搜索速度快,搜索结果准确。用户界面模块为用户提供了多个结果输出界面,可以使用户从多角度查看搜索结果,通过本模块的设计桌面搜索引擎提高了其方便性和实用性。 最后通过实例验证了本文所设计的桌面搜索引擎的优良性能,通过实例可以看出本文所设计的桌面搜索引擎是绿色版的,具有体积小,搜索速度快,搜索结果准确等特点,用户可以通过本桌面搜索引擎实现对多个关键字进行搜索,并可以在结果显示对话框中查看搜索结果。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.3

【引证文献】
中国期刊全文数据库 前3条
1 吴鹏飞;;基于Swing和Lucene的桌面搜索引擎系统设计与实现[J];电脑编程技巧与维护;2012年01期
2 李晓鑫;;桌面搜索引擎设计[J];电脑知识与技术;2011年20期
3 贾默;陈梅;;集成桌面搜索引擎的内容检测系统设计[J];计算机工程与设计;2013年02期
中国硕士学位论文全文数据库 前2条
1 张剑明;可扩展桌面搜索系统的设计与实现[D];西南交通大学;2012年
2 刘丽荣;格式化文件内容提取与过滤关键技术研究[D];哈尔滨工程大学;2012年
【参考文献】
中国期刊全文数据库 前9条
1 陈玮;;MD5加密原理及安全性分析[J];电脑知识与技术(学术交流);2007年19期
2 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
3 李珍,田学东;PDF文件信息的抽取与分析[J];计算机应用;2003年12期
4 文刚;在VFP应用程序中使用CHM格式帮助文件[J];内江科技;2004年02期
5 张秀秀;张立峰;;PDF文件文本内容提取研究[J];科技情报开发与经济;2008年36期
6 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
7 耿嘉,曹秀英;无线局域网中基于RC4的加密算法的分析与改进[J];通信技术;2002年09期
8 李伟超;;桌面搜索引擎评析[J];现代情报;2007年12期
9 宋艳娟,张文德;基于XML的PDF文档信息抽取系统的研究[J];现代图书情报技术;2005年09期
中国重要会议论文全文数据库 前1条
1 谷勇浩;刘勇;;基于Google桌面搜索引擎的攻击和防御[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国硕士学位论文全文数据库 前3条
1 宋艳娟;基于XML的HTML和PDF信息抽取技术的研究[D];福州大学;2006年
2 潘亭沥;基于Lucene的面向商业应用的搜索引擎研究与实现[D];电子科技大学;2007年
3 高蒙;基于PDF的电子文档保护系统的设计与实现[D];上海交通大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期
2 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
3 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
4 傅鹂;孙坚;付春雷;;基于语义的音乐检索系统[J];重庆理工大学学报(自然科学版);2011年01期
5 武二伟;;搜索引擎技术及其使用方法探析[J];河南城建学院学报;2009年03期
6 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期
7 曲维光;唐旭日;俞敬松;;超大规模语料库精加工技术研究[J];当代语言学;2009年02期
8 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
9 孙晓;黄德根;;基于最长次长匹配分词的一体化中文词法分析[J];大连理工大学学报;2010年06期
10 张双斌;;MD5优化算法及安全性分析[J];电脑编程技巧与维护;2009年22期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 余骁捷;邵阳;吴及;王侠;;基于SVM和MMR融和的自动文摘方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
4 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
5 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
6 邓攀;刘功申;;基于标引信息的网络新概念发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
7 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
8 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 林小俊;田浩;王馨浩;杜蕴璇;许敏;吴玺宏;迟惠生;;语言模型训练语料处理方法及解码词典的设计[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 何中军;刘群;林守勋;;统计机器翻译中短语切分的新方法[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 刘运通;产品设计过程知识配送服务关键技术研究[D];浙江大学;2011年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
4 崔金栋;基于本体的网格信息检索模型研究[D];吉林大学;2011年
5 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
6 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
7 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
8 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
9 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
10 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
3 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
4 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
5 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年
6 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
7 赫兰冰;基于光学传感的风表自动检定与数据采集系统开发[D];哈尔滨理工大学;2010年
8 常富国;高技术虚拟企业谈判支持问题处理系统研究[D];哈尔滨理工大学;2010年
9 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
10 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 李晓鑫;;桌面搜索引擎设计[J];电脑知识与技术;2011年20期
2 张斐;;浅议基于COM的组件化程序设计方法[J];硅谷;2011年02期
3 张树壮;罗浩;方滨兴;;大规模复杂规则匹配技术研究[J];高技术通讯;2010年12期
4 高炜;张超;梁立;;信息检索排序算法研究综述[J];信息技术;2009年06期
5 郭立力;赵春江;;高效FTP搜索引擎的设计与实现[J];华南理工大学学报(自然科学版);2009年01期
6 张卫丰,徐宝文;Web搜索引擎框架研究[J];计算机研究与发展;2000年03期
7 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
8 李小龙,毛文林;管道-过滤器模式的软件体系结构及其设计[J];计算机工程与应用;2003年35期
9 李珍,田学东;PDF文件信息的抽取与分析[J];计算机应用;2003年12期
10 王华,马亮,顾明;线程池技术研究与应用[J];计算机应用研究;2005年11期
中国硕士学位论文全文数据库 前4条
1 丛磊;桌面搜索引擎的研究与实现[D];北京化工大学;2006年
2 摆卿卿;PDF文件处理系统[D];北京交通大学;2009年
3 谢海潮;手机桌面搜索引擎的研究与实现[D];大连理工大学;2009年
4 谭磊;一种个性化移动搜索技术的研究[D];湖南大学;2010年
【二级引证文献】
中国期刊全文数据库 前1条
1 贾默;陈梅;;集成桌面搜索引擎的内容检测系统设计[J];计算机工程与设计;2013年02期
中国硕士学位论文全文数据库 前1条
1 蔡伟庆;高职土建类实训软件的设计与开发[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 赵继海;DRM技术的发展及其对数字图书馆的影响[J];大学图书馆学报;2002年01期
2 丁璇,侯汉清,章成志;中文网页标引源主题表达能力的调查统计[J];大学图书馆学报;2002年06期
3 张砚,闪永强;关于PDF与跨平台发行文件的解决方案[J];测绘学院学报;2003年01期
4 宋擒豹,沈钧毅;数字商品非法复制和扩散的监测机制[J];计算机研究与发展;2001年01期
5 庄超,白硕,李国杰;网络内容安全分发与版权保护技术[J];计算机工程;2000年06期
6 何俊杰,李广锡;采用MD5加密算法保护用户口令[J];计算机工程;2000年S1期
7 叶锡君,许勇,吴国新;基于角色的访问控制在Web中的实现技术[J];计算机工程;2002年01期
8 王庆一,王继成,周源远,袁春风;多信息块Web页面中的抽取规则[J];计算机工程;2003年09期
9 吕远大;刘文清;周雁舟;;数字版权管理系统中的角色访问控制模型[J];计算机工程;2006年11期
10 严悍,张宏,许满武;基于角色访问控制对象建模及实现[J];计算机学报;2000年10期
中国重要会议论文全文数据库 前1条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前1条
1 任龙响;基于角色的访问控制基本模型的实现[D];华中科技大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 李伟超;;桌面搜索引擎评析[J];现代情报;2007年12期
2 王炯;;移动搜索:你究竟有多美[J];互联网天地;2007年02期
3 是非;事关9·11机密文件解密布什陷于尴尬境地[J];北京档案;2004年06期
4 黄昆;;桌面搜索:海水和火焰共生[J];中国计算机用户;2006年34期
5 郑瑾,王斌,陈松乔;Java类文件解析Agent的设计原理与实现[J];计算机工程与应用;2002年18期
6 吴科桦,施荣华,朱宁;一种基于USBKEY的文件加解密方案[J];现代计算机;2005年08期
7 ;亟待突破瓶颈——文档管理和桌面搜索期望更加适用和高效[J];微电脑世界;2006年03期
8 梁京章;李幼红;潘莹;叶云;;P2P资料搜索引擎的研究和设计[J];广西大学学报(自然科学版);2006年04期
9 吴清;吴顺祥;;index.dat文件结构解析[J];现代计算机(专业版);2008年12期
10 李晓鑫;;桌面搜索引擎设计[J];电脑知识与技术;2011年20期
中国重要会议论文全文数据库 前6条
1 申兵一;巩青歌;;基于Lucene桌面搜索引擎系统的设计和实现[A];江苏省电子学会2010年学术年会论文集[C];2010年
2 余祖锋;蔡启先;刘明;;远程电力抄表系统中XML解析模块的设计[A];广西计算机学会2009年年会论文集[C];2009年
3 张舒;张琳;;基于Symbian OS的P2P研究与实现[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
4 吴蕾;高玉春;魏良秀;卢亮;吴涛;;风廓线雷达试验网数据处理及显示平台[A];第26届中国气象学会年会第三届气象综合探测技术研讨会分会场论文集[C];2009年
5 姜峰;;WAP局数据自动化系统的研制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
6 程志;;微博地震谣言监测系统[A];中国地震学会第14次学术大会专题[C];2012年
中国重要报纸全文数据库 前10条
1 刘健;二战文件解密:盟军特工被自己人送上黄泉路[N];中国国防报;2004年
2 ;市场再起狼烟[N];电脑报;2005年
3 张伟;水门事件文件解密,“深喉”还是谜[N];新华每日电讯;2005年
4 郑依华;搜索引擎也开源[N];计算机世界;2006年
5 ;知名搜索引擎全攻略[N];计算机世界;2006年
6 孙闻;陈沛:超越百度不是没有可能[N];财经时报;2006年
7 ;桌面搜索冲击SSL VPN?[N];计算机世界;2005年
8 ;Google与微软开始正面交锋[N];网络世界;2007年
9 深圳商报记者 李玫 实习生 李婷婷;在桌面输入产品名可直达该网站[N];深圳商报;2006年
10 王佴;健力宝文件解密张海名下股权之争升级[N];第一财经日报;2006年
中国博士学位论文全文数据库 前1条
1 扈庆;分析仪器数据格式及质谱检索系统的研究与应用[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 孟美华;桌面搜索引擎的设计与实现[D];大连理工大学;2009年
2 许志敏;基于Android的桌面搜索引擎的研究与实现[D];哈尔滨工业大学;2010年
3 张晶;MIDI文件解析及生成软件设计与实现[D];电子科技大学;2011年
4 李东庆;MXF文件解析系统的研究与实现[D];吉林大学;2010年
5 郑勤华;基于文件解析的文件感染方法研究[D];华中科技大学;2011年
6 卢艳梅;基于USBKey认证的安全网络硬盘系统的设计与实现[D];华南理工大学;2011年
7 王涛;安全电子文件认证中心系统的设计与实现[D];电子科技大学;2012年
8 高奔;基于文件过滤驱动的矢量地图加解密研究[D];哈尔滨工程大学;2012年
9 谢海潮;手机桌面搜索引擎的研究与实现[D];大连理工大学;2009年
10 周秀丹;Bango:一种基于锁和钥匙的版权保护服务系统[D];浙江大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026