收藏本站
《吉林大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

面向用户体验需求的垂直搜索引擎的研究

杜佳伦  
【摘要】:互联网迅速发展,信息量也越来越大。如何更方便的获取信息成为研究的重点。起初的方法是以雅虎为主,通过人工收录。这种方法是由人把互联网的信息做整理,然后再根据事先分好的类,加一个网站放到已有的分类中。用户在搜索一个关键词的时候,可以根据分类的树状结构进行查询。这个方法由于完全是人工做的,所以准确率很高。但是人工维护成本太高,人们对于知识的需求形势也多种多样,互联网的增长速度也很快,这种方法远远不能满足需求。 随后便产生了搜索引擎。搜索引擎的体验为通过关键词得到想要的网页。搜索引擎的数据来源为整个互联网。它通过网络爬虫程序,将互联网上所有的数据根据链接关系,逐步爬取过来。爬取后,将网页信息提取出来,并根据关键字做倒排,建立倒排索引。然后利用迭代方法,计算网页的权重,做排序。然后提供一个检索的用户交互平台,并通过界面让用户使用关键词进行检索。搜索引擎从最开始的全文搜索理论起源。 垂直搜索引擎是网页搜索引擎的进一步延伸,它面向的是具体的某种对象,比如地图,语音,图片,视频等。对于某种对象,在相应的垂直搜索引擎上搜索要比在网页搜索引擎上搜索效果更好。垂直搜索引擎的出现,在某种程度上满足了某种用户的需求。但是,使用垂直搜索引擎的前提是用户必须对于搜索的对象的属性充分的了解。比如,搜索电脑的时候必须搜索具体的参数,硬盘,内存,CPU等。这对于那些不了解对象属性的用户来说就无从下手了。 本文以笔记本电脑为搜索对象,实现了一个可以在完全不了解对象属性的前提下,只通过搜索体验需求来得到想要的结果的垂直搜索引擎。 既然是搜索体验需求,所以,就要考虑用户如何给出他自身对于一个对象的体验需求。本文是让用户通过自然语言来描述自己的需求,同时用数字给出对于价格的需求。比如:速度快,便携等。这种搜索方式与以往必须搜索电脑的具体参数,如内存,硬盘等完全不同,也是本文的创新点。 这种搜索引擎的实现方法就是先将用户的体验需求进行分类,在这个分类中并不直接包括对象的属性信息。由于任何一个对象的信息无非就是和它相关的各个属性信息,所以,任何一个体验需求的分类也一定与具体对象的某些属性相关联。相关联的属性在计算权值的时候需要重点考虑。 基于这种体验效果,本文首先通过一个传统的笔记本电脑搜索网站,将所有有报价的笔记本电脑配置信息网页和图片都取了下来。然后,从网页中将参数的具体配置信息取出来,并进行了清洗。对于主要的参数重点考虑,进行补全。因为在重点考虑的参数不能缺失,否则无法计算权值。补全后,还要给出一个属性不同参数的排序关系。因为对于一个参数,只有知道如何比较好坏,才能知道向用户推荐哪些。而不同的参数比较方法差别很大,有些直接根据数值就能比较,有些要通过经验去判断。比如,内存的好坏既要看大小,又要看类型。硬盘容量的比较是越大越好,而笔记本的重量,是越小越好。在知道每个属性参数如何进行比较后,还要知道每个属性参数对电脑具体体验需求的影响。因为不同参数对于同一个指标影响不同。比如,处理器对笔记本运行速度的影响要大于内存对于笔记本速度的影响。这些基础处理完成后,就要做人机交互的部分了。 这个过程,首先根据不同的体验效果和用途进行了分类。然后,确定每个分类和对象的哪些属性相关。当用户的需求和具体的一个分类相关时,就提高相应属性在计算权值的过程中所产生的影响。本文实现的分类器用得文本表示模型为向量空间模型,算法采用的是Rocchio算法,相似性计算用的是余弦相似度计算。同时,用户还有价格的需求。所以在向用户返回结果的过程中,首先筛选出价格在用户给出的价格上下500元内的电脑,然后从中根据每个属性的不同参数值和属性的权重计算每款型号的最终权值。最后,根据最终权值对每款型号进行排序。 通过上述方法,用户不再需要对电脑的各个属性了解的很透,只给出体验需求也可以选购电脑。与传统必须通过对象属性参数来搜索,有了很大进步。这标志着,垂直搜索在查询的时候可以完全不依赖对象的属性信息了。这种思想可以在各种垂直搜索上使用,将会给垂直搜索带来很大的改善。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.3

【相似文献】
中国期刊全文数据库 前10条
1 ;笔记本电脑流行趋势谈——关于笔记本电脑的模块化和全内置[J];每周电脑报;1998年33期
2 ;笔记本电脑降价的困惑[J];电脑采购周刊;1998年15期
3 ;回顾1998 展望1999(下)[J];每周电脑报;1999年06期
4 ;杂论笔记本电脑(连载之五)[J];每周电脑报;1999年11期
5 ;昭阳质升价降[J];每周电脑报;1999年23期
6 ;XE2也认字——惠普首台手写识别笔记本电脑诞生[J];每周电脑报;1999年30期
7 ;为笔记本电脑供电[J];每周电脑报;1999年31期
8 ;笔记本接口杂谈[J];每周电脑报;1999年Z1期
9 晓萌;;联想东芝TECRA8000Y笔记本电脑[J];电脑采购周刊;1999年49期
10 ;轻、薄、短、小,超薄笔记本电脑让你朝“数字人”跨一步[J];电子测试;1999年12期
中国重要会议论文全文数据库 前10条
1 梁平;;笔记本电脑无线上网行为与宽带无线通信网络初期部署[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
2 ;笔记本电脑用涂料解析[A];第四届中国重庆涂料涂装学术大会论文集[C];2010年
3 郭朝阳;王杜杰;李丽琴;;第四十四章 手段—目的链理论在品牌建设中的应用——以大学生笔记本电脑市场为例[A];国际金融危机与中国企业发展:中国企业管理研究会年度报告(2009~2010)[C];2009年
4 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 杜晓琳;石丹;高攸纲;陈霖;;笔记本材料对上网卡OTA性能影响的分析[A];电波科学学报[C];2011年
6 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 金海军;;笔记本电脑的运输包装设计[A];2007年学术年会论文集[C];2007年
8 佘沛亮;陈怀林;胡信国;;一种新型能源——直接醇类燃料电池[A];江苏省能源研究会成立二十周年纪念暨第十届学术年会热电专委会第十二届年会暨学术报告会论文集[C];2004年
9 李丹;;笔记本电脑中指纹锁的设计与实现[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
10 熊晓东;王绿水;胡澍;单平;王中林;李智林;;笔记本相关检漏仪[A];1996年中国地球物理学会第十二届学术年会论文集[C];1996年
中国重要报纸全文数据库 前10条
1 江苏 王志军;笔记本电脑优化技巧谈[N];电脑报;2001年
2 本报记者 周国洪;笔记本电脑难演价格战[N];经济参考报;2000年
3 刘洪宇;笔记本电脑:低价、细节、融合[N];中国计算机报;2005年
4 ;紫光逐鹿中高端笔记本电脑[N];计算机世界;2004年
5 沈建苗编译;如何保护你的笔记本电脑?[N];计算机世界;2005年
6 本报记者 任建民;笔记本电脑可望消除“坏点”[N];人民日报;2003年
7 茉茉;揭开笔记本电脑的神秘面纱[N];中国电脑教育报;2006年
8 本报记者 朱梁;聆听“双核”脚步声[N];中国电脑教育报;2006年
9 本刊特约作者 径山茶;该出手了吗?[N];中国电脑教育报;2006年
10 上海 钱可栋;炫龙出击 迟来的AMD移动双核梦[N];中国电脑教育报;2006年
中国博士学位论文全文数据库 前6条
1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年
2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年
4 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
5 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
6 于学华;汽车平顺性技术理论与实践研究[D];东北林业大学;2002年
中国硕士学位论文全文数据库 前10条
1 杜佳伦;面向用户体验需求的垂直搜索引擎的研究[D];吉林大学;2011年
2 金婵鸣;垂直搜索引擎系统的研究[D];武汉理工大学;2010年
3 金川明;垂直搜索引擎研究与实现[D];云南大学;2011年
4 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年
5 齐鹏;垂直搜索引擎分类索引系统的设计与实现[D];大连海事大学;2010年
6 高长醒;笔记本电脑设计中的人性化因素[D];吉林大学;2010年
7 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年
8 李海涛;方正科技笔记本电脑营销策略研究[D];兰州大学;2010年
9 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年
10 周佳庆;实时垂直搜索引擎数据抓取调度研究[D];浙江大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026