收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web的资源搜索引擎

张健  
【摘要】: 随着计算机、多媒体和现代通讯技术的飞速发展,以印刷型文献为主的学校图书馆开始向以电子信息和虚拟信息为主的数字图书馆转化。数字图书馆是一种新兴的大型分布式的信息系统,里面含有海量的信息资源。如何找到自己想要的信息资源,就是资源搜索引擎的功能。 网络信息检索作为一种新型检索模式,主要特异性在于网络环境引起的信息资源分布化和数字技术带来的信息资源多媒体化,从而引起了信息检索过程各个要素的量变和质变。一直以来网络信息检索的检索性能的提高备受情报学、计算机、人工智能等方面的关注。用户是信息检索系统的出发点和归宿,因而用户需求的全面、准确的把握是提高检索质量的一个关键因素。本文探讨了数据挖掘在获取用户需求方面的应用,提出了一个基于Web文本集的资源搜索引擎模型。该模型通过对与用户兴趣相关的Web文本集的分析来挖掘用户未表达出来的、潜在信息需求,并通过与用户的交互修正挖掘结果,跟踪用户的兴趣变化。 本文在研究和分析元数据模型涉及到的关键技术,即特征提取、自动分词、机器学习和自动分类技术之后,在此基础上提出了模型的整体设计。重点介绍了实现的几项技术:pccs部分聚类分类技术、用户兴趣表示技术。 最后,文章通过对比了pccs算法和其他算法之间的性能比较,并提出了进一步完善的方面。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王娜;;网络信息挖掘探析[J];高校图书馆工作;2007年03期
2 吕志花;;网络信息挖掘及其在搜索引擎方面的应用[J];微计算机信息;2008年06期
3 刘奕群;张敏;马少平;;基于非内容信息的网络关键资源有效定位[J];智能系统学报;2007年01期
4 兰鄂;基本WEB技术采集INTERNET中的有用数据[J];商场现代化;2005年01期
5 陈福集,杨善林;一种基于KDD的Web搜索引擎框架[J];情报学报;2002年03期
6 刘星毅;农国才;;几种不同缺失值填充方法的比较[J];南宁师范高等专科学校学报;2007年03期
7 纪祥;刘华虓;吴芬芬;刘磊;;基于特征和HMM的信息提取[J];吉林大学学报(信息科学版);2009年04期
8 毛振鹏,胡滨,代海岩;搜索引擎质量评价体系研究[J];晋图学刊;2005年05期
9 蔡代纯;;网络信息检索中的搜索引擎使用技巧[J];湖南城市学院学报;2006年04期
10 李铃;搜索引擎发展方向[J];科技情报开发与经济;2005年21期
11 张婕;袁力田;;搜索引擎在网络信息挖掘中的应用[J];电脑与电信;2006年07期
12 隋丽萍;徐承韬;李瑞芳;;基于HTML结构的Web文本主题挖掘研究[J];电脑与电信;2007年01期
13 隋丽萍;徐承韬;李瑞芳;;基于HTML结构的Web文本主题挖掘研究[J];西安外事学院学报;2007年01期
14 贾纳豫;试论数据挖掘与机器学习、统计学、数据库的关系[J];玉溪师范高等专科学校学报;2000年04期
15 凌志泉;搜索引擎中的网络数据挖掘技术[J];计算机工程与设计;2003年09期
16 徐以斌;;试析搜索引擎技术在网络信息挖掘中的应用[J];农业图书情报学刊;2007年04期
17 谷利芬,于亚征;Web采集技术的分析[J];焦作大学学报;2005年03期
18 王文珍;唐红文;;公共信息查询平台的设计[J];电脑与信息技术;2006年05期
19 张健;周聘麟;杨艳;;网络信息检索工具的现状与发展趋势[J];西昌学院学报(自然科学版);2006年04期
20 莫春芳;;网络信息检索及其在竞争情报搜集中的应用[J];科技情报开发与经济;2007年25期
中国重要会议论文全文数据库 前10条
1 汤俊;;自适应反洗钱辅助信息系统开发框架设计[A];第10届计算机模拟与信息技术会议论文集[C];2005年
2 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
3 关雪飞;杨军;马小兵;;决策树在航空发动机状态数据分析中的应用[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
4 刘凡平;高艳华;于炯;张伟;;基于关键决策方法的站内搜索研究与实现[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
5 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
6 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
7 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
8 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
9 姜达维;;体育统计与数据挖掘:区别、联系与融合[A];第七届全国体育科学大会论文摘要汇编(二)[C];2004年
10 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
中国博士学位论文全文数据库 前10条
1 汤俊;基于可疑金融交易识别的离群模式挖掘研究[D];武汉理工大学;2007年
2 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
3 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
6 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
7 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
8 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
9 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
10 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 张健;基于Web的资源搜索引擎[D];电子科技大学;2007年
2 那力嘉;基于个人信息管理的邮件处理系统[D];天津大学;2004年
3 顾雅枫;基于用户兴趣模型的信息检索研究[D];兰州大学;2009年
4 向光;基于机器学习和数据挖掘的入侵检测技术研究[D];东北大学;2005年
5 叶文辉;基于关联的遗传算法的研究及应用[D];福州大学;2004年
6 张永军;基于企业信息门户框架的知识管理系统研究与实现[D];机械科学研究院;2005年
7 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
8 曹倬瑝;基于数据挖掘的设备故障诊断[D];北京化工大学;2005年
9 樊聪;利用web抽取双语翻译对的研究与实现[D];重庆大学;2007年
10 张杰;搜索引擎技术的研究[D];西安理工大学;2006年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978