收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

Web文本挖掘技术研究及其实现

钱小军  
【摘要】:如何让Internet更好地为人类服务,是未来几年的一个真正挑战。一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是Internet上信息的纷繁芜杂,在这两者之间架设一座桥梁的确是一个巨大的挑战。作为从浩瀚的Web信息资源中发现潜在的有价值知识的一种有效技术。Web挖掘正悄然兴起,倍受关注。目前Web挖掘的研究正处于发展阶段,尚无统一的结论,需要国内外学者在理论上开展更多的讨论。同时,Web挖掘系统的开发对其研究也将起到很大推进作用。 本文对Web挖掘的有关理论进行了论述,着重讨论了Web文本挖掘系统的结构和技术。本文的主要内容包括: 一、详细描述了Web文本挖掘系统的构建,包括Web的数据模型,Web文本挖掘系统的体系结构,系统功能等; 二、具体讨论和分析了Web信息的自动获取的总体设计思想、主要实现技术,并给出了实现方案; 三、深入研究聚类和分类算法的关键技术,首先总结了在统计、机器学习和模式识别等领域的聚类/分类算法。随后从理论的层面来剖析聚类/分类算法,并介绍了一种基于粒度的分类算法; 四、介绍了在文本处理中如何提取文本特征,给出了一种权重计算的对偶性策略。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 肖湘萍;高玉斌;;Web文本挖掘[J];电脑知识与技术(学术交流);2007年09期
2 徐海霞;聚类分析在Web文本挖掘中的应用[J];情报杂志;2004年12期
3 冯中毅,董海棠;一种新的频集发现算法P&FP[J];兰州交通大学学报;2004年06期
4 吴育芳;陆春华;;Web文本挖掘研究[J];晋图学刊;2010年03期
5 李睿,李明;Web数据挖掘技术探讨[J];甘肃科技;2001年03期
6 李颖,阎保平;Web文本挖掘在互联网信息统计中的研究与设计[J];微电子学与计算机;2005年01期
7 李泽文;基于Web的数据挖掘技术[J];现代计算机;2004年07期
8 王艳;张帆;杨炳儒;;基于Web挖掘的数字图书馆个性化技术研究[J];情报杂志;2007年01期
9 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
10 李恒杰;李明;;基于本体的Web分类技术研究[J];微计算机信息;2006年21期
11 张春明;;Web挖掘技术研究[J];廊坊师范学院学报(自然科学版);2008年05期
12 张丽伟;李礼;;Web挖掘中数据预处理技术研究[J];电脑知识与技术;2010年15期
13 姜霞,张晓伟;基于XML的Web挖掘技术研究[J];电脑知识与技术;2005年20期
14 岳岩;郑丽英;;Web挖掘技术研究[J];科技咨询导报;2007年03期
15 左鹏,徐和龙,于国庆;Web挖掘在FDSS中的应用探讨[J];计算机与现代化;2001年05期
16 汪全莉;陈代春;;Web数据挖掘在网络教育中的应用[J];中国科技资源导刊;2008年02期
17 陈建华,包煊;Web挖掘系统的设计与实现[J];计算机工程;2002年08期
18 易高翔,程耕国;数据挖掘在Web智能化中应用研究[J];计算机工程与设计;2005年01期
19 陈振,郑诚,朱小栋;一种基于关联分类方法的Web用户兴趣预测[J];微机发展;2005年05期
20 汪全莉;陈代春;;Web挖掘在网络教育中的应用研究[J];大学图书情报学刊;2008年03期
中国重要会议论文全文数据库 前10条
1 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
2 董燕;;Web挖掘对电子商务网站建设的影响[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
3 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 吴珊;杨桦;;基于日志挖掘的Web预取模型[A];2006年电气工程教育专业委员会年会论文集[C];2006年
8 习慧丹;;Web日志挖掘探析[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
9 宋江春;沈钧毅;;基于CORBA的分布式Web挖掘系统的设计与实现[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
10 王磊;王丰辉;郑康锋;杨义先;;基于Web挖掘技术的漏洞收集系统研究与设计[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
中国博士学位论文全文数据库 前10条
1 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
2 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
3 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
4 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
5 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
6 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
7 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
8 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
9 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
10 孙舒杨;统计关系学习的若干问题研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
2 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
3 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
4 马宏伟;基于XML的Web文本挖掘应用研究[D];合肥工业大学;2009年
5 蒲秋梅;基于XML的Web数据挖掘技术的研究[D];武汉大学;2004年
6 孙丽;Web数据的挖掘方法研究[D];大庆石油学院;2004年
7 黄荣兵;RBF神经网络在Web挖掘中的应用研究[D];太原理工大学;2004年
8 胡小睿;基于Web挖掘的搜索引擎技术研究[D];武汉大学;2005年
9 马征;基于本体的Web页面分类挖掘[D];中南大学;2004年
10 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
中国重要报纸全文数据库 前10条
1 特约通讯员王辉东;我作战仿真技术研究获突破[N];解放军报;2003年
2 ;兴安落叶松人工开花技术研究成功[N];今日信息报;2004年
3 庄愉;药物输送技术研究取得新突破[N];医药经济报;2001年
4 李宏立;兵团大田作物高效用水技术研究获突破[N];兵团日报(汉);2006年
5 记者  焦红霞;多项科研成果为青藏高速路“输血”[N];中国改革报;2007年
6 本报记者 马德甲;华亭煤业:拍动科技翅膀[N];中国煤炭报;2006年
7 记者 周军 通讯员 曲红权 祁双杨;攀钢启动改善连铸坯表面质量技术研究[N];中国冶金报;2006年
8 记者 齐芳;我们正用西方药物技术研究中药传统理论[N];光明日报;2006年
9 记者 马文生;中美加强标准化领域合作[N];中国国门时报;2007年
10 记者 张华君 通讯员 刘晔;废旧铝再生技术研究取得突破[N];河南日报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978