收藏本站
《兰州理工大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

Web文本挖掘的研究

王娜  
【摘要】:信息技术的发展使Internet出现了“信息丰富而知识相对匮乏”的问题。由于Internet的开放性及异构性,用户很难快速准确地从WWW上获取所需信息,因此,如何快速有效地提取所需信息是一项重要的研究课题。Web文本挖掘作为一种有效的信息检索技术,在近几年倍受研究者的关注。本文以此为研究重点,主要做了以下工作: (1) 探讨了Web文本挖掘的意义,系统地给出了Web挖掘的定义,对Web挖掘的任务进行了分类,讨论了Web挖掘与传统的数据挖掘、Web信息检索之间的关系。 (2) 系统阐述了Web文本挖掘的工作流程,重点研究了Web文本挖掘的特征表示、文本分类、聚类等相关技术,介绍了文本挖掘的研究课题及应用领域。此外,对Web文本挖掘系统WebMiner进行了系统介绍。 (3) 介绍了概念格的基本理论,探讨并研究了概念格理论在数据处理与分析方面的优势。深入分析了当前搜索系统存在的缺点,在Web文本检索中运用概念格理论挖掘文本中潜在的概念结构及概念间的相互关系,提出了一种基于概念格理论的Web文本检索方法。
【学位授予单位】:兰州理工大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.09

【引证文献】
中国期刊全文数据库 前1条
1 程铃钫;何月顺;;K-均值文本聚类算法在智能答疑系统中应用[J];科技广场;2009年01期
中国硕士学位论文全文数据库 前7条
1 薛浩;基于SOM聚类的WEB文本挖掘及其结果的可视化研究[D];南京航空航天大学;2010年
2 林炎钟;基于决策树分类算法的Web文本分类研究[D];江苏科技大学;2011年
3 王钦;基于数据挖掘的智能答疑系统的研究与设计[D];济南大学;2007年
4 刘秀芳;数据挖掘算法在智能答疑系统中的应用研究[D];山东师范大学;2007年
5 初永玲;数据挖掘在智能答疑系统中的应用与研究[D];沈阳工业大学;2008年
6 姚晓娜;BBS热点话题挖掘与观点分析[D];大连海事大学;2008年
7 卢健;面向文本的主题挖掘技术与实现[D];济南大学;2010年
【参考文献】
中国期刊全文数据库 前5条
1 林鸿飞,战学刚,姚天顺;中文文本挖掘的特征导航机制[J];东北大学学报;2000年03期
2 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
3 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
4 王志海,胡可云,胡学钢,刘宗田,张奠成;概念格上规则提取的一般算法与渐进式算法[J];计算机学报;1999年01期
5 梅馨,邢桂芬;文本挖掘技术综述[J];江苏大学学报(自然科学版);2003年05期
【共引文献】
中国期刊全文数据库 前10条
1 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
2 范进;;产业结构对产业集群影响力的实证分析[J];安徽广播电视大学学报;2006年04期
3 于立红;杜芸;;数据挖掘中数据预处理方法与技术[J];安徽电子信息职业技术学院学报;2009年04期
4 舒坚;郑诚;陈振;;基于关联分类方法的Web使用挖掘研究[J];安徽大学学报(自然科学版);2006年02期
5 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
6 宁小红;;Web Usage Mining在电子商务中的应用[J];安徽农业科学;2007年13期
7 唐超礼;魏圆圆;;基于数据挖掘的植保预测系统[J];安徽农业科学;2008年12期
8 刘秋生;吴小倩;;基于数据挖掘的固定资产投资效益评价[J];安徽农业科学;2011年11期
9 张友志;钱萌;程玉胜;;基于关联规则web日志挖掘方法的研究[J];安庆师范学院学报(自然科学版);2006年01期
10 王旭;马垣;;基本概念格的关联规则挖掘算法[J];鞍山科技大学学报;2006年01期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 雷育生;甘仞初;杨军;;一种基于用户偏好的虚拟网站信息结构自适应调整算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
3 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 杨雯怡;郑康锋;杨义先;;一种自适应的网络安全防护方案[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
6 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
7 赵奕;施鹏飞;;一种快速的概念格构造方法[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
8 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
9 陈江平;李平湘;;基于序半群的空间关联规则挖掘算法[A];湖北省测绘学会2006年度科学技术交流会论文集[C];2006年
10 张宇;;基于XML的Web数据自动挖掘[A];科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
2 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 张晨;基于非线性系统的金沙江攀西河段水系形态及泥石流危害研究[D];吉林大学;2011年
5 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
6 郜峦;基于文献分析的“肺与大肠相表里”证治规律及其关系研究[D];北京中医药大学;2011年
7 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
8 冯启高;农业机械化系统分析及智能决策支持系统研究[D];江苏大学;2011年
9 卢又燃;放射科随访数据库建立与粗糙集方法辅助诊断胶质瘤分级的应用分析[D];复旦大学;2009年
10 金海浩;五行相生间接补法古代应用规律研究[D];南京中医药大学;2011年
中国硕士学位论文全文数据库 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
3 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
4 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
5 刘洁;基于关联挖掘的深层网络接口模式匹配方法的研究[D];哈尔滨工程大学;2010年
6 侯宗仁;TD-SCDMA网络性能分析系统的设计与实现[D];大连理工大学;2010年
7 景向永;电子资源使用统计标准化研究[D];大连理工大学;2010年
8 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
9 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
10 樊鹏;基于GPS的SCADA-EMS煤矿供电调度系统的研究[D];辽宁工程技术大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 范亚芹,刘颖,李兴男;Web数据挖掘原理及实现[J];吉林大学学报(信息科学版);2003年04期
2 雷升锴;何嘉;;C4.5算法与粗糙集在数据挖掘中的研究[J];成都信息工程学院学报;2009年01期
3 王志明;沙莎;;Web文本挖掘技术在新闻主题检测中的应用研究[J];长沙大学学报;2007年05期
4 王宇,杨莉;模糊k-prototypes聚类算法的一种改进算法[J];大连理工大学学报;2003年06期
5 王红雨;一种实用智能答疑系统在现代远程教育中的应用[J];电脑开发与应用;2005年09期
6 李健;;Web的数据挖掘[J];电脑知识与技术;2006年32期
7 詹素青;基于WEB方式的自动答疑系统的设计[J];佛山科学技术学院学报(自然科学版);2004年03期
8 徐奕奕,陈小花;基于Java自动答疑系统的设计与实现[J];广西工学院学报;2004年03期
9 贺礼智,曹丽君,尹洪武;构建Web自动答疑系统的关键技术分析[J];华北科技学院学报;2003年01期
10 赵宝钢;李齐斌;高伟;;基于J2EE架构的企业应用集成中EJB组件的开发[J];信息技术;2006年07期
中国重要会议论文全文数据库 前3条
1 邹嘉彦;;评述新闻报道或文章色彩-正负两极性自动分类的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 于静;赵燕平;;基于社会网络分析的BBS内容安全动态监测模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 姚天昉;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;;一个用于汉语汽车评论的意见挖掘系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
4 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
5 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
6 王煜;基于决策树和K最近邻算法的文本分类研究[D];天津大学;2006年
7 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
8 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 肖红;基于web的中文文本挖掘研究[D];大庆石油学院;2004年
2 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
3 彭雅;文本分类算法及其应用研究[D];湖南大学;2004年
4 薛惠忠;WEB信息的抽取与集成[D];东南大学;2004年
5 解正安;数据挖掘技术及应用研究[D];东南大学;2004年
6 孔小宝;XHTML在线文档编辑器的设计与实现[D];北京科技大学;2005年
7 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
8 李健;聚类分析及其在文本挖掘中的应用[D];西安电子科技大学;2005年
9 程川生;Web挖掘技术及其应用[D];山东大学;2005年
10 贺伟淞;可视化数据挖掘工具的设计与实现[D];电子科技大学;2005年
【二级引证文献】
中国期刊全文数据库 前7条
1 许峰;;基于Web的实验室互联网舆情分析处理系统的研究与实现[J];科技情报开发与经济;2011年01期
2 李弼程;林琛;周杰;王允;;网络舆情态势分析模式研究[J];情报科学;2010年07期
3 任晓霞;李卓玲;周振柳;;Apriori算法在BBS舆情分析系统中的应用[J];沈阳工程学院学报(自然科学版);2010年03期
4 陈焱;;网络舆情话题的数据立方体模型分析[J];图书情报工作;2011年24期
5 陈忆金;曹树金;陈少驰;陈珏静;;网络舆情信息监测研究进展[J];图书情报知识;2011年06期
6 施国良;石桥峰;;基于文本挖掘的不同购物网站商品评论一致性研究[J];现代图书情报技术;2011年12期
7 董彩云;刘培华;;数据挖掘在开放教育网上教学中的应用[J];中国成人教育;2011年02期
中国硕士学位论文全文数据库 前10条
1 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
2 王允;网络舆情数据获取与话题分析技术研究[D];解放军信息工程大学;2010年
3 任晓霞;BBS舆情智能分析系统研究与实现[D];沈阳理工大学;2011年
4 王瑞雷;Web数据挖掘技术在网络教育论坛中的应用研究[D];新疆师范大学;2011年
5 陆红蕾;网络智能答疑系统的研究与实现[D];上海交通大学;2011年
6 董红臣;基于增量更新的交互式网页内容提取技术研究[D];哈尔滨工程大学;2011年
7 耿乐群;基于主动搜索的论坛内容监管技术研究[D];哈尔滨工程大学;2011年
8 章丽芳;基于关联挖掘的学生成绩分析系统的研究[D];浙江工业大学;2011年
9 席耀一;论坛话题检测与追踪技术研究[D];解放军信息工程大学;2011年
10 韩杰;中文BBS信息提取与分类[D];武汉邮电科学研究院;2009年
【二级参考文献】
中国期刊全文数据库 前6条
1 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报;1999年03期
2 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
3 邢桂芬;ERP与CRM一体化结构中数据实时通讯的研究[J];江苏大学学报(自然科学版);2002年06期
4 林鸿飞,战学刚,姚天顺;文本层次分析与文本浏览[J];中文信息学报;1999年04期
5 邹涛,王继成,张福炎;基于WWW的资料搜集系统的设计与实现[J];情报学报;1999年03期
6 宋擒豹,沈钧毅;基于关联规则的Web文档聚类算法[J];软件学报;2002年03期
【相似文献】
中国期刊全文数据库 前10条
1 王斌;;从信息检索到搜索引擎[J];术语标准化与信息技术;2009年04期
2 吕岚;;基于层次聚类算法的WEB文本挖掘技术研究[J];福建电脑;2011年03期
3 刘卓;徐斌;;分层聚类算法在文本挖掘中的应用[J];网络安全技术与应用;2010年07期
4 袁赟;焦锋;;基于WEB文本挖掘的证券投资系统的分析与设计[J];邵阳学院学报(自然科学版);2008年02期
5 潘静,饶若楠;基于Web数据挖掘的信息获取系统的研究及设计[J];计算机工程;2004年S1期
6 胡锦成;Web文本数据挖掘关键技术及其在网络检索中的应用[J];河北工程技术高等专科学校学报;2005年02期
7 郭蕾;;网络信息库在Web文本挖掘中的应用实例研究[J];中州大学学报;2009年05期
8 刘进锋;荣冈;;Web文本挖掘在辅助研究中的应用[J];情报科学;2006年03期
9 袁赟;张英杰;;基于投影聚类算法的Web文本挖掘证券投资系统[J];邵阳学院学报(自然科学版);2009年04期
10 徐以斌;;试析搜索引擎技术在网络信息挖掘中的应用[J];农业图书情报学刊;2007年04期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 王娜;Web文本挖掘的研究[D];兰州理工大学;2005年
2 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
3 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
4 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
5 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
6 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
7 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
8 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
9 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
10 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026