收藏本站
《吉林大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

Web挖掘中若干问题的研究

许建潮  
【摘要】:提出了一种智能网站体系结构。对其中部分内容进行了详细设计。 提出了一种新的基于变长度染色体遗传算法的中文网页文档特征抽取方法。该方法综合文本的频率、位置、词长、视觉效果等特征对关键词动态加权,设计了专门的并列处理算子。实验结果表明约简率和准确度都比较高。 扩展了格机理论的等标注概念,提出了交集标注概念与求解算法用于多类别Web 文档的分类。实验表明算法的准确率比较高。 证明了基于等价关系结合格机与粗糙集的可行性;提出了一种兼有纵向和横向约简功能的高效约简算法。基于超元组实现了数据属性重要性权值的评价;在可接受的分类精度的前提下,高效约简行和列。实验表明效果很好。 提出了一种Web 信息抽取方法,仅需用户简单地标注一页网页,系统就能自动获取抽取知识,算法具有一定的自适应性。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP393.09

知网文化
【引证文献】
中国期刊全文数据库 前1条
1 赵洁;莫赞;刘洪伟;张沙清;董振宁;;基于知识粒度的约简在Web使用挖掘中的应用研究[J];现代图书情报技术;2013年02期
中国博士学位论文全文数据库 前4条
1 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
2 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
3 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
4 王桂红;农产品市场价格web信息分析方法研究[D];沈阳农业大学;2013年
中国硕士学位论文全文数据库 前5条
1 茅剑;中文Web文本聚类研究[D];厦门大学;2007年
2 卢虹宇;Web结构挖掘中HITS算法的研究[D];西南交通大学;2008年
3 李素珍;基于网络学习行为分析的网络学习风格与学习偏好挖掘模型研究[D];华中师范大学;2009年
4 李少天;基于HMM与WNN混合模型的Web信息抽取研究[D];南华大学;2012年
5 蔡茜;基于Web挖掘的个性化教学系统研究与设计[D];吉林大学;2012年
【参考文献】
中国期刊全文数据库 前2条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 刘明吉,王秀峰,饶一梅,黄亚楼;Web文本信息的特征获取算法[J];小型微型计算机系统;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 范进;;产业结构对产业集群影响力的实证分析[J];安徽广播电视大学学报;2006年04期
2 于立红;杜芸;;数据挖掘中数据预处理方法与技术[J];安徽电子信息职业技术学院学报;2009年04期
3 舒坚;郑诚;陈振;;基于关联分类方法的Web使用挖掘研究[J];安徽大学学报(自然科学版);2006年02期
4 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
5 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
6 唐超礼;魏圆圆;;基于数据挖掘的植保预测系统[J];安徽农业科学;2008年12期
7 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
8 陈志民;李亭;杨敬锋;彭晓琴;;珠海市斗门区水产品病害网络诊断与防治系统算法设计[J];安徽农业科学;2010年17期
9 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
10 刘秋生;吴小倩;;基于数据挖掘的固定资产投资效益评价[J];安徽农业科学;2011年11期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
3 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
6 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
7 田松;侯妙乐;王晏民;郭宏;;基于面向属性归纳决策树的馆藏壁画病害信息提取[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
8 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
9 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
10 杨雯怡;郑康锋;杨义先;;一种自适应的网络安全防护方案[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
2 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
3 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
4 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
5 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
6 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
7 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
8 李军;不平衡数据学习的研究[D];吉林大学;2011年
9 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
10 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
3 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
4 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
5 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
6 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
7 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
8 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
9 郑陶;基于平面向量的决策树算法在高考志愿选择系统中的应用[D];辽宁工程技术大学;2010年
10 谷琳;数据挖掘在陶瓷涂层制备中的应用[D];辽宁工程技术大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 董晓霞;李干琼;刘自杰;;农产品市场价格短期预测方法的选择及应用——以鲜奶零售价格为例[J];山东农业科学;2010年01期
2 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期
3 王勇;张浩;;小麦期货价格预测的马尔可夫模型[J];安徽农业科学;2008年05期
4 张友志;钱萌;程玉胜;;基于关联规则web日志挖掘方法的研究[J];安庆师范学院学报(自然科学版);2006年01期
5 胡军伟;秦奕青;张伟;;正则表达式在Web信息抽取中的应用[J];北京信息科技大学学报(自然科学版);2011年06期
6 刘书琪,费月升;黑龙江省大豆价格预测分析[J];边疆经济与文化;2004年06期
7 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
8 吴萍;宋瀚涛;牛振东;张利萍;张聚礼;;基于SS/OSF实现高维稀疏数据对象的聚类[J];北京理工大学学报;2006年03期
9 薛为民;陆玉昌;;文本挖掘技术研究[J];北京联合大学学报(自然科学版);2005年04期
10 程贤禄;北京市农产品批发市场蔬菜价格预测预报体系研究[J];北京农业科学;2002年02期
中国博士学位论文全文数据库 前10条
1 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
2 李嵩松;基于隐马尔可夫模型和计算智能的股票价格时间序列预测[D];哈尔滨工业大学;2011年
3 张小栓;水产品价格预测支持系统研究[D];中国农业大学;2003年
4 王真星;基于本体的计算机支持协同学习关键技术研究[D];复旦大学;2003年
5 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
6 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
7 胡鹤;本体方法及其时空推理应用研究[D];吉林大学;2004年
8 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
9 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
10 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 祝美莲;半结构化网页的信息抽取技术研究[D];中国石油大学;2011年
2 邱学芹;模糊聚类算法及其聚类有效性的研究[D];青岛理工大学;2010年
3 姜海洋;Web应用程序的数据库语义发现方法研究[D];哈尔滨工程大学;2011年
4 陈波;EJB容器集群系统设计与原型实现[D];电子科技大学;2001年
5 谢中;基于Web数据挖掘商务网站推荐系统的研究[D];西南师范大学;2002年
6 黄小琴;多Agent电子商务推荐系统研究[D];重庆大学;2003年
7 沈国海;基于语义网络的Web挖掘研究[D];合肥工业大学;2004年
8 黎星星;应用语义网构建Web服务推荐系统[D];重庆大学;2003年
9 张剑飞;贝叶斯网络学习方法和算法研究[D];东北师范大学;2005年
10 段宝彬;综合评价的模糊数学方法研究[D];河海大学;2005年
【二级引证文献】
中国期刊全文数据库 前10条
1 孙海民;;个性特征对网络学习行为影响研究的关键问题探究[J];电化教育研究;2012年10期
2 张永攀;冯锡炜;关沧;汪俭华;毕福伟;;电子商务个性化推荐系统的应用[J];辽宁石油化工大学学报;2013年01期
3 刘红莲;;一种基于页面关联度的HITS改进算法[J];信息安全与技术;2013年03期
4 杨东风;;基于多兴趣度的图书借阅推荐系统研究与设计[J];信息技术;2011年07期
5 李学国;钱能;冯刚;蔡冬玲;;基于HITS算法对Web数据挖掘技术改进研究[J];制造业自动化;2011年06期
6 董志安;吕学强;;基于百度搜索日志的用户行为分析[J];计算机应用与软件;2013年07期
7 廖小琴;刘虹;孙建军;;链接网络与核心节点评价指标研究综述[J];情报杂志;2012年05期
8 马正华;任超;;基于本体的知识结构拓扑图的智能图书馆模型研究[J];图书馆学研究;2012年01期
9 王扬扬;许谨;刘洋;;实验课程的开放与监控[J];实验技术与管理;2013年05期
10 李莹;吴晓军;;基于最大流及页面相似度的Web结构挖掘[J];计算机技术与发展;2011年10期
中国博士学位论文全文数据库 前2条
1 郑立斌;联合式制造资源发现与集成方法的研究[D];江苏大学;2011年
2 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
中国硕士学位论文全文数据库 前10条
1 王琳琳;小学语文诊断评价系统的设计与开发[D];山东师范大学;2011年
2 史德增;聚类算法在Web文本挖掘中的应用研究[D];太原理工大学;2011年
3 王博;基于网络的实训室管理系统的设计与实现[D];河北科技大学;2010年
4 靳欢;淘宝网C2C电子商务中信息不对称问题分析与改进策略[D];吉林大学;2011年
5 陈博;网上商店用户潜在购物需求的信息表达[D];吉林大学;2011年
6 常卫丽;领域本体在中文命名实体识别中的应用研究[D];武汉理工大学;2011年
7 刘丽丽;网络学习中问题学习行为的研究[D];华中师范大学;2011年
8 李莹;基于最大流与页面相似度值的Web结构挖掘研究[D];陕西师范大学;2011年
9 买买提依明·哈斯木;基于后缀树的维吾尔文网页聚类算法的设计与实现[D];新疆大学;2011年
10 董馨;基于增量更新的自适应协同过滤算法研究[D];中南大学;2011年
【二级参考文献】
中国期刊全文数据库 前6条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
3 王实;高文;李锦涛;;Web数据挖掘[J];计算机科学;2000年04期
4 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
5 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
6 张月杰,姚天顺;基于特征相关性的汉语文本自动分类模型的研究[J];小型微型计算机系统;1998年08期
【相似文献】
中国期刊全文数据库 前10条
1 阎平凡,高林,徐雷;由地震记录辅助推断沉积相──模式识别在地震勘探中应用的探讨[J];清华大学学报(自然科学版);1987年01期
2 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
3 王文胜,陈伏兵,杨静宇;一种基于奇异值分解的特征抽取方法[J];电子与信息学报;2005年02期
4 施泽生,施孜海,杨劲;电子电路图的自动输入、理解及与ORCAD的链接[J];系统工程与电子技术;1996年02期
5 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
6 路军,郁文贤,郭桂蓉;一种基于紧支子波的雷达船目标特征抽取方法[J];系统工程与电子技术;1994年08期
7 张红文;一种基于车形轮廓的特征抽取方法[J];西安公路交通大学学报;1997年04期
8 李雪梅;脱机手写体数字识别器的研究[J];沈阳大学学报;1998年04期
9 吴天雷,马少平;基于重叠动态网格和模糊隶属度的手写汉字特征抽取[J];电子学报;2004年02期
10 曹建海,路长厚;基于小波变换和DCT的字符图像特征抽取新方法[J];光电子.激光;2004年04期
中国重要会议论文全文数据库 前3条
1 祝远新;徐光佑;黄浴;林学;俞志和;;一个基于表观的孤立手势识别系统[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
2 刘其真;王文韬;刘琦;何永保;;模糊记忆方法用于红外图像飞行目标跟踪[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
3 吴天雷;马少平;;基于重叠动态网格和模糊方向线素特征的手写汉字识别[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前3条
1 徐勇;几种线性与非线性特征抽取方法及人脸识别应用[D];南京理工大学;2004年
2 吴小俊;图象特征抽取与识别理论及其在人脸识别中的应用[D];南京理工大学;2002年
3 陈才扣;基于核的非线性特征抽取与图象识别研究[D];南京理工大学;2004年
中国知网广告投放
相关机构
>南京理工大学
相关作者
>徐勇 >陈才扣
>吴小俊
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026