收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web的文本挖掘技术的研究

刘岩  
【摘要】:如何让Internet更好地为人类服务,是未来几年的一个真正挑战。一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是Internet上信息的纷繁芜杂,在这两者之间架设一座桥梁的确是一个巨大的挑战。作为从浩瀚的Web信息资源中发现潜在的有价值知识的一种有效技术,Web挖掘正悄然兴起,倍受关注。目前Web挖掘的研究正处于发展阶段,尚无统一的结论,需要国内外学者在理论上开展更多的讨论。同时,Web挖掘系统的开发对其研究也将起到很大推进作用。 本文对Web挖掘的有关理论进行了论述,着重讨论了Web文本挖掘系统的结构和技术。本文的主要内容包括:首先,探讨了Web挖掘的有关理论;其次,在研究Web文本挖掘技术的基础上,介绍了一种Web文本挖掘系统的体系结构;再次,具体讨论了Web信息的自动获取的总体设计思想,并对获取信息的预处理工作进行了研究;第四,为了将遗传算法应用到本文设计的算法中,对遗传算法进行了详尽的分析;最后,在对传统的遗传算法进行改进后,提出了一种基于遗传算法的特征提取算法。实验表明,该方法是可行的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王明春,王正欧;基于粗集与遗传算法相结合的文本模糊聚类方法[J];电子与信息学报;2005年04期
2 邹国平;彭梅香;黄国兵;;基于GA和信息熵的文本分类规则抽取方法[J];微计算机信息;2008年27期
3 高茂庭;陆鹏;;基于投影寻踪降维的文本特征可视化[J];计算机应用;2008年06期
4 康曙光;裴志利;孔英;;基于改进遗传算法的WEB文本挖掘系统[J];内蒙古民族大学学报;2009年02期
5 高宏宾;杨海振;张小彬;;一种改进的文本聚类方法[J];自动化技术与应用;2008年09期
6 孙晓华;刘大昕;张健沛;徐悦竹;;文本机会发现研究综述[J];计算机工程;2010年20期
7 何俊杰;陆军;;改进WEB数据挖掘方法及其在个性化推荐中的应用[J];科技管理研究;2010年06期
8 刘永山,汤毅,陈雯柏,曾昭天;数据挖掘技术的研究[J];重庆工业高等专科学校学报;2003年02期
9 宋淑彩;庞慧;丁学钧;;GA-SVM算法在文本分类中的应用研究[J];计算机仿真;2011年01期
10 李向东;刘晓斌;武利平;常洪梅;;面向路线图编制的模糊均值文本聚类挖掘方法研究[J];河北工业大学学报;2011年03期
11 ;浅析大规模文本数据挖掘技术在媒体中的创新应用[J];中国传媒科技;2007年11期
12 赵慧勤;基于因特网的信息检索特点与发展趋势[J];情报理论与实践;2000年05期
13 崔志明,谢春丽;基于Web的文本挖掘研究[J];微电子学与计算机;2002年10期
14 胥桂仙,朴泰雄,杨丹丹,徐小博,高旭;中文文本挖掘中最长频繁序列的发现算法[J];中央民族大学学报(自然科学版);2004年01期
15 渡部勇;;文本挖掘技术应用于专利检索分析[J];微电脑世界;2007年12期
16 万红新;彭云;;模糊策略下的搜索文本聚类分析技术[J];计算机工程与应用;2009年33期
17 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
18 付国瑜;;Web文本分类挖掘[J];科学咨询(决策管理);2008年03期
19 曹丽君;刘西印;杨燕萍;;WEB页面文本挖掘的价值与未来探究[J];商场现代化;2008年09期
20 韩洁;;Web文本挖掘技术在信息生产领域的应用研究[J];硅谷;2010年08期
中国重要会议论文全文数据库 前10条
1 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
2 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
4 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
5 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
6 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
7 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
8 何奉道;梁向阳;;基于遗传算法的机车周转图优化编制方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 刘忠凯;薛正辉;任武;李伟明;高本庆;;用遗传算法优化八木天线[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
10 汝勇;杨树强;;遗传算法在历史性约束组合优化问题中的应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
中国博士学位论文全文数据库 前10条
1 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
2 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
3 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
4 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
5 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
6 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
7 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
8 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
9 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
10 谷峰;柔性作业车间调度中的优化算法研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
2 朱奉梅;遗传算法在高校排课系统中的研究与应用[D];东北大学;2009年
3 孙晓丽;基于遗传算法的既有线平面及纵断面整正优化设计[D];中南大学;2010年
4 冯秋霞;解最小生成树问题的新的遗传算法[D];西安电子科技大学;2010年
5 郭佳;基于遗传算法的认知无线网络资源分配技术研究[D];西安电子科技大学;2010年
6 宋品;基于改进遗传算法的波束形成技术研究及其应用[D];西安电子科技大学;2010年
7 梁云静;基于遗传算法的主题爬虫搜索策略研究[D];湖北工业大学;2010年
8 高建兵;基于遗传算法的模糊推理控制系统的参数优化研究[D];辽宁工程技术大学;2011年
9 李振业;多向变异遗传算法及其优化神经网络的研究[D];华南理工大学;2011年
10 栾丽霞;遗传算法在潍坊商校排课系统的研究与应用[D];电子科技大学;2011年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
4 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
5 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
6 汪洋 编译;BI平民化[N];计算机世界;2004年
7 靳辉;垂直搜索:呼叫经济发展的核心动力[N];通信产业报;2007年
8 缪其浩记者 江世亮;非官方信息源担当应急预警器[N];文汇报;2008年
9 程爱娟;旅行推销员问题(TSP)的人工智能解法及其应用[N];新疆科技报(汉);2001年
10 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978