收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集的Web文本KNN分类方法及在金融中的应用研究

王伟  
【摘要】:随着金融市场的全球化发展以及计算机网络技术的广泛应用,全球金融市场已经开始走向金融网络化。与此同时,互联网业已成为企业、机构和个人获取金融信息的主要来源;作为专业金融信息服务提供商或是个人,在面对如此海量、繁杂的互联网金融信息资源时不可避免会遇到一个巨大的挑战,即如何从互联网中实时、快速地分类和处理金融数据,如何提高Web金融数据获取效率和质量,从而改善公司金融信息服务质量,提升公司在金融信息服务行业的核心竞争力,这也成为当今学术界研究的重点问题之一。 随着信息技术和通讯技术的发展,自动信息分类技术已经成为人们有效的金融信息分类工具。当今,Web文本分类的中文信息处理是一个重要的研究领域。其目标是分析文本内容的基础上,分配一个文本到更合适的类别,以便提高文本检索应用程序的处理效率。目前有许多方法应用到此技术中去。目前,K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。KNN算法也是文本自动分类领域中的一种常用算法,对于低维度的文本分类,其分类准确率较高。然而在处理大量高维度文本时,传统的KNN算法由于需处理大量训练样本导致样本相似度的计算量增加,降低了分类效率。为解决这个问题,人们利用粗糙集对高维文本信息进行属性约简,删除冗余属性。现在相继有了一些粗糙集和KNN的混合分类方法,主要是在属性约简方面去做研究。虽然效率上比传统的单一的KNN算法在分类效率上有了很大提高,但是仍有很大的改进空间。于此,本文在基于粗糙集和KNN算法的基础上,将给出一种基于粗糙集的KNN分类系统模型和结合金融环境下的分类应用系统。在模型和系统中,我们将引入一种改进型分明矩阵的约简方法来约简属性,并采用一种改进型的CHI和模式聚合方法来处理特征提取阶段,这样使特征向量的个数大大的有效约简,减少分类阶段的数据输入量,从而提高整个分类系统的分类效率,降低分类系统的时间和空间复杂度。在本文中,我们还通过实验结果与分析,说明了这种基于粗糙集的KNN改进的分类算法比目前一般的基于粗糙集的KNN分类算法,在分类效率上有了很大的提高。 本文在分析Web文本挖掘与Web文本分类的研究现状和存在问题的基础上,主要研究了Web文本分类关键技术、方法和基于粗糙集和KNN的混合Web文本改进分类算法。本文的主要工作包括一下内容: (1)介绍Web挖掘、Web文本挖掘、Web文本分类、粗糙集的基础理论和相关知识,介绍Web文本分类过程中的关键技术。 (2)给出结合粗糙集与KNN的Web文本分类系统模型。 (3)给出一种基于粗糙集的分明矩阵改进约简算法。 (4)给出一个基于CHI方法的特征提取和模式聚合方法的KNN改进算法。 (5)给出金融环境下的Web文本分类系统,及其实验结果与比较分析。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 倪靖;;电子商务中客户行为特征的挖掘方法[J];商场现代化;2008年29期
2 李方敏;CGI的安全编程[J];计算机工程与应用;1999年06期
3 宋如顺,姜乃松;基于Web的远程考试系统设计与实现[J];计算机工程;1999年06期
4 王红霞,姚家亮;利用ASP构建新型信息系统的方法与实现[J];计算机应用;1999年09期
5 邓劲生,张银福;面向对象的多媒体信息WEB发布[J];计算机应用研究;1999年09期
6 刁兴春,李赤红;Intranet环境下事务处理的理论研究和实现[J];小型微型计算机系统;1999年06期
7 高昆;基于ASP的WEB站点开发技术分析[J];北华大学学报(社会科学版);1999年05期
8 王清心,胡建华;经贸数据库的WEB集成发布[J];昆明理工大学学报;1999年02期
9 李晶,朱秋萍;Web页制作中的动态表现技术[J];计算机工程;2000年06期
10 刘波,代亚非,杜跃进;远程协同教学系统中课程搜索子系统设计[J];计算机应用;2000年06期
11 武庄,刘友丹;基于Web的企业内部质量审核系统设计与实现[J];计算机应用研究;2000年05期
12 梁开健,刘新民;基于ASP的图书馆Web数据库开发[J];高校图书馆工作;2000年04期
13 张睿光,黄玉超;基于ASP技术的气象信息系统软件设计[J];河南气象;2000年01期
14 张少敏,王保义;基于Web的管理信息系统方案及其安全性[J];华北电力大学学报;2001年01期
15 贺文,顾训穰;基于Web的客户端电子邮件系统的实现[J];计算机工程与应用;2001年08期
16 刘国华,包宏,李文超;基于WEB的人工神经网络材料设计系统[J];计算机工程与应用;2001年20期
17 冯晓君,李也白;构建Internet环境下的CAI课件数据库系统[J];计算机应用;2001年03期
18 陈扬枝,张见威;基于Web的机械设计材料库系统[J];现代制造工程;2001年12期
19 沈祥玖,李作纬,宋义发,尹涛;利用ASP实现对Web数据库的访问[J];济南交通高等专科学校学报;2001年02期
20 张静芳,陶跃军;刍议《中文期刊数据库》Web版全文检索系统[J];图书馆学研究;2001年02期
中国重要会议论文全文数据库 前10条
1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
2 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
3 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
4 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
5 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
6 黄发良;Web信息网络社区挖掘的关键技术研究[D];华南理工大学;2011年
7 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
8 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
9 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
10 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 唐黎;Deep Web页面结构分析与核心内容提取研究[D];重庆大学;2011年
2 吴新勇;基于需求群组的Web服务调度模型研究[D];上海交通大学;2011年
3 徐卫;Web新闻热点发现系统的设计与实现[D];华中科技大学;2011年
4 姜本臣;基于嵌入式Web服务器应用技术的研究[D];沈阳工业大学;2012年
5 温梨梨;基于零拷贝的Web服务器技术研究[D];中国海洋大学;2011年
6 焦燕廷;一种基于领域本体的语义Web服务匹配和组合方法[D];山东科技大学;2011年
7 黄亮;Web漏洞扫描系统中的智能爬虫技术研究[D];杭州电子科技大学;2012年
8 赵春娟;Web服务组合方法的研究与实现[D];天津理工大学;2011年
9 任强;基于谓词抽象与精化技术的Web服务验证研究[D];苏州大学;2011年
10 侯晓帆;基于云计算的Web教育爬虫[D];东北师范大学;2011年
中国重要报纸全文数据库 前10条
1 赵晓涛;Web安全 服务为王[N];网络世界;2008年
2 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
3 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
4 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
5 闫冰;“推”出Web交付新天地[N];网络世界;2009年
6 赵晓涛;中国成全球Web安全新看点[N];网络世界;2009年
7 边歆;动态阻断Web2.0威胁[N];网络世界;2009年
8 泰乐公司首席技术官兼执行副总裁Vikram Saksena;学习Web 3.0 做聪明的“管道工”[N];通信产业报;2009年
9 ;Web2.0工具使用须谨慎[N];网络世界;2009年
10 Anchiva中国区总经理 李松;Web安全选型三个标准[N];网络世界;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978