收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于K-means的企业基础信息挖掘模型的设计与应用

李玲玲  
【摘要】:为了稳步推进我国电子政务建设的发展,国家有关当局开始重视企业基础信息库等基础性、战略性政务信息库的建设。2002年8月5日,中共中央办公厅下发了[2002]17号文件,启动了人口基础信息库、法人单位基础信息库、自然资源和空间地理基础信息库、宏观经济数据库的建设。2003年7月16日,国家税务总局、国家工商总局联合下发了国税发[2003]81号文件,进一步明确了税务部门与工商部门的信息交换内容、信息交换制度与机制。2005年,国家有关当局联合发出了《关于开展企业基础信息共享工作的通知》。2007年修订了《法人单位基础信息库项目建议书》。2007年11月,国家有关部门正式批复了国家公益性专项研究《法人单位基础信息库标准体系研究》课题。 近年来,随着相关基础设施建设的不断完善,我国不少省市基本完成了企业基础信息共享平台和交换系统的建设,尤其是杭州和北京等第一批试点城市,标志着我国电子政务建设又进入了新的发展阶段。各试点省市通过工商、税务企业登记信息的实时交换,发现了大量在工商机关登记但未作税务登记或已注销工商登记仍然营业的行为,堵塞了监管漏洞,促进了财税增收;同时,较好地解决了有关部门交叉稽核问题,提高了监管工作效率和公共服务水平,取得了良好的经济效益和社会效益。 目前,对企业基础信息资源的应用主要集中于工商、国税、地税和质监局内部,且限于一些基本信息的查找与核对,随着信息化建设的不断发展,这样的应用远不能发挥企业基础信息资源应有的价值,企业基础信息资源最重要的应用是为政府部门提供决策上的支持以及跨部门的协同应用。我国有不少学者致力于研究商务智能技术在政府信息资源管理中的应用,且取得了一定的研究成果,数据仓库技术在政府信息资源管理中的应用相对来说较成熟一点,而数据挖掘技术在政务地理空间信息资源中的应用较其他基础信息资源更成熟。 本文主要采用商务智能中的数据挖掘技术对企业基础信息库中的数据进行挖掘,通过比较分析选择了聚类分析作为本文的挖掘方法。本文根据对问题的分析,构建了一个挖掘数据集,选择企业性质、所在地区、企业成立年份、是否外资、是否注销、有无变更记录和行业分类7个细分变量作为对企业进行细分的依据。由于企业基础信息数据量大,且具有一定的聚类特征,本文设计出了一个基于K-means算法的企业基础信息聚类挖掘模型,K-means算法对处理挖掘集较大的数据集,是相对可伸缩和高效的。并应用该模型对大连市企业基础信息库中的数据进行了挖掘,由于企业基础信息中的很多属性都是分类离散的,原来的距离计算公式在这里不太适合,选择了基于概率改进的距离公式,对于改进的K-means算法应用两种软件进行了比较分析,通过分析挖掘结果,发现改进了的K-means算法更适合于本文的实例分析。 本文针对SSAS组件中聚类分析模型的运行结果分析了大连市企业发展的基本特征、发展规律以及企业发展存在的一些问题,尤其是私营企业的发展。近年来,外资企业进入大连与私营企业竞争零售业和制造业,私营企业的市场占有率越来越低。并根据呈现出来的特征和存在的问题,针对私营企业和外资企业的发展提出了一系列对策,以推动大连市企业向快速、稳定、均衡的方向发展。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 晋幼丽;周明全;王学松;;SVM和K-means结合的文本分类方法研究[J];计算机技术与发展;2009年11期
2 梁晓雪;王锋;;基于聚类的日志分析技术综述与展望[J];云南大学学报(自然科学版);2009年S1期
3 周慧芳;;自适应的k-means聚类算法SA-K-means[J];科技创新导报;2009年34期
4 钱丽丽;施鹏飞;;近邻传播算法在非监督图像聚类中的应用[J];微型电脑应用;2011年02期
5 吕强,俞金寿;基于混合遗传算法的K-Means最优聚类算法[J];华东理工大学学报;2005年02期
6 易明,张金隆,邓卫华;一种电子商务站点个性化方法[J];情报学报;2005年05期
7 李伟;黄颖;;文本聚类算法的比较[J];科技情报开发与经济;2006年22期
8 罗建平;苏志同;;聚类分析在铝电解槽况判断中的应用[J];现代计算机(专业版);2008年01期
9 李江华;杨书新;刘利峰;;基于概念格的文本聚类[J];计算机应用;2008年09期
10 郑伟;季铎;蔡东风;王爽;;基于文本最小相似度的中心选取方法[J];广西师范大学学报(自然科学版);2008年03期
11 陈晓春;;基于K-Means和EM算法的聚类分析[J];福建电脑;2009年02期
12 陈东;皮德常;;基于属性加权的改进K-Means算法[J];电脑知识与技术;2009年09期
13 尉建兴;崔冬华;宁晓青;;蛙跳算法在Web文本聚类技术中的应用[J];电脑开发与应用;2011年05期
14 杨占华;杨燕;;一种基于SOM和K-means的文档聚类算法[J];计算机应用研究;2006年05期
15 陈光宇;胡丽英;苏勇;;聚类分析在电信行业客户关系管理中的应用[J];微计算机信息;2006年33期
16 毛韶阳;李肯立;;优化K-means初始聚类中心研究[J];计算机工程与应用;2007年22期
17 张庭溢;董绍华;;基于数据挖掘的客户分类应用研究[J];科技信息(科学教研);2007年27期
18 王颋;姜鹏飞;;一种基于遗传算法的聚类算法[J];软件导刊;2008年01期
19 岳清华;郑刚;;一种动态心电图波形聚类策略的研究[J];天津理工大学学报;2008年01期
20 彭厚文;杨爽;何凤成;;基于聚类算法的并行化研究[J];电脑知识与技术;2009年24期
中国重要会议论文全文数据库 前10条
1 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
2 廖顺和;乐嘉锦;;一种类K-means算法的高效近似查询方法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 李剑;李俊;;改进的K-means聚类算法在入侵检测系统中的应用研究[A];2011年全国通信安全学术会议论文集[C];2011年
5 郁松;樊晓;廖志芳;;Internet中基于K-Means的远程服务器工作状态的聚类研究[A];第二十七届中国控制会议论文集[C];2008年
6 张燕萍;姜青山;;k-means型软子空间聚类算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
7 叶宁;王汝传;陈志;;一种基于传感器网络的普适计算数据流挖掘算法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
8 丁丹;袁华;张凌;;基于内容的广告垃圾图像过滤方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 李刚;张凯锋;王一清;邓胜;;基于改进K-means的负荷坏数据修正[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
10 张伟;徐远;;两步聚类方法[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年
2 王緌;企业核心能力的湍流挖掘模型及挖掘实验[D];四川大学;2005年
3 高雅田;基于MAS的数据挖掘模型自动选择方法研究[D];东北石油大学;2011年
4 常鹏;基于词共现的文本主题挖掘模型和算法研究[D];天津大学;2010年
5 宁红云;协作智能体环境下虚拟企业自由联盟构建技术研究[D];天津大学;2009年
6 陈洪顺;基于商业智能的财务审计信息系统研究[D];山东大学;2011年
7 刘晓江;基于统计滚雪球模型的知识挖掘理论与方法[D];中国科学技术大学;2011年
8 薛凯;数字城市的实施策略与模式研究[D];天津大学;2012年
9 许涛;电力系统安全稳定的智能挖掘[D];华北电力大学(北京);2004年
10 曾献辉;服饰智能适配系统的研究与应用[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 李玲玲;基于K-means的企业基础信息挖掘模型的设计与应用[D];东北财经大学;2010年
2 沈陵峰;网上产品评价的意见挖掘模型研究[D];中国科学技术大学;2010年
3 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
4 韩晓慧;基于改进混合蛙跳算法的K-means聚类算法研究[D];甘肃农业大学;2012年
5 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
6 黄鸿鸣;基于K-means的网页信息检索的聚类研究及实现[D];复旦大学;2012年
7 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
8 席讴婕;基于k-means和自适应谐振理论的网络流量分类方法[D];内蒙古大学;2010年
9 任巍英;基于属性扩展图的K-means聚类算法的研究[D];中北大学;2012年
10 史习云;改进的k-means聚类算法在图像检索中的应用研究[D];江苏大学;2010年
中国重要报纸全文数据库 前10条
1 记者 王燕 通讯员 徐静;新居民基础信息排查行动开始全面提高信息质量[N];嘉兴日报;2011年
2 邱明国赵成胜;自动比对软件为信息把关[N];中国税务报;2008年
3 记者 徐瑞哲;百万户级“诚信库”苏浙沪企业共享[N];解放日报;2008年
4 郁红 杨丹 杜小龙;用实招·摸实情·报实数[N];贵阳日报;2009年
5 ;无锡市信息化办公室 无锡市市民卡[N];计算机世界;2009年
6 孙巡;冲破信息资源“部门割据”[N];新华日报;2006年
7 记者 卢博林董超文;我市普查“住房困难户”[N];深圳商报;2007年
8 通州区民政局;通州区城乡低保家庭基础信息采集工作正式启动[N];北京社会报;2008年
9 记者 宋向华;呼市企业基础信息管理中心揭牌[N];呼和浩特日报(汉);2009年
10 罗万勤;为“数字黄河” 提供基础信息[N];中国水利报;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978