收藏本站
《天津财经大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于层次聚类的科技项目分类与查重研究

吴燕  
【摘要】: 科教兴国是我国的一项重要基本国策。国家每年都会投入大量的人力、物力、财力等资源用于各类科技项目的研究与开展。科技项目的立项、研究过程直至最终产生的科研成果所带来的科学价值、经济价值以及社会价值都直接影响着科学技术以及社会的发展。随着国家以及各地方政府对科技项目投入的经费逐年增加,科技投入范围的逐步扩大,我国的科学技术生产力得到了快速发展,但是随之而来的还有种种管理上的难题。 对科技项目的正确评估审查是保证国家资源能够得到科学合理配置的重要手段之一。因为不同领域的科技活动分别具有不同的科技特征,所以如果能采用科学合理的科技项目分类模型对科技申报项目进行分类处理,就可以为不同领域项目的财务评审、风险评估等等提供基本的分类依据,而在此基础上所建立的各类科技项目的评审模型也会变得更加有针对性,从而加强了科技项目评审的科学性与准确性。 基于层次聚类的科技项目分类模型在对项目进行聚类处理时,首先通过比较项目申报书的关键词词频统计向量对项目之间的相似度进行计算;然后将所得的相似度分布曲线用最小二乘法对其进行拟合,并求得曲线的拐点作为层次聚类的阈值参数;最后使用层次聚类算法在不同的粒度下逐层聚类,构造成层次树形结构,实现了不同粒度下的项目分类。 在对科技项目进行同类项目查找时,运用广度优先搜索算法对聚类处理所得到的层次树进行搜索,可以极大地提高相似项目查找的速度和效率,也可以高效、准确地查找出高于相似警戒阈值的类似项目,向项目评审者提供预警,防止同类科技项目重复立项,造成国家资源配置上的浪费。
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:G311

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 郭鹏伟;黄桥林;肖白;;基于聚类分析理论的空间负荷预测方法[J];黑龙江电力;2011年06期
【参考文献】
中国期刊全文数据库 前10条
1 李晓红;田军委;;面向FCM聚类阈值分割的聚类有效性判别函数[J];安徽大学学报(自然科学版);2007年05期
2 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
3 王宇;李晓利;;核k-凝聚聚类算法[J];大连理工大学学报;2007年05期
4 吴琪,左万利;一种基于距离的增量聚类算法[J];湖南工程学院学报(自然科学版);2005年03期
5 孟海涛;陈笑蓉;;基于模糊相似度的科技文献软聚类算法[J];贵州大学学报(自然科学版);2007年02期
6 张猛,王大玲,于戈;一种基于自动阈值发现的文本聚类方法[J];计算机研究与发展;2004年10期
7 马志民,张军,钟亮;基于层次聚类的改进FCM算法[J];山东交通学院学报;2005年02期
8 陈黎,黄心汉,王敏,李炜;基于聚类分析的车牌字符分割方法[J];计算机工程与应用;2002年06期
9 杨欣斌,孙京诰,黄道;一种进化聚类学习新方法[J];计算机工程与应用;2003年15期
10 罗可,蔡碧野,吴一帆,谢中科,张丽;数据挖掘中聚类的研究[J];计算机工程与应用;2003年20期
中国硕士学位论文全文数据库 前1条
1 申情;基于粒度计算的分类方法研究[D];中北大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
2 孟庆全;金传山;梅灿华;胡学钢;;基于依赖度求解属性约简的方法[J];安徽大学学报(自然科学版);2008年04期
3 高炜;梁立;;基于概念匹配的本体映射算法[J];安徽大学学报(自然科学版);2010年06期
4 梅灿华;孟庆全;祁炯;李明;;分辨矩阵构成与约简同步的方法[J];安徽工程科技学院学报(自然科学版);2008年02期
5 梅灿华;孟庆全;;数字化中医胃病诊断方法研究[J];安徽中医学院学报;2008年03期
6 田子德;王国君;;网络环境下学生自主学习的贝叶斯评价[J];白城师范学院学报;2007年06期
7 李翠霞,于剑;一种模糊聚类算法归类的研究[J];北京交通大学学报;2005年02期
8 吴明芬;沈挺;曹存根;吴贤维;;模糊商空间理论两个定理的补充[J];北京交通大学学报;2009年06期
9 韩建保;罗小江;;基于数据挖掘的坦克传动装置故障征兆识别展望[J];车辆与动力技术;2005年04期
10 余劲,黄辉先,刘志军,汤红忠;复杂背景下车牌字符的分割与特征提取[J];兵工自动化;2005年04期
中国重要会议论文全文数据库 前10条
1 张铃;张燕平;方宏彬;张沆;;不可约迭代函数系统的商空间理论[A];第二十六届中国控制会议论文集[C];2007年
2 毛军军;张铃;郑婷婷;吴涛;;基于商空间理论的商分形模型[A];第二十六届中国控制会议论文集[C];2007年
3 杨卫莉;郭雷;赵天云;肖谷初;;融合分水岭算法和蚁群聚类的图像分割[A];第二十六届中国控制会议论文集[C];2007年
4 李红霞;袁晓芳;田水承;王莉;;基于义类词典的煤矿瓦斯爆炸案例推理系统研究[A];中国职业安全健康协会2008年学术年会论文集[C];2008年
5 刘重晋;郭小娟;杨刚;姚力;;利用空间信息的FCM快速算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
6 马晓艳;唐雁;;层次聚类算法研究[A];2008年计算机应用技术交流会论文集[C];2008年
7 鲁俐;;高校档案管理工作中的一种决策树分类算法研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
8 赵磊;黄道;;基于蚁群算法的化工过程故障诊断[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 张诚一;;模糊集的同构与同态[A];第二届不确定系统年会论文集[C];2004年
10 连建勇;;基于数据挖掘的电信客户流失分析[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
2 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
3 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
4 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年
5 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
6 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
7 杨剑锋;适合并行的无干预文档聚类算法研究[D];武汉大学;2010年
8 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
9 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
10 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
中国硕士学位论文全文数据库 前10条
1 左宗乐;多移动Agent动态协作在P2P文件共享中的应用研究[D];安徽工程大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 姜周恩;车牌字符分割算法研究[D];辽宁师范大学;2010年
4 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
5 王颖芳;基于特定内容的敏感图像过滤技术的研究[D];哈尔滨工程大学;2010年
6 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
7 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
8 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年
9 骆永健;基于聚类的数据流异常检测算法的研究[D];哈尔滨工程大学;2010年
10 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前6条
1 周平,杨岚,周家启;电力系统负荷灰色预测的新方法[J];电力系统及其自动化学报;1998年03期
2 王天华,王平洋,范明天;遗传算法、模糊逻辑和运输模型在配电网空间负荷预测中的应用[J];电网技术;1999年01期
3 王天华,范明天,王平洋,岳宗斌;基于地理信息系统平台的配电网空间负荷预测[J];电网技术;1999年05期
4 马晓东;庄敏辉;史林军;;空间负荷预测在苏州工业园区电网规划中的应用[J];江苏电机工程;2006年03期
5 曾志雄;;一种有效的基于划分和层次的混合聚类算法[J];计算机应用;2007年07期
6 杨丽徙;王金风;陈根永;王家耀;;基于元胞自动机理论的电力负荷空间分布预测[J];中国电机工程学报;2007年04期
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 乔斌,郑洪涛,郭智疆,李玉榕,蒋静坪;针对信息系统不完备性的粗糙集分层递阶约简[J];电路与系统学报;2001年02期
3 龚坚,李立源,陈维南;二维熵阈值分割的快速算法[J];东南大学学报;1996年04期
4 吴福保,李奇,宋文忠;模糊聚类分析的传递方法[J];东南大学学报;1999年02期
5 裴继红,范九伦,谢维信;一种新的高效软聚类方法:[J];电子学报;1998年02期
6 于剑,程乾生;关于FCM算法中的权重指数m的一点注记[J];电子学报;2003年03期
7 谭皓,王金岩,何亦征,沈春林;一种基于子群杂交机制的粒子群算法求解旅行商问题[J];系统工程;2005年04期
8 李兴斯;解非线性规划的凝聚函数法[J];中国科学(A辑 数学 物理学 天文学 技术科学);1991年12期
9 于剑,石洪波,黄厚宽,孙喜晨,程乾生;Counterexamples to convergence theorem of maximum-entropy clustering algorithm[J];Science in China(Series F:Information Sciences);2003年05期
10 刘清;《Rough集及Rough推理》[J];计算机研究与发展;2001年07期
中国重要会议论文全文数据库 前3条
1 鲁松;白硕;;词距离的计算方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【相似文献】
中国期刊全文数据库 前10条
1 刘娜;郑小洋;李为平;;基于小波分析的经济数据预测[J];重庆工学院学报(自然科学版);2009年11期
2 张积林;;多因素数据重心预测法对比研究——中国钢材消费量预测实证分析[J];福建农林大学学报(哲学社会科学版);2010年04期
3 张贤澳;;最小二乘法确定洛特卡定律参数的方法应当终结[J];技术与市场;1992年06期
4 杨神化,关克平;Spreadsheet方法在港口吞吐量预测中的运用[J];武汉理工大学学报(交通科学与工程版);2005年05期
5 李开顺;张连增;;Kalman滤波在未决赔款准备金评估中的应用[J];统计与决策;2008年03期
6 贺俊刚;王选庆;;基于最小二乘法的应收账款信用成本回归分析[J];会计之友(上旬刊);2008年05期
7 王修文;钱林义;;关于2000-2003新生命表出台对寿险业的影响分析[J];应用概率统计;2008年01期
8 张旭;;刍议土工标准击实试验最大干密度的求取[J];科技创新导报;2008年33期
9 韩晓昕;;基于马尔科夫链的我国三次产业贡献率研究[J];合作经济与科技;2009年15期
10 李学清;;我国造纸工业技术进步贡献实证研究[J];中华纸业;2009年13期
中国重要会议论文全文数据库 前10条
1 陈晶;吴锤红;;提高单片机浮点数精度的综合措施[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
2 李乃强;宋小虎;;最小二乘影像匹配的实现和分析[A];江苏省测绘学会2007'学术年会论文集[C];2008年
3 廖红梅;;矿井涌水水位与流量关系的拟合方法[A];第十八届全国煤矿自动化学术年会中国煤炭学会自动化专业委员会学术会议论文集[C];2008年
4 梅胜松;方康玲;黄焯;;一种系统辨识的遗忘因子优化法[A];1996年中国控制会议论文集[C];1996年
5 李乃强;宋小虎;;最小二乘影像匹配的实现和分析[A];江苏省测绘学会2007年学术年会论文集[C];2008年
6 姜德宏;徐德民;任章;;基于神经网络的自校正控制器[A];1993中国控制与决策学术年会论文集[C];1993年
7 曲丽萍;曲永印;有勇;;径向基函数网络的建模研究[A];1999中国控制与决策学术年会论文集[C];1999年
8 李永红;;可加模型回归函数估计的强相合性[A];数学·物理·力学·高新技术研究进展——1998(7)卷——中国数学力学物理学高新技术交叉研究会第7届学术研讨会论文集[C];1998年
9 张桐;王亚慧;叶安丽;王健;;基于微粒群算法与最小二乘法的在线辨识策略研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
10 牛志国;李同春;石现春;高勇;;人工地震波的最小二乘校正[A];首届全国水工抗震防灾学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 张燕;浅析国际原油和玉米期货的相关性[N];期货日报;2007年
2 陈东理;如何把握股指期现套利投资机会[N];期货日报;2007年
3 通讯员夏瑛 王苏;丰富区主要位于苏东北部[N];中国气象报;2010年
4 倪成群;人民币升值背景下中外金价和黄金投资收益关联性研究[N];期货日报;2008年
5 徐张立;股票市值管理方案实证分析[N];期货日报;2008年
6 黄艳红;收益率曲线调整是主流[N];中国证券报;2004年
7 长城证券有限责任公司 杨俊远 李庆林;上市公司效率影响因素分析的实证研究[N];证券时报;2004年
8 万海波;用Excel完成批量评估函数汇总(上)[N];财会信报;2006年
9 黄志钢;大豆、玉米套利机会显现[N];期货日报;2006年
10 张辉;上证50ETFs与沪深 300股指期货套利初探[N];期货日报;2006年
中国博士学位论文全文数据库 前10条
1 杨凡;生物序列分析中若干问题的研究[D];电子科技大学;2011年
2 王立宏;信息系统的约简与粒度分析及其在数据挖掘中的应用[D];上海大学;2004年
3 张志君;基于光纤陀螺的寻北定向技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2005年
4 李玲娟;数据挖掘技术在入侵检测系统中的应用研究[D];苏州大学;2008年
5 王永健;Arbitrary Lagrangian-Eulerian方法及其关键技术研究[D];南京航空航天大学;2008年
6 葛继科;语义网格环境中的服务匹配研究[D];西南大学;2009年
7 林卫国;LED参数测量及其质量控制的研究与应用[D];武汉理工大学;2012年
8 杨春梅;基因表达数据聚类分析算法研究和应用[D];天津大学;2006年
9 钟祥麟;基于油膜模型的多点喷射汽油机瞬态工况控制研究[D];吉林大学;2007年
10 张志坚;多模态生物特征识别融合算法的研究[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 吴燕;基于层次聚类的科技项目分类与查重研究[D];天津财经大学;2008年
2 张剑;复杂网络中的层次社团发现与应用[D];北京邮电大学;2011年
3 孙琼;我国房地产企业流动性指标体系研究[D];中南大学;2009年
4 瞿俊;基于重叠度的层次聚类算法研究及其应用[D];厦门大学;2007年
5 吴伟;联机手写蒙古文字识别技术的研究与实现[D];内蒙古大学;2005年
6 周晓昕;基于多属性特征的时态近似周期挖掘和应用[D];浙江工业大学;2008年
7 殷大勇;感应电动机稳态模型参数识别及其装置[D];广东工业大学;2006年
8 王恩珩;薄壁回转体廓形误差评定方法的研究[D];大连理工大学;2007年
9 范昕炜;计算机自动配气系统的研究[D];广东工业大学;2000年
10 黄开奇;资本结构和产品市场竞争的联系[D];合肥工业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026