收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本挖掘算法及其在知识管理中的应用研究

宣照国  
【摘要】: 随着知识经济的到来,知识管理在社会经济中的作用日益重要。大多数的知识管理研究是为企业服务的,针对科研管理部门的知识管理研究非常少,本文对我国科研管理部门的知识管理问题进行研究。与其他领域相比,科研管理部门的知识管理有一定的特殊性。比如,科研管理部门管理着蕴含大量知识的立项建议申请书。挖掘并利用申请书中的知识,能够在从科学研究整体层面、学科领域层面和项目管理层面对科研管理工作提供决策支持。 申请书中的知识隐含在申请书内容之中,从申请书中挖掘知识会面临如下问题:申请书的知识表示不能完全依赖于词典;申请书研究内容与申报学科领域不能完全吻合;学科代码体系结构与实际研究领域的体系结构不能完全一致。针对上述问题,本文在以下几个方面进行了研究: 第一,提出一种不依赖于词典抽取高频词的桥接模式滤除算法(BPFA)。首先基于N-gram技术获取文本中的汉字结合模式及出现频率,然后通过消除桥接频率得到模式的支持频率,并依此来判断和提取正确词语。实验结果显示,BPFA能够有效提高分词结果的查准率和查全率。该算法适用于对词语频率敏感的中文信息处理。本文应用该算法,抽取申请书中出现的新术语,补充到系统词表中。 第二,粗分类数据中包含有文本内容与类别标记不符的噪声数据,这些噪声数据会对文本分类结果的精度产生不良影响。本文提出一种针对粗分类数据的噪音修正算法。首先建立文档关联网络,把文档上标记的类别作为原始的社团结构,并用模块度衡量社团结构的质量,通过优化模块度指标把噪声数据调整到正确的类别中,从而提高数据质量。实验结果表明,本文所提算法能够有效修正粗分类数据中的噪声,具有较高的有效性和鲁棒性。该算法可以用于文本分类训练数据的预处理,或作为辅助技术用于文献库建设等工作。本文把申报到各个学科代码下的申请书作为粗分类数据,应用该算法把与代码不符的申请书调整到正确的代码中。并根据调整后的数据建立代码模型,分析代码所代表研究领域的内涵和外延、代码之间的交叉关系。 第三,提出基于公共连接强度的快速聚类算法。利用社团成员之间的相似关系定义了社团连接强度,根据社团的公共连接强度定义了一种新的相似度计算方法,并应用该相似度计算方法提出一种凝聚聚类算法。在相似度计算中,综合考虑了社团内部和外部结构关系,因此能够避免其他算法在聚类初期容易出现的聚类错误。分别对拓扑和加权的实验数据进行聚类,实验结果证明了所提算法比其他算法更为有效。本文应用该算法对申请书进行聚类分析,形成了项目类,并对项目类和学科代码之间的关系进行了分析。 本文在理论方法研究的基础上,对国家自然科学基金委员会的基金管理工作进行了应用研究,分析了我国基础科学研究的整体发展状况和发展规律、各个学科领域的研究状况及其关系等,为制定发展规划、发展战略、学科代码体系调整以及项目管理提供决策支持。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王书贵,薛澜;现代企业的知识管理及成功因素分析[J];中国软科学;1999年03期
2 高尚;知识管理—强有力的竞争武器[J];煤矿现代化;1999年04期
3 洪明 ,冉棋文 ,蒋斌;新趋势:知识管理[J];市场观察;1999年02期
4 尼福 ,章文光;知识管理:前景广阔[J];国外社会科学文摘;1999年09期
5 王如富,徐金发;知识管理的组织基础[J];科研管理;2000年05期
6 恩普森,容平;知识管理的挑战[J];国外社会科学文摘;2000年05期
7 王道,尤陶江;浅谈企业如何适应知识管理时代的要求[J];经济师;2001年07期
8 吴金希 ,刘冀生;加强知识管理 提高我国高科技企业核心竞争能力[J];中外企业文化;2001年21期
9 甘永成 ,祝智庭;知识管理的绩效评估[J];科学学与科学技术管理;2002年09期
10 袁桂琴;从信息管理到知识管理[J];河北大学学报(哲学社会科学版);2002年04期
11 郭涛;企业实施知识管理的误区和对策[J];科技与管理;2002年03期
12 彭亚利,卢淑琼,汤晓梅;埃森哲的秘密[J];软件世界;2002年09期
13 刘穗宏;企业竞争力与“知识管理”[J];西安政治学院学报;2002年02期
14 邓珍琴;21世纪的新管理模式—知识管理[J];华北科技学院学报;2002年01期
15 张新安;基于人本的知识管理[J];人才开发;2002年11期
16 王哲;知识管理与高校图书馆[J];经济师;2003年03期
17 刘希宋,邓立治;知识管理在现代企业中的运用[J];经济师;2003年06期
18 孟伟;现代企业的知识经济与知识管理[J];经济师;2003年12期
19 厉小军,胡上序;知识管理在化工企业中的应用[J];计算机与应用化学;2003年04期
20 王胜洲;知识管理的运作及其策略[J];企业经济;2003年02期
中国重要会议论文全文数据库 前10条
1 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 阳煜华;;基于知识管理的奥运会组织管理——以“奥运会知识转让”计划为例[A];中华人民共和国第十一届运动会科学大会论文摘要汇编[C];2009年
6 邹方;;学习型社会与图书馆知识管理[A];向数字化转型的图书馆工作[C];2004年
7 李培平;;知识管理的内涵和模式[A];发展的信息技术对管理的挑战——99’管理科学学术会议专辑(上)[C];1999年
8 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
9 张明国;刘晓荣;;我国化工企业技术创新与知识管理研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
10 黄菲菲;梁英艳;蒋侃;;基于KM的高校学生学习行为分析[A];广西计算机学会——2004年学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
2 李作学;个体隐性知识的结构分析与管理研究[D];大连理工大学;2007年
3 金福;知识型组织智力资源管理研究[D];大连理工大学;2006年
4 宋丹;基于知识的高校师资队伍管理研究[D];大连理工大学;2007年
5 于洋;组织知识管理中的知识超网络研究[D];大连理工大学;2009年
6 张睿;企业市场知识能力对组织绩效的影响作用研究[D];大连理工大学;2008年
7 贾文玉;企业知识与利润的转换研究[D];同济大学;2006年
8 唐建生;组织内部知识共享的若干问题研究[D];天津大学;2004年
9 张长涛;知识管理与产品开发人才管理耦合研究[D];哈尔滨工程大学;2003年
10 刘蕾;基于企业核心业务能力的知识管理策略研究[D];昆明理工大学;2003年
中国硕士学位论文全文数据库 前10条
1 袁野;基于Vague集的网络舆情研究[D];西安电子科技大学;2010年
2 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
3 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
4 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
5 张俊艳;基于SVM有聚类指导的Web中文文本分类器的研究及其实现[D];福州大学;2004年
6 闫晨;KNN文本分类研究[D];燕山大学;2010年
7 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
8 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
9 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
10 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
中国重要报纸全文数据库 前10条
1 陈友梅;OA走向知识管理[N];中国计算机报;2003年
2 王码;知识管理持续升温[N];科技日报;2003年
3 ;IBM Lotus :以协作为核心的知识管理[N];网络世界;2002年
4 本报记者 潘永花;知识管理“随需应变”[N];网络世界;2003年
5 阜阳师范学院副教授 李永贞;论知识管理在企业管理中的地位[N];国际商报;2010年
6 解永;知识管理略谈[N];中国贸易报;2004年
7 李云杰;HP搭乘“知识管理”快车[N];中国计算机报;2002年
8 ;知识管理:从“职能”到“流程”[N];中国计算机报;2004年
9 ;知识管理从幕后到台前[N];上海金融报;2003年
10 孙树杰;拯救知识管理[N];中国经营报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978