收藏本站
《大连理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

科研项目管理中的文本挖掘方法研究及应用

姜韶华  
【摘要】:在基础研究的科研项目管理中,项目的相似性分析是一个基本的管理问题,依据相似性可以对项目进行分类,避免重复申报、重复立项,还可以为相似项目的评审选择合适的同行专家。项目的相似性分析一般是根据项目建议书的标题、摘要和关键词并结合项目管理人员的经验进行。但是由于一方面项目数量逐年快速增加,另一方面基础研究具有创新性、不确定性、学科交叉融合及新观点、新概念和新的知识点不断涌现等特点,科研项目管理人员很难根据基础研究项目的真正内涵进行相似性分析,从而给管理工作带来了极大的挑战。因此,从项目的知识内涵中进行相似性分析就成为现实的需求,这就需要对项目进行知识挖掘,并从知识管理的角度探讨项目管理问题。 科研项目建议书是由自然语言撰写的文本,特别是我国基础研究的建议书绝大部分是中文文本。因此对项目进行知识挖掘就转变为对项目建议书的文本挖掘。本文针对基础研究项目建设书的特点,研究了文本挖掘中的基本方法。本文的主要工作如下: 1.提出了符合中文科研项目文本特点的长度优先的无词典切分思路。与英文相比,文本切分是中文文本挖掘中的基本问题。科研项目文本中包含大量的语义不可分割的专业术语,并且不断涌现新术语,特别是基础研究项目的中文文本更是如此。现有的文本切分方法不适合于解决基础研究项目的文本切分问题,因此,本文提出了长度优先的无词典切分思路。 2.提出了中文科研项目文本的切分方法。依据上述的切分思路,提出了科研项目文本的三种切分方法:正向串频最大匹配法、逆向串频最大匹配法和双向串频最大匹配法,实验结果表明双向串频最大匹配法可以达到更好的切分精度。结合统计学习与规则筛选,这几种方法可以切分出专指语义串、短语和词。给出了专指语义串的定义,并从系统整体性和语义优先性的角度对其表示科研项目建议书内容的合理性进行了分析。上述方法既可以解决中文基础研究项目建议书文本的切分问题,又可以应用于一般文本的切分。 3.提出了科研项目文本的层次特征项获取和建模方法。针对科研项目的特征项之间在语义上具有层次性的特点,在文本切分结果的基础上,提出了基于迭代学习的层次特征项获取方法。通过迭代学习不仅可以获取切分结果中包含的层次特征项,而且可以获取切分结果中所不包含的层次特征项,从而更全面地表示文本。在层次特征项的基础上,采用网络作为语义层次结构关系的表示工具,从而实现科研项目文本建模。与通常的向量空间模型相比,该模型既可以表示特征项信息,又可以表示特征项之间的语义关系。该模型对单个文本的表示、领域文本的表示及本体等的自动构建具有重要意义。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:G311

【引证文献】
中国博士学位论文全文数据库 前1条
1 谢陆宁;基于综合集成的团队创新支持理论与方法研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前4条
1 孙勇;突发事件应急预案形式化描述方法研究[D];大连理工大学;2007年
2 张静;学科交叉分析方法与应用研究[D];大连理工大学;2010年
3 闫冬冬;基于数据挖掘技术的智能答疑系统的研究与设计[D];太原理工大学;2010年
4 杨雅琴;基于组合分类策略的中英文情感分析系统研究与实现[D];华北电力大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 张德鑫;“水至清则无鱼”——我的新生词语规范观[J];北京大学学报(哲学社会科学版);2000年05期
2 李海鹰;图书馆知识管理的基本理念与策略[J];图书与情报;2004年04期
3 党延忠;;基础研究学科发展的宏观知识挖掘[J];管理工程学报;2006年02期
4 傅赛香,袁鼎荣,黄柏雄,钟智;基于统计的无词典分词方法[J];广西科学院学报;2002年04期
5 刘秉权,王晓龙,王宇颖;一种多知识源汉语语言模型的研究与实现[J];计算机研究与发展;2002年02期
6 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
7 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
8 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
9 周水庚,关佶红,胡运发;基于文档实例的中文信息检索[J];计算机工程与应用;2000年10期
10 张健,李素建,刘群;N-gram统计模型在机器翻译系统中的应用[J];计算机工程与应用;2002年08期
中国重要会议论文全文数据库 前1条
1 郑家恒;杜永萍;宋礼鹏;;农业病虫害词汇获取方法初探[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前4条
1 张晓刚;面向软件过程改进的知识管理技术研究[D];中国科学院研究生院(软件研究所);2004年
2 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
3 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
4 李丹;科学研究活动中的知识管理研究[D];武汉大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 诸虹;初锐;;图书馆知识管理及其实施策略[J];安徽广播电视大学学报;2008年03期
2 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期
3 周琼;黄河;;基于百度百科的农业专业词汇自动获取方法研究[J];安徽农业科学;2009年14期
4 康海燕;任俊玲;陈昕;王鹤沩;;基于自然语言处理的多级网页过滤器研究[J];信息安全与技术;2011年10期
5 赵成龙,薛欣;基于WEB的智能答疑系统的设计与实现[J];安阳师范学院学报;2004年02期
6 陈霞;;如何加强企业文化建设[J];北方经济;2006年20期
7 李玉鑑,肖创柏;蛋白质序列中可能存在的Zipf定律[J];北京工业大学学报;2005年04期
8 李玉鑑;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期
9 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
10 吕学强;舒燕;施水才;;搜索日志中“V+N”、“V+V”型短语识别[J];北京信息科技大学学报(自然科学版);2012年02期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
3 王宏生;孙美玲;李家峰;;隐马尔科夫模型在构建语言模型中的应用[A];创新沈阳文集(A)[C];2009年
4 孙华君;董兆华;章一函;;药品知识产权保护与注册管理中商品名及商标注册现状[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年
5 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 万菁;姬东鸿;任函;冯文贺;;汉语复合名词短语特征结构的标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 隋岩;张普;;基于动态流通语料库的“动态词典”编纂[A];中国辞书论集2000[C];2000年
10 史东娜;王枞;李卫;;车牌识别领域的中文术语自动抽取[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
中国博士学位论文全文数据库 前10条
1 李颖玉;基于语料库的欧化翻译研究[D];上海外国语大学;2010年
2 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
3 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
4 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
5 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
6 方清明;现代汉语名名复合形式的认知语义研究[D];暨南大学;2011年
7 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
8 曾晓洁;现代汉语母语教育演进研究[D];湖南师范大学;2011年
9 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
10 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
3 张燕丽;基于Winnow算法和CAPTCHA的垃圾短信过滤研究[D];郑州大学;2010年
4 刘琛钊;基于KVC的研究型大学核心竞争力评价研究[D];哈尔滨工程大学;2010年
5 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
6 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
7 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
8 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
9 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
10 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 薛为民;陆玉昌;;文本挖掘技术研究[J];北京联合大学学报(自然科学版);2005年04期
2 孟连生;引文分析方法在科技期刊评价工作中的应用[J];编辑学报;1999年04期
3 宋周举;赵明;;浅谈城市燃气企业应急预案的编制[J];城市燃气;2006年01期
4 何金平;程丽;;大坝安全预警系统与应急预案研究基本思路[J];水电自动化与大坝监测;2006年01期
5 吕振;李光;;加强应急事件管理 建立完善的应急预案体系[J];电力安全技术;2006年02期
6 薛立华,黄洪钟,张旭,古莹奎,赵宏;概念设计方案评价和决策线性物理规划模型研究[J];大连理工大学学报;2005年04期
7 张亮;;基于HTMLParser和HttpClient的网络爬虫原理与实现[J];电脑编程技巧与维护;2011年20期
8 王红雨;一种实用智能答疑系统在现代远程教育中的应用[J];电脑开发与应用;2005年09期
9 戴华良;王坚;;数据仓库在企业能效评估系统中的应用[J];电脑知识与技术;2008年25期
10 寿志勤,李乐明,崇大志;一个面向政务流程的工作流管理系统分析与构建[J];电子政务;2005年10期
中国博士学位论文全文数据库 前5条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
3 邱明;语义相似性度量及其在设计管理系统中的应用[D];浙江大学;2006年
4 姜晓林;科技项目管理中知识管理系统研究[D];大连理工大学;2008年
5 程明智;电子商务环境中信息快速加密及内容安全管理相关技术研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
2 么士宇;基于分布式计算的网络爬虫技术研究[D];大连海事大学;2011年
3 黄亿华;基于情感评价单元的商品评论分析研究[D];南京大学;2011年
4 桂许军;基于JavaEE平台与Lucene的信息文档搜索引擎系统的设计与实现[D];西南交通大学;2011年
5 楼佳;中文文本聚类的评价与改进研究[D];杭州电子科技大学;2009年
6 周城;面向中文Web评论的情感分析技术研究[D];国防科学技术大学;2011年
7 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年
8 冯波;面向服务的工作流管理系统[D];中国海洋大学;2005年
9 吕青普;科技文档的分类与查重[D];天津财经大学;2007年
10 宋光鹏;文本的情感倾向分析研究[D];北京邮电大学;2008年
【二级引证文献】
中国期刊全文数据库 前4条
1 申俊义;杜冬霞;谢红薇;;应急预案数字化系统的研究与实现[J];科技情报开发与经济;2008年36期
2 张超;裴玉起;邱华;;国内外数字化应急预案技术发展现状与趋势[J];中国安全生产科学技术;2010年05期
3 梁大鹏;胡卓玮;;突发性水污染事件应急预案的可视化平台研究[J];首都师范大学学报(自然科学版);2013年05期
4 杨涛;吴承玉;姜荣荣;;中国期刊全文数据库2003-2013年证素文献评析[J];云南中医学院学报;2013年03期
中国博士学位论文全文数据库 前1条
1 黄健;城市供水水质监测与预警平台构建及关键技术研究[D];中国地质大学(北京);2011年
中国硕士学位论文全文数据库 前10条
1 苏联华;环境保护动态监测及应急管理系统的设计与实现[D];复旦大学;2010年
2 卢鲁;茂名应急协同决策信息平台的设计与实现[D];天津大学;2010年
3 龚静;小学体育安全问题的规避与应对策略[D];湖南科技大学;2011年
4 李英;氯碱化工企业环境风险控制研究[D];天津大学;2012年
5 张继永;基于孕灾环境的突发事件连锁反应模型研究[D];大连理工大学;2010年
6 吴悠;基于知识元的应急决策活动基元模型研究[D];大连理工大学;2012年
7 张璐;基于本体的城市轨道应急预案数字化方法及应用[D];北京交通大学;2012年
8 江红芳;我国突发事件应急预案管理研究[D];新疆大学;2012年
9 衡量;应急预案生成系统的设计与实现[D];西安电子科技大学;2012年
10 赵佳;基于过程描述的应急案例本体模型研究[D];首都师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 张德鑫;“水至清则无鱼”——我的新生词语规范观[J];北京大学学报(哲学社会科学版);2000年05期
2 梁南元;书面汉语的自动分词与一个自动分词系统—CDWS[J];北京航空学院学报;1984年04期
3 高军,陈锡先;无监督的动态分词方法[J];北京邮电大学学报;1997年04期
4 余洪明,冉棋文,蒋斌;知识经济时代的知识管理[J];财金贸易;1999年03期
5 朱靖波,姚天顺;词义自动消歧概率模型[J];东北大学学报;2000年05期
6 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
7 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
8 汪丁丁;知识的经济学性质[J];读书;1995年12期
9 吴佑寿,丁晓青;树分类器性能分析[J];电子学报;1991年04期
10 黄萱菁,吴立德,郭以昆,刘秉伟;现代汉语熵的计算及语言模型中稀疏事件的概率估计[J];电子学报;2000年08期
中国重要会议论文全文数据库 前10条
1 徐时仪;;数据库建设与断代词典编纂[A];中国辞书论集2000[C];2000年
2 史建桥;;利用计算机技术制作《古今汉语词典》检字表[A];中国辞书论集2000[C];2000年
3 章宜华;;电子词典编纂的一般原则[A];中国辞书论集2000[C];2000年
4 高永伟;;网络时代的词典编纂[A];中国辞书论集2000[C];2000年
5 张国强;;数据库化的辞书编纂[A];中国辞书论集2000[C];2000年
6 隋岩;张普;;基于动态流通语料库的“动态词典”编纂[A];中国辞书论集2000[C];2000年
7 郭启新;杨蔚;;英汉双语语料库的建立与英汉词典的编纂[A];中国辞书论集2000[C];2000年
8 张锦文;;国外在线语料库与英语在线词典管窥[A];中国辞书论集2000[C];2000年
9 李晓红;;百科全书信息管理数据库的设计及实现[A];中国辞书论集2000[C];2000年
10 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前1条
1 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
中国硕士学位论文全文数据库 前1条
1 周孟霞;基于规则学习的中医药文献自动标引系统[D];浙江大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 曹兴;栗亮亮;;基于项目负责人制的科研项目管理研究[J];科学学与科学技术管理;2006年10期
2 刘雪峰;王剑冰;;科研项目中的互动式管理[J];航天工业管理;2010年04期
3 金维亚;陆兴培;;推进科技管理体制改革 科学高效管好科研项目——论科研项目的管理创新[J];安徽科技;2008年05期
4 刘艳妮,张严峰,刘珠梅,张都应;关于推进项目管理信息化建设的几点建议[J];技术与创新管理;2004年04期
5 吴剑娟;;浅论科研项目的全过程管理[J];经济问题探索;2007年09期
6 陈颖姣;何贤;王忠;林玲;;借鉴现代项目管理理论 提升科研项目管理水平[J];科技管理研究;2010年24期
7 李峰,魏翠兰,余秋英;加强农业科研项目组织管理及成果推广工作的思考[J];江西农业大学学报(社会科学版);2003年03期
8 邓树宁;徐凤霞;倪旭谰;;让项目管理向信息化迈进[J];中国机电工业;2008年01期
9 杜欣庄;阮永军;;科研项目管理信息系统的设计[J];金山油化纤;2006年01期
10 吴家成;;知识管理背景下的高校科研项目管理[J];中小企业管理与科技(下旬刊);2011年02期
中国重要会议论文全文数据库 前10条
1 陈颖姣;何贤;王忠;林玲;;借鉴现代项目管理理论 提升科研项目管理水平[A];中华医学会第12次全国医学科学研究管理学学术年会资料汇编[C];2010年
2 陈瑛;周波;;科研项目管理信息化系统的设计与研发[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
3 刘治;汤彦红;屈春燕;王立红;王立云;郝永伟;朱燕民;;Web与数据库的集成及其在科研项目管理中的应用[A];2000年中国地球物理学会年刊——中国地球物理学会第十六届年会论文集[C];2000年
4 张斌;程立新;侯峰;李常胜;杜连华;金莉荣;吴岩;;内蒙古医学院的科研管理信息系统的设计与实现[A];中华医学会第12次全国医学科学研究管理学学术年会资料汇编[C];2010年
5 何彬方;冯妍;杨会文;吴文玉;张苏;;基于B/S模式的气候观象台科研管理系统构建[A];2009第五届苏皖两省大气探测、环境遥感与电子技术学术研讨会专辑[C];2009年
6 文爱军;王伟;;ESB在一级部署业务系统中的应用[A];2011电力通信管理暨智能电网通信技术论坛论文集[C];2011年
7 冯俊文;顾昌耀;;基于资源约束的R&D项目选择模型及其决策方法[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
8 潘宣;张树良;吕晶;吴志宏;;基于网络的开放式科研管理系统研究[A];中华医学会第12次全国医学科学研究管理学学术年会资料汇编[C];2010年
9 王虹;;提高科研管理水平,提升高职院校可持续发展能力[A];2009无锡职教教师论坛论文集[C];2009年
10 颜峻;侯风华;黄莉;徐胜;;防范学术不端,净化高校学风——使用“学术不端文献检测系统”的体会[A];第十届中国科技期刊青年编辑学术研讨会暨新世纪初十年科技期刊发展回顾与未来展望论坛文集[C];2010年
中国重要报纸全文数据库 前10条
1 记者 李兵 通讯员 张明波;实行科研项目管理“十卡”制[N];中国石油报;2004年
2 闵信;国家民委出台科研项目管理办法[N];中国民族报;2010年
3 本报记者 王新佳;科研项目管理走向市场[N];中国高新技术产业导报;2002年
4 叶婧瑜 陈枫;是传播经验 更是播撒火种[N];中国航天报;2011年
5 温玉梅;将科研项目管理推向市场[N];中国黄金报;2003年
6 温玉梅;把科研项目管理推向市场化[N];中国矿业报;2003年
7 ;司法部法规教育司负责人谈部级科研项目管理办法[N];法制日报;2001年
8 乔建良 袁宁 蒋世龙;818万科技专项资金落户桃城[N];衡水日报;2009年
9 记者 付毅飞;中科院研究员段振豪涉嫌贪污被刑拘[N];科技日报;2011年
10 张贵志;为有源头活水来[N];中国石油报;2004年
中国博士学位论文全文数据库 前2条
1 阳沛湘;医学科研项目的知识管理研究[D];中国人民解放军军事医学科学院;2010年
2 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 李庆;吉林油田科研项目管理研究[D];东北师范大学;2010年
2 应晓春;宁波大红鹰学院科研项目管理研究[D];浙江工业大学;2013年
3 张一帆;高校科技成果管理中的问题与对策研究[D];吉林大学;2014年
4 田卫;基于.Net的某部科研项目管理信息系统设计与实现[D];电子科技大学;2012年
5 耿业仙;基于C/S模式的科研项目管理系统设计与实现[D];电子科技大学;2012年
6 马明德;NS公司的科研项目管理研究[D];宁夏大学;2014年
7 甘婷;高校科研项目管理系统设计与实现[D];华中科技大学;2011年
8 徐民;千佛山医院科研项目管理系统的设计与实现[D];山东大学;2012年
9 张勇;省级商检局科研项目管理系统设计与实现[D];电子科技大学;2013年
10 赵丽霞;项目管理在高校科研管理中的应用研究[D];南昌大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026