收藏本站
《辽宁工程技术大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

核心能力评价系统的分类模块研究

沈贺丹  
【摘要】:最近一份Forrest Research的统计资料指出:在Internet和Intranet中80%以上的数据都是以非结构化的形式存在。因此,对这些非结构化的信息进行知识发现,难度将会更大,但其意义也将更加重大。而对于这些文本信息的分析和处理主要是结合了Web文本挖掘的方法和技术。其中分类技术是文本挖掘的核心。本文主要研究核心能力评价系统的分类模块,解决如何对大量杂乱的信息进行分类的问题。 首先,提出了本文研究的问题,对web文本挖掘的当前国内外现状进行综述。进而确定把文本分类技术作为重点研究对象。 其次,对文本挖掘分类技术的基础理论进行概述和深入剖析,选择向量空间模型为分类模块的分类算法。 然后,针对传统特征权重算法的不足,提出了一种基于概念并考虑分布信息的特征权重算法。 接着,根据文本挖掘的一般处理过程,详细设计并实现了该核心能力评价系统的分类模块。同时也验证了改进特征权重算法在查全率和查准率方面都优于传统特征权重算法。 最后,并总结和展望进一步研究的方向。
【学位授予单位】:辽宁工程技术大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.52

【参考文献】
中国期刊全文数据库 前10条
1 章兰,杨季文,江浩;基于VSM模型的动态文本分类器的设计[J];河海大学常州分校学报;2004年02期
2 李晓明,朱家稷,闫宏飞;互联网上主题信息的一种收集与处理模型及其应用[J];计算机研究与发展;2003年12期
3 李永平,程莉,叶卫国;基于隐含语义的kNN文本分类研究[J];计算机工程与应用;2004年06期
4 刘云峰,齐欢,代建民;潜在语义分析在中文信息处理中的应用[J];计算机工程与应用;2005年03期
5 李开荣,林颖,杭月芹;基于语义模型的文档特征提取[J];计算机工程与应用;2005年17期
6 陈建华,包煊;Web挖掘系统的设计与实现[J];计算机工程;2002年08期
7 王胜明,潘卫华,孙淑淇;一种搜索引擎的新体系结构[J];计算机工程;2003年11期
8 梅馨,邢桂芬;文本挖掘技术综述[J];江苏大学学报(自然科学版);2003年05期
9 涂承胜,鲁明羽,陆玉昌;Web内容挖掘技术研究[J];计算机应用研究;2003年11期
10 盖杰,王怡,武港山;潜在语义分析理论及其应用[J];计算机应用研究;2004年03期
【共引文献】
中国期刊全文数据库 前10条
1 汪小寒;项响琴;陈洁;;燃料管理与智能分析网络系统设计与实现[J];安徽教育学院学报;2006年03期
2 谢飞;;支持向量机及其应用研究[J];安徽教育学院学报;2007年03期
3 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
4 段震,鲁杰,张铃;基于交叉覆盖神经网络的车牌识别研究[J];安徽大学学报(自然科学版);2004年05期
5 贾瑞玉;李永顺;;基于覆盖算法的分类器的设计与应用[J];安徽大学学报(自然科学版);2011年02期
6 吴昊;耿焕同;吴祥;;一种基于聚类分析的BBS主题发现算法研究[J];安徽师范大学学报(自然科学版);2009年01期
7 周华;宓浩;;利用交叉覆盖算法对人寿保险客户进行信用评估[J];安庆师范学院学报(自然科学版);2009年02期
8 储泽楠;;面向电子政务的Web挖掘应用研究[J];安阳工学院学报;2012年02期
9 万鹏飞;杨明;;通信侦察信息处理中的软计算方法[J];兵工自动化;2006年05期
10 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
中国重要会议论文全文数据库 前10条
1 段震;赵姝;;基于商空间理论的车牌定位[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 赵姝;张燕平;张铃;徐峰;;最小覆盖算法[A];第二十六届中国控制会议论文集[C];2007年
3 吴涛;陈黎伟;毛军军;张铃;;一种模糊构造性神经网络及其应用[A];第二十六届中国控制会议论文集[C];2007年
4 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
5 闭剑婷;邓琦;卢佳佳;曹波;;A Model of Bi-directional Translation based on Latent Semantic Analysis[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
6 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
7 李卫东;杨炳儒;李龙星;曲文龙;;基于中心词位置的VSM文本分类算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 ;Fuzzy Classification Algorithm Based on Kernel Covering and its Application[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
9 刘子阳;郭崇慧;;应用支持向量回归方法预测胎儿体重[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
10 王若鹏;徐红敏;石红;;GSVM优化问题的调节熵函数法[A];第十届中国青年信息与管理学者大会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 沈巍;建立股指波动预测模型的方法研究及应用[D];华北电力大学(北京);2011年
3 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
4 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
5 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
6 殷琦;基于社会资本的中小企业信用评价[D];哈尔滨工业大学;2011年
7 单建芳;面向事件的文本表示研究[D];上海大学;2012年
8 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
9 张燕平;基于商空间的构造性数据挖掘方法及应用[D];安徽大学;2003年
10 吴涛;核函数的性质、方法及其在障碍检测中的应用[D];中国人民解放军国防科学技术大学;2003年
中国硕士学位论文全文数据库 前10条
1 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
2 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
3 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
4 周东海;基于记账凭证的高校教育成本数据挖掘研究[D];哈尔滨工程大学;2010年
5 王月;改进的模糊C-均值算法在文本聚类中的应用研究[D];辽宁工程技术大学;2009年
6 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年
7 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
8 王玉丹;基于SVM的汉语依存句法分析研究[D];中国海洋大学;2010年
9 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
10 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
2 李名智;中文搜索引擎:现状、问题及对策[J];大学图书馆学报;1998年06期
3 王建勇,谢正茂,雷鸣,李晓明;近似镜像网页检测算法的研究与评价[J];电子学报;2000年S1期
4 孟涛,闫宏飞,李晓明;一种评价搜索引擎信息覆盖率的模型及其验证[J];电子学报;2003年08期
5 李兴斯;一类不可微优化问题的有效解法[J];中国科学(A辑 数学 物理学 天文学 技术科学);1994年04期
6 张志华,郑南宁,史罡;极大熵聚类算法及其全局收敛性分析[J];中国科学E辑:技术科学;2001年01期
7 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
8 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
9 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
10 林鸿飞;基于示例的文本标题分类机制[J];计算机研究与发展;2001年09期
【相似文献】
中国期刊全文数据库 前10条
1 何国辉;吴礼发;;基于机器学习的文本分类技术的研究[J];计算机与现代化;2009年08期
2 胡燕;吴虎子;钟珞;;中文文本分类中基于词性的特征提取方法研究[J];武汉理工大学学报;2007年04期
3 黄浩;王英林;;面向企业应用的文本自动分类系统的设计和实现[J];计算机应用与软件;2007年11期
4 饶文碧;柯慧燕;;Web文本分类技术研究及其实现[J];计算机技术与发展;2006年03期
5 刘伟成;孙吉红;;基于专题文献的信息内容过滤系统设计[J];武汉科技大学学报(社会科学版);2009年02期
6 金春霞;;Web文本挖掘相关技术研究及应用[J];现代计算机(专业版);2009年03期
7 刘伟成;孙吉红;;基于专题文献的信息内容过滤系统研制与实现[J];图书馆理论与实践;2009年07期
8 鞠小林;陈继红;邵浩然;;基于向量空间模型的分层网页分类方法[J];南通大学学报(自然科学版);2010年01期
9 熊德兰;柴玉梅;;领域内文本褒贬倾向性分类中的特征提取技术[J];微计算机信息;2006年36期
10 龙军;王易;刘高嵩;;基于二叉树多类支持向量机的文本分类研究[J];计算机系统应用;2009年05期
中国重要会议论文全文数据库 前10条
1 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
3 彭复员;余西;武林;徐国华;;基于分形特征的水下图像模糊分类[A];第三届全国信息获取与处理学术会议论文集[C];2005年
4 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
7 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
8 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
9 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
10 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 ;首个符合UOML标准的软件面市[N];科技日报;2006年
2 ;Autonomy系统 从无序的信息到有价的知识[N];中国计算机报;2004年
3 徐昕;让企业迅速转向随需应变[N];中国计算机报;2005年
4 郭莹;全文检索市场空间大[N];中国计算机报;2006年
5 杨丽;神州数码等四家IT企业加盟UOML[N];科技日报;2006年
6 冠;富士施乐推广财务管理服务[N];计算机世界;2008年
7 晓文;中国IT业冲刺国际标准[N];中国经济导报;2006年
8 陈伟;“非结构化档案信息及档案异构数据库管理系统”通过验收[N];中国档案报;2008年
9 本报记者 周锦鸾;高效管理 非结构化信息[N];中国计算机报;2001年
10 胥小红;企业搜索跨入拐点[N];科技日报;2007年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 沈贺丹;核心能力评价系统的分类模块研究[D];辽宁工程技术大学;2006年
2 杨硕;基于VSM文本分类系统的设计与实现[D];大连理工大学;2006年
3 林少波;中文文本分类特征提取方法的研究与实现[D];重庆大学;2011年
4 乔素娟;基于SVM的中文垃圾邮件的识别研究[D];山西财经大学;2006年
5 牛海根;文本挖掘技术在短信文本中的应用研究[D];电子科技大学;2007年
6 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
7 李聪娥;局部线性嵌入在文本分类中的应用[D];河北工业大学;2007年
8 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
9 杨治秋;专题搜索引擎关键技术的研究[D];燕山大学;2006年
10 谭新;基于语义特征提取的PU文本分类的研究与实现[D];吉林大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026