收藏本站
《大连海事大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于用户特征的文件分类技术研究

赵露  
【摘要】:随着计算机应用的日益普及,数字化文件已逐渐替代传统纸质文档而成为各类文件存储和交换的主要形式。在日常文件管理中由于自然人在文件管理中自身内隐性记忆的不确定性,导致随着时间的不断推移和文件数量的持续递增,各个类别中文件的语义会逐渐偏离原类别的语义,进而导致原始文件分类的失效并造成文件管理混乱。针对这一问题的存在具有普遍性,同时作为传统文本分类研究的逆向工程,具有一定的学术研究价值和现实意义。 论文从用户文件分类管理过程的问题域特征分析入手,在充分借鉴、融合现有文本分类、自然语义理解、知识挖掘和机器学习等相关领域取得的研究成果基础之上,围绕基于用户分类习惯及语义理解特征的文件分类管理技术,从基于自然语言的文本语义特征提取、用户分类习惯与语义理解特征识别以及半监督学习机制的设计等三方面开展了以下探索性研究工作: 首先对国内外相关领域文献收集整理的基础上,结合文本分类、自然语义分析和知识挖掘领域研究成果以及对文件分类管理问题特征分析,提出了课题研究的基本思路和技术路线; 其次,针对文本语义特征提取技术,结合研究课题的问题域特征,考虑具体实现和计算法复杂性等方面问题,提出了基于SUMO本体概念的文本语义表示模型。在此基础上运用粗糙集理对用户文件分类规则进行提取,借鉴基于条件熵的启发式属性约简算法,提取出用户的分类规则,构建了文件分类模拟器; 第三,为提高文件分类模拟器的预测精度并不断强化用户关于文件分类的内隐性记忆,提出以人机交互方式对文件分类模拟器的分类规则进行增量学习方法,并针对学习策略中完全匹配与部分匹配的缺点,提出一种基于相似度的匹配算法,并对规则的增量学习算法进行了初步研究。 最后,结合论文研究的理论成果,对基于用户文件分类及语义理解习惯的计算机辅助文件分类管理系统进行了初步设计和原型开发,同时借助原型系统对主要的研究成果进行了实验验证。
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1;TP181

【参考文献】
中国期刊全文数据库 前10条
1 张宁,贾自艳,史忠植;使用KNN算法的文本分类[J];计算机工程;2005年08期
2 王明春,王正欧,张楷,郝玺龙;一种基于CHI值特征选取的粗糙集文本分类规则抽取方法[J];计算机应用;2005年05期
3 张雪英;Jürgen Krause;刘凤玉;;文本自动分类中的动态类别扩展研究[J];计算机应用研究;2007年05期
4 侯凡;周明全;耿国华;李杰;;基于粗糙集的文本分类方法在网络科技资源应用集成环境中的应用[J];计算机应用与软件;2009年03期
5 张东礼,汪东升,郑纬民;基于VSM的中文文本分类系统的设计与实现[J];清华大学学报(自然科学版);2003年09期
6 常犁云,263.net,王国胤,263.net,吴渝,263.net;一种基于Rough Set理论的属性约简及规则提取方法[J];软件学报;1999年11期
7 王国胤,何晓;一种不确定性条件下的自主式知识学习模型[J];软件学报;2003年06期
8 石峰,娄臻亮,张永清;一种改进的粗糙集属性约简启发式算法[J];上海交通大学学报;2002年04期
9 李海蓉;;基于概念向量空间的文档语义分类模型研究[J];图书情报工作;2011年24期
10 于洪,杨大春,吴中福;基于Rough set理论的增量式规则获取算法[J];小型微型计算机系统;2005年01期
中国博士学位论文全文数据库 前1条
1 傅俊元;中国建筑企业成长能力研究[D];北京交通大学;2008年
中国硕士学位论文全文数据库 前8条
1 徐欣;基于粗糙集理论的文本分类研究[D];浙江理工大学;2011年
2 杨涛;基于Rough集的数据约简研究[D];安徽大学;2005年
3 杨淑棉;粗糙集在文本分类系统中的应用研究[D];山东师范大学;2007年
4 孔晨妍;基于RSS聚合和本体检索的博客系统设计与实现[D];南京农业大学;2007年
5 王嘉树;基于Struts架构下的教学资源库的设计与实现[D];北京交通大学;2008年
6 宋丽平;文本分类中特征选择方法的研究[D];西安科技大学;2009年
7 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
8 田文颖;面向专业领域的文本特征提取技术研究[D];国防科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 谢涛,蒋泽中;边坡系统稳定性多模型综合评价[J];四川建筑科学研究;2004年02期
2 张艳;张海军;;基于DSP的多通道超声波连续测厚系统的研究[J];安徽工程科技学院学报(自然科学版);2008年03期
3 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
4 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
5 孙虹;龚雪;;一种基于Rough集和RBF网络的模拟电路故障诊断方法[J];安徽建筑工业学院学报(自然科学版);2012年03期
6 胡凤莲;刘宏;;安康市烟草病害预测系统研究[J];安徽农学通报(上半月刊);2012年03期
7 方惠敏;张守涛;丁文珂;;基于BP神经网络的玉米区试产量预测研究[J];安徽农业科学;2007年34期
8 符保龙;;RBF网络在农业病虫害预测中的应用研究[J];安徽农业科学;2008年01期
9 李磊;孙卉;翟秋敏;郭志永;;RBF神经网络在平顶山市地表水评价中的应用[J];安徽农业科学;2008年26期
10 张帅;李琳一;袁涛;王梅玉;;信息技术在害虫时空动态模拟中的应用[J];安徽农业科学;2009年07期
中国重要会议论文全文数据库 前10条
1 田艳兵;;BP算法和PSO算法在神经网络中的研究[A];第二十九届中国控制会议论文集[C];2010年
2 王新宇;孙冠;韩冬;张婷;;基于一种改进神经网络的数据手套手势识别[A];第二十九届中国控制会议论文集[C];2010年
3 何平;潘国峰;李琳;夏克文;赵红东;;基于LS-SVR的压力传感器温度补偿[A];第二十九届中国控制会议论文集[C];2010年
4 仉宝玉;陈义俊;;前馈神经网络快速学习算法及应用[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
5 李石华;金宝轩;;基于Matlab的自组织神经网络在地形复杂区遥感图像分类中的应用研究[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
6 王海荣;;石油化工企业的静电火灾隐患评估[A];节能环保 和谐发展——2007中国科协年会论文集(四)[C];2007年
7 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
8 游凤荷;游汛;;粗糙集的约简算法在涡流传感器设计中的应用[A];2007'湖北·武汉NDT学术年会论文集[C];2007年
9 颜伏伍;王洪建;田韶鹏;袁智军;;BP神经网络在发动机万有特性中的应用[A];湖北省内燃机学会2009年学术年会论文集[C];2009年
10 张铮;苏旭武;张道德;陈学锋;;装载机故障诊断属性约简算法[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年
中国博士学位论文全文数据库 前10条
1 冷欣;船用增压锅炉汽包水位预测控制方法研究[D];哈尔滨工程大学;2009年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 冯麟涵;舰船系统抗冲击性能全局优化方法研究[D];哈尔滨工程大学;2009年
4 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
5 陈发祥;知识管理绩效与组织文化相关性研究[D];合肥工业大学;2010年
6 江庭谊;知识管理、企业文化与组织效能关系研究[D];南开大学;2010年
7 韩赟;高技术虚拟企业(HTVE)知识管理模式研究[D];哈尔滨理工大学;2009年
8 王小龙;建设工程数字化管理体系研究[D];北京交通大学;2010年
9 张寿明;基于冶炼过程及终点判断技术的烟化炉智能控制系统研究[D];昆明理工大学;2009年
10 车勇;轮胎噪声的预测方法与试验研究及优化设计[D];武汉理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 王浩锋;基于BP神经网络的航段安全评估研究[D];中国工程物理研究院;2010年
2 代宏伟;布里渊散射水下探测目标的自动识别[D];南昌航空大学;2010年
3 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
4 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
5 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
6 徐小任;基于BP神经网络的城镇网络地价评估模型研究[D];广西师范学院;2010年
7 黄志钦;珠三角产业集群发展及其对广西的借鉴[D];广西师范学院;2010年
8 何健;集成过程的知识协同模型、方法与技术研究[D];浙江理工大学;2010年
9 吴家瑞;服装产品加工成本快速估算方法研究[D];浙江理工大学;2010年
10 范不井;某地区电网短期负荷预测研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
3 张兆芹;;个体学习、组织学习与学习型组织之辨析[J];比较教育研究;2006年08期
4 曹元大,贺海军,涂哲明;中文Web文档全文检索系统的设计及实现[J];北京理工大学学报;2002年01期
5 石中英;缄默知识与教学改革[J];北京师范大学学报(人文社会科学版);2001年03期
6 马璐,胡江娴;企业成长性分析与评价[J];商业研究;2005年07期
7 王国胤;刘静;胡峰;;基于断点辨别力的粗糙集离散化算法[J];重庆邮电大学学报(自然科学版);2009年03期
8 黄尚勇;企业资源利用方式的战略转变[J];成都大学学报(自然科学版);2004年04期
9 戴明;建筑企业项目管理:问题与对策[J];长江建设;2001年04期
10 陈晓红,彭佳,吴小瑾;基于突变级数法的中小企业成长性评价模型研究[J];财经研究;2004年11期
中国博士学位论文全文数据库 前8条
1 吕文学;我国大型建筑企业竞争力及其提升途径研究[D];天津大学;2004年
2 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
3 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
4 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
5 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
6 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
7 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
8 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
中国硕士学位论文全文数据库 前10条
1 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
2 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
3 秦春秀;基于本体的Web信息检索系统及其关键技术研究[D];西安电子科技大学;2005年
4 刘兆臻;基于RSS的网络学习内容聚合系统研究[D];华东师范大学;2005年
5 胡坚;基于本体的机械产品领域智能信息检索系统研究[D];浙江工业大学;2005年
6 陆伟忠;基于本体论的信息检索框架[D];武汉大学;2005年
7 陈琮;基于Jena的本体检索模型设计与实现[D];武汉大学;2005年
8 谢平;基于J2EE的盐业管理系统的设计与实现[D];重庆大学;2005年
9 汪卫星;基于轻量级J2EE框架的卫生管理系统设计与实现[D];重庆大学;2005年
10 俞传正;基于博客的个人知识管理平台研究[D];天津师范大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 李兆明;文件分类与案卷分类的区别与联系[J];档案;2000年05期
2 萧嵘,王继成,孙正兴,张福炎;一种SVM增量学习算法[J];南京大学学报(自然科学版);2002年02期
3 陶品,张钹,叶榛;构造型神经网络双交叉覆盖增量学习算法[J];软件学报;2003年02期
4 彭彬彬,孙正兴,金翔宇;多值分类环境下基于SVM增量学习的用户适应性研究(英文)[J];南京大学学报(自然科学版);2004年02期
5 姜卯生,王浩,姚宏亮;朴素贝叶斯分类器增量学习序列算法研究[J];计算机工程与应用;2004年14期
6 景博,李剑,钱越英;一种协商在线增量学习算法及其在基于智能体的电子商务中的应用[J];计算机工程与应用;2005年02期
7 吴飞,庄越挺,潘云鹤;基于增量学习支持向量机的音频例子识别与检索[J];计算机研究与发展;2003年07期
8 杨森,徐海涛,柴乔林;应用支持向量机实现增量入侵检测[J];计算机工程与应用;2004年27期
9 滕月阳,唐焕文,张海霞;一种新的支持向量机增量学习算法[J];计算机工程与应用;2004年36期
10 张仕华;王学业;;增量回归支持向量机改进学习算法[J];计算机工程与应用;2006年03期
中国重要会议论文全文数据库 前10条
1 聂力;王翰虎;;一个基于粗糙集理论的分类规则学习算法[A];第十六届全国数据库学术会议论文集[C];1999年
2 李通;刘昌钰;唐常杰;左劼;于中华;;基于自然语言理解技术的Web文件分类与过滤[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
3 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
5 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
7 赵明清;陶树平;;基于模糊等价关系的粗糙集[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
10 赵荣珍;杨娟;黄显华;;粗糙集理论的故障知识发现及其工程应用模式研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 ;文件分类应对ILM[N];网络世界;2005年
2 潘文富;帮经销商整改办公室[N];医药经济报;2006年
3 黑龙江 wolf;Workslink2.0——全新演绎P2P[N];电脑报;2002年
4 ;手机U盘攻略[N];电子报;2008年
5 海王星;P2P在千锤百炼中成长[N];中国电脑教育报;2002年
6 李樱;奥组委竞赛团队进入“前线”[N];人民日报海外版;2007年
7 刘娜 本报记者  赵莹;打通走向世界之路[N];中国医药报;2006年
8 于国君;历史的档案员[N];中华读书报;2007年
9 王艳凤;档案管理 责无旁贷[N];中国财经报;2003年
10 广东省广州科唯仪器有限公司 张杰;我的“质管经”[N];中国质量报;2007年
中国博士学位论文全文数据库 前10条
1 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
2 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
3 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
4 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
5 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
6 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
7 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
8 贾修一;基于语义的粗糙集理论和模型研究[D];南京大学;2011年
9 哈斯巴干;神经网络及其组合算法的遥感数据分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
10 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 赵露;基于用户特征的文件分类技术研究[D];大连海事大学;2013年
2 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
3 雷明;基于粗糙集理论的决策表压缩[D];华北电力大学(北京);2010年
4 杜玲;覆盖算法的增量学习研究[D];安徽大学;2010年
5 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
6 吕望;基于粗糙集的车辆超载自动检测方法研究[D];长沙理工大学;2010年
7 田静宜;基于粗糙集和神经网络的柴油机故障诊断研究[D];中北大学;2011年
8 张贤勇;粗糙集的数学基础研究与两个广义粗糙集模型的探讨[D];四川师范大学;2004年
9 袁晓娟;基于粒计算的双论域粗糙集模型研究[D];兰州大学;2010年
10 武金艳;粗糙集与证据理论在医疗智能诊断系统中的应用研究[D];湖南大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026