收藏本站
《哈尔滨工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

学位论文预审分配管理系统研究

吕斐斐  
【摘要】:随着计算机技术的飞速发展,人类每天接触到的信息爆炸式的增长,人类的生活节奏越来越快。在这种情况下,人类渴望能够用机器代替大脑的某些功能,帮助他们工作的更加有效率,甚至能够让他们从繁琐的工作中解放出来。本文研究的学位论文预审分配管理系统正是针对管理类研究生论文预审工作,利用人工智能领域中的文本分类技术实现学位论文预审分配管理的自动化、智能化,从而将负责此项工作的老师从繁琐的工作中解放出来,同时也为申请答辩的学员提供网上申请的便利。 研究中将经济与管理学院所有老师的研究方向进行了汇总、分类,并以此为关键词从“维普资讯”中文期刊网上获得了8720篇文本作为数据集(包括训练集和测试集),数据集包含9个类别,营造与房地产、信息管理与信息系统、系统工程、国际贸易、会计学、技术经济、金融学、企业管理、行政管理,包含181个小类,分别为这9大类别下的细分方向。本文在构建系统之前,首先在收集的数据集上,通过实验比较、分析了不同的特征选择算法、分类算法、特征空间维度构建的分类器的分类结果,从中选择准确率最高的算法组合应用于本文研究的系统当中。 在研究的初期,通过实地调研,从实际的业务流程中提炼出了系统应满足的基本业务需求及分类、分配原则。从系统的基本业务需求中,选择预审论文自动分类中涉及的文本分类问题作为本文研究的核心问题,并对预审论文自动分类模型中的文本预处理模块所涉及的词条抽取、特征选择、文本表示三个子模块给出了详细设计。在词条抽取过程中采用正则表达式代替传统的停用词典用于初降维。文本预处理过程中采用数据库存储各类中间数据,并将存储过程应用于特征选择中对词频信息的统计。 本文最终实现了一个基于B/S架构的学位论文预审分配管理系统,此系统现已交由负责此项工作的老师进行测试,系统运行基本稳定、分配结果令人满意,能够满足此项工作的各项要求。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:G311

【参考文献】
中国期刊全文数据库 前10条
1 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
2 马建斌;李滢;滕桂法;王芳;赵洋;;KNN和SVM算法在中文文本自动分类技术上的比较研究[J];河北农业大学学报;2008年03期
3 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报;2005年08期
4 姚振军;黄德根;纪翔宇;;正则表达式在汉英对照中国文化术语抽取中应用[J];大连理工大学学报;2010年02期
5 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
6 王维娜;康耀红;伍小芹;;文本分类中特征选择方法研究[J];信息技术;2008年12期
7 孙铁利;刘延吉;;中文分词技术的研究现状与困难[J];信息技术;2009年07期
8 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
9 王爱华,张铭,杨冬青,唐世渭;PCCS部分聚类分类:一种快速的Web文档聚类方法[J];计算机研究与发展;2001年04期
10 张剑;李春平;;基于WordNet概念向量空间模型的文本分类[J];计算机工程与应用;2006年04期
中国博士学位论文全文数据库 前2条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
2 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
中国硕士学位论文全文数据库 前2条
1 庞剑锋;基于向量空间模型的自反馈的文本分类系统的研究与实现[D];中国科学院研究生院(计算技术研究所);2001年
2 孙爽;基于语义相似度的文本聚类算法的研究[D];南京航空航天大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 胡凌云;胡桂兰;徐勇;李龙澍;;基于Web的新闻文本分类技术的研究[J];安徽大学学报(自然科学版);2010年06期
2 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
3 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
4 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
5 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
6 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
7 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
8 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期
9 邹心遥;姚若河;;基于LSSVM的小子样元器件寿命预测[J];半导体技术;2011年09期
10 李卓远,吴为民,王旸,洪先龙;一种新的光学临近校正方法(英文)[J];半导体学报;2003年12期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
5 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
6 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
7 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 刘友强;李斌;奚宁;陈家骏;;基于双语平行语料的中文缩略语提取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 陈龙;吴志勇;袁春;蒙美玲;蔡莲红;;面向数字版权管理的声纹辅助认证系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
10 颜七笙;;基于PCA-SVM的动态联盟候选伙伴绩效评价方法[A];第十三届中国管理科学学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
3 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
4 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
5 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
6 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
7 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
8 吴锋;基于GPU并行计算的数值模拟与燃煤锅炉系统的优化研究[D];浙江大学;2010年
9 向国齐;支持向量回归机代理模型设计优化及应用研究[D];电子科技大学;2010年
10 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 左宗乐;多移动Agent动态协作在P2P文件共享中的应用研究[D];安徽工程大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
5 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
6 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
7 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
8 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
9 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
10 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
2 王建芬,曹元大;支持向量机在大类别数分类中的应用[J];北京理工大学学报;2001年02期
3 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 刘松业;;正则表达式的Web数据提取研究[J];电脑编程技巧与维护;2008年16期
6 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报(自然科学版);2003年02期
7 李蓉 ,叶世伟 ,史忠植;SVM-KNN分类器——一种提高SVM分类精度的新方法[J];电子学报;2002年05期
8 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
9 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
10 徐晓颖,王晓晔,杜太行;基于Fuzzy ART的K-最近邻分类改进算法[J];河北工业大学学报;2004年06期
中国重要会议论文全文数据库 前1条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国硕士学位论文全文数据库 前1条
1 张猛;文本聚类中参数自动设置技术的研究与实现[D];东北大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 张巨芹;试论高校学位论文档案信息开发工作[J];秘书;2004年12期
2 施明义;关于金融类学位论文的指导和撰写[J];金融科学;1991年02期
3 陈玉凤;毕业生撰写学位论文的信息需求与服务对策[J];福建商业高等专科学校学报;2005年01期
4 朱延福;经济师如何写论文 谈谈经济学学位论文的选题技巧[J];经济师;2000年09期
5 曹敏;;《学位论文写作指南》[J];中国标准导报;2008年07期
6 章锦河,陆林;中国旅游类博士硕士学位论文分析[J];地理科学;2003年04期
7 李建铁;;高等教育学硕士学位论文主题分析必要性研究[J];企业家天地(理论版);2011年05期
8 柴振荣;关于用开展研究工作建议书取代学位论文问题[J];管理科学文摘;1995年06期
9 黄津孚;管理类学士论文现状与评价标准研究[J];首都经济贸易大学学报;2005年01期
10 钱立群;;试论学位论文知识产权的侵权和保护[J];浙江工贸职业技术学院学报;2010年03期
中国重要会议论文全文数据库 前10条
1 章锦河;陆林;;中国旅游类博士硕士学位论文分析[A];地理学会全面建设小康社会——第九次中国青年地理工作者学术研讨会论文摘要集[C];2003年
2 ;附录C 2009年硕士、博士研究生毕业学位论文题录[A];中国工程物理研究院科技年报(2010年版)[C];2011年
3 刘文娟;张重喜;张庆春;崔建强;;体育院校图书馆学位论文垂直信息服务及实例分析[A];第八届全国体育科学大会论文摘要汇编(二)[C];2007年
4 万红;;对学位论文全文数据库的展望[A];北京交通大学图书馆——第四届研讨会论文集[C];2004年
5 沈嵘;;论高校图书馆对毕业生学位论文文献的开发与利用[A];文化大省建设中的图书馆现代化——浙江省图书馆学会第八次学术研讨会论文集[C];2001年
6 严建南;李清;;做好保密 促进利用——高校学位论文档案保密与利用关系的思考[A];中国档案学会第六次全国档案学术讨论会论文集[C];2002年
7 丁娜;郑兰;;对高校图书馆学位论文管理工作的思考[A];北京交通大学图书馆——第四届研讨会论文集[C];2004年
8 张弦;;关于高校图书馆学位论文的几种管理方法分析[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 魏招秀;林红;郝朝举;方奕;辜小汉;游节根;;江西医学院学位论文数据库的开发研制[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
10 许勇;;高校学位论文的版权归属与使用尺度[A];北京交通大学图书馆——第四届研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 邹韧;商业性使用学位论文须作者授权[N];中国新闻出版报;2008年
2 刘海明;仅有“独创声明”还不够[N];大众科技报;2003年
3 ;国防大学学位论文实行“双盲匿名评阅”[N];解放军报;2007年
4 李松黄洁 实习生 徐伟伦;百名硕博告“万方”案开审[N];法制日报;2008年
5 本报记者 焦红艳;谁动了我的学位论文著作权?[N];法制日报;2008年
6 王贤才;学写学位论文[N];健康报;2002年
7 薛子进;研究生的学位论文法律保护问题引争议[N];法制日报;2007年
8 刘庆传;拿什么来为研究生质量把关[N];新华日报;2006年
9 晏 扬;导师不能“师”而不“导”[N];中国教育报;2003年
10 记者 梁小琴;论文无新意 一票就否决[N];人民日报;2005年
中国博士学位论文全文数据库 前10条
1 唐立强;正交各向异性材料裂纹尖端场的研究[D];清华大学;1988年
2 陈伟庆;包头铁水分段预处理提铌反应和平衡状态及铌渣直接用做合金化添加剂的试验研究[D];北京钢铁学院;1985年
3 王道红;学位论文质量管理研究[D];华东师范大学;2005年
4 余俊先;黄芪甲苷和苄达赖氨酸防治糖尿病周围神经病变的药效学、药动学及PD-PK结合模型研究[D];南京医科大学;2006年
5 赵剑华;(一)基于p53-MDM2空间结构的非肽类小分子MDM2阻断剂的初步研究 (二)RA109基因的染色体定位、蛋白的活细胞定位及蛋白原核表达、纯化和鉴定[D];中国协和医科大学;2001年
6 刘纪认;宇宙中的星系际气体[D];中国科学技术大学;2006年
7 露西娜;来自国际贸易的技术外溢[D];复旦大学;2005年
8 刘骞;Annexin Ⅰ在胰腺癌发生过程中的功能研究[D];中国协和医科大学;2005年
9 张盛周;针对c-Met的重组腺病毒介导的siRNA技术在肝癌基因治疗中的实验研究[D];南京师范大学;2005年
10 赵虹;言语反讽的关联理论研究[D];山东大学;2007年
中国硕士学位论文全文数据库 前10条
1 秦霞;学位论文著作权归属及利用问题研究[D];大连海事大学;2014年
2 高立兰;我国学位论文抽检制度研究[D];湘潭大学;2011年
3 Hu Hanxu;[D];四川大学;2005年
4 徐震;2005-2009年在职研究生足球方面学位论文研究现状与影响因素的分析[D];河北师范大学;2011年
5 熊咏梅;学位论文传播中的知识产权问题研究[D];云南大学;2011年
6 曹辉;一些向量值算子在Herz-Morrey空间上的有界性[D];新疆大学;2006年
7 陈龙;教育经济与管理专业硕士研究生学位论文研究[D];上海师范大学;2013年
8 卞玉筱;我国博士研究生延期完成学业问题研究[D];华东师范大学;2012年
9 司津锦;高校学位论文管理系统开发与应用[D];山西师范大学;2010年
10 谢宏秋;“领导下乡”与贫困村治理:基于国家和农民关系研究[D];华中师范大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026