收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

数据模板匹配研究及在社保审计中的应用

刘国峰  
【摘要】: 社会保障关系到人民群众的切身利益,因此对其进行相应的监督和审查是审计工作的重中之重。由于社保信息系统的多样性和异构性,在将社保数据库中的数据导入到审计数据库中时,经常会遇到数据项不一致的情况。目前解决该问题的方法是由审计人员对双方数据模板进行分析,手工建立二者间的对应关系。虽然该方法具有较高的准确度,却需要花费大量的时间和精力。因此实现社保审计数据模板的半自动/自动匹配,已成为审计机关亟待解决的问题。 本文从模式匹配入手,结合已有的国内外模式匹配技术研究社保审计数据模板匹配方法,对数据模板手工匹配遇到的匹配空间过大难于确定匹配范围、名称不规则难于发现匹配关系等问题进行深入分析,设计出一种融合语义的社保审计数据模板匹配模型,围绕该模型中模式分类和匹配生成两个主要部分的构建进行研究,主要包括:模式分类部分中社保审计数据模板模式类别划分、分类信息提取及处理、基于朴素贝叶斯模式分类方法的实现、基于知网模式分类方法的实现以及分类结果的合并,匹配生成部分中基于语义相似度传播的模式匹配生成以及匹配结果选择等。 最后,本文通过实验验证社保审计数据模板匹配模型,并对实验结果进行对比分析,最终验证该模型在社会保障审计领域执行数据模板匹配过程中的正确性与高效性。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:F239.6;F842.6;F224

【参考文献】
中国期刊全文数据库 前10条
1 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
2 张治;施鹏飞;;一种有效的贪婪模式匹配算法[J];计算机研究与发展;2007年11期
3 张凌宇;刘国华;褚兵义;王聪;麻会东;苑迎;;基于源模式分裂的模式匹配算法[J];计算机研究与发展;2008年S1期
4 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期
5 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
6 于波;唐世渭;张鹏;童云海;;基于实体分类的数据库模式匹配方法[J];计算机科学;2004年10期
7 程伟;周龙骧;林河水;孙玉芳;;一种多策略通用模式匹配方法[J];计算机科学;2004年11期
8 李由;刘东波;张维明;;基于数据实例分布特征的自动模式匹配方法[J];计算机科学;2005年11期
9 余恩运;申德荣;张旭;王广奇;于戈;;SMGM:一种基于模式结构和已有匹配知识的模式匹配模型[J];计算机科学;2007年03期
10 万狄飞;樊兴华;王国胤;;基于朴素贝叶斯和遗传算法的两类文本分类方法[J];计算机科学;2008年04期
【共引文献】
中国期刊全文数据库 前10条
1 陈祥松,邓苏,黄宏斌;GLAV集成方法中的模式匹配研究[J];安徽工程科技学院学报(自然科学版);2004年04期
2 白晓梅;张福利;;校园网中文搜索引擎系统的设计[J];鞍山师范学院学报;2006年06期
3 耿新青;陶凤梅;黄宏光;;一种基于近邻匹配的中文分词算法Jlppeccz[J];鞍山师范学院学报;2010年04期
4 王宏鼎;谭少华;唐世渭;杨冬青;童云海;;基于模式元素语义关系的模式合并方法研究[J];北京大学学报(自然科学版)网络版(预印本);2006年04期
5 王宏鼎;谭少华;唐世渭;杨冬青;童云海;;基于模式元素语义关系的模式合并方法研究[J];北京大学学报(自然科学版);2007年03期
6 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
7 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
8 张维蔚;李超;曾骁;熊璋;;一种多策略GML应用模式匹配方法[J];北京航空航天大学学报;2008年05期
9 周世斌;白敬华;刘玉树;;统计流形上基于核近邻算法的文本分类研究[J];北京理工大学学报;2010年03期
10 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
中国重要会议论文全文数据库 前10条
1 ;Discovering Complex Matches Between Database Schemas[A];第二十七届中国控制会议论文集[C];2008年
2 孙科武;许斌;罗森;;属性驱动的Web服务分类方法[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
4 王育红;陈军;;GIS客户数据库更新自动化实施算法研究[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
5 王育红;蒋捷;;基础地理信息的客户更新服务问题[A];中国地理信息系统协会第八届年会论文集[C];2004年
6 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
7 佟冰;张忠平;宋丽;;一种改进的多源模式匹配算法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
8 刘通;刘国华;刘欣;王聪;;ISMD:一种基于副本的完整模式匹配算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 钱颖;刘国华;张忠平;沈兵红;张凌宇;;基于聚类的模式匹配方法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
10 刘杰;李伟光;刘振广;;基于BP神经网络的数据库模式匹配方法研究[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
2 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
3 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
4 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
5 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
6 宋雅娟;Web服务组合方法研究[D];吉林大学;2011年
7 杨峰;本体映射关键技术研究[D];吉林大学;2011年
8 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
9 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
10 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 徐扬;异构数据资源汇聚的模式及优化问题研究[D];山东科技大学;2010年
3 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
4 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
5 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
6 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
7 张燕丽;基于Winnow算法和CAPTCHA的垃圾短信过滤研究[D];郑州大学;2010年
8 曾祥莉;ETL在经济普查信息发布系统中的应用研究[D];哈尔滨工程大学;2010年
9 李伟光;基于BP神经网络的数据库模式匹配方法研究[D];哈尔滨工程大学;2010年
10 刘洁;基于关联挖掘的深层网络接口模式匹配方法的研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
2 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
3 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期
4 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
5 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期
6 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
7 孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期
8 孙建军,陈肇雄,薛选民,郭喜林,侯敏;基于多功能逻辑运算分析技术的汉语分词[J];计算机研究与发展;1998年05期
9 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
10 湛燕,陈昊,袁方,王熙照;基于中文文本分类的分词方法研究[J];计算机工程与应用;2003年23期
【相似文献】
中国期刊全文数据库 前10条
1 俞燕燕;;OLAP多维分析——流通行业审计新思路[J];商场现代化;2008年16期
2 李宜南;;浅谈计算机技术在审计中的应用[J];商场现代化;2009年13期
3 肖红彦;张红霞;;审计数据抽样分析系统开发[J];武汉理工大学学报(信息与管理工程版);2006年09期
4 张海霞;;计算机审计风险的形成与防范[J];湘潮(下半月)(理论);2007年08期
5 罗振宇;;基于OLAP的审计软件的用例设计[J];中国管理信息化;2008年01期
6 王旭;;基于XBRL GL的审计数据转换实现[J];福建财会管理干部学院学报;2009年04期
7 汤昌平;;“普九”债务审计质量控制具体作法[J];审计月刊;2007年04期
8 李国清;;工程项目审计中审计质量控制的思考[J];企业导报;2009年09期
9 程军;王晨;;联网审计应注意的几个问题[J];审计月刊;2007年04期
10 施永香;;基于Benford法则的审计数据分析方法[J];中国管理信息化;2010年11期
中国重要会议论文全文数据库 前10条
1 钱桂琼;许榕生;;网络入侵取证审计数据分析技术的研究[A];第十七次全国计算机安全学术交流会暨电子政务安全研讨会论文集[C];2002年
2 杨涛;王志刚;沈昌祥;曾梅;李晓勇;;一个安全操作系统SUNIX审计子系统的设计与实现[A];第八次全国计算机安全学术交流会论文集[C];1993年
3 王志刚;钱兴坤;王东亮;;基于PCA的多信息源实时网络入侵检测[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
4 杨峰;梁生吉;贾春福;;基于LSM的Linux安全审计系统设计[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
5 阮耀平;戴英侠;赵战生;;通过入侵检测提高系统安全性[A];第14届全国计算机安全学术交流会论文集[C];1999年
6 余漱峰;刘瑞武;;现行通用审计软件设计观念变革[A];第九届全国会计信息化年会论文集(上)[C];2010年
7 徐德启;黄春晖;贾存虎;冀佩刚;;防御木马后门的HIDS研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
8 卫婧怡;;财政安全审计系统的设计[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
9 杨宗波;宗容;常俊;彭广军;;入侵检测中Apriori算法的研究与改进[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
10 刘相楠;;计算机审计风险及其防范[A];2007煤炭经济研究文选[C];2007年
中国重要报纸全文数据库 前10条
1 熊宛姣 阎靖;国家审计数据中心机房项目通过验收[N];中国审计报;2010年
2 记者 杜宇;触目惊心的五组审计数据[N];新华每日电讯;2010年
3 王波;长春办审计数据存储中心正式成立[N];中国审计报;2006年
4 陈霞;审计风暴过后应是责任风暴[N];厦门日报;2007年
5 本报通讯员;兰州办积极探索海量数据处理新模式[N];中国审计报;2007年
6 记者 彭磊;江城今年审出违纪资金12亿元[N];湖北日报;2010年
7 熊飞;团风审计大打组合拳全面提升业务水平[N];中国审计报;2009年
8 张凯峰;云南审计厅“十二五”全力推进审计数字化[N];中国审计报;2010年
9 本报通讯员;《计算机审计数据采集与处理技术》二期课题通过科技部专家组验收[N];中国审计报;2006年
10 朱闵;浅谈企业核心应用的安全审计(上)[N];网络世界;2008年
中国博士学位论文全文数据库 前4条
1 张岳公;基于代理的对等分布式入侵检测系统研究[D];山东大学;2006年
2 许舟军;基于异常分析的入侵检测关键技术研究[D];天津大学;2006年
3 田新广;基于主机的入侵检测方法研究[D];国防科学技术大学;2005年
4 张相锋;安全审计与基于审计的入侵检测[D];中国科学院研究生院(软件研究所);2004年
中国硕士学位论文全文数据库 前10条
1 崔超;基于数据挖掘技术联网审计数据质量控制的研究[D];河南理工大学;2010年
2 周平高;基于行为规则的数据库入侵检测研究[D];华中科技大学;2007年
3 沈洁;一个用于辅助审计的数据仓库的设计与实现[D];苏州大学;2007年
4 赖丽;基于Oracle的数据库安全审计技术研究[D];四川师范大学;2009年
5 帖亚辉;基于BEEP的SYSLOG审计数据安全通信框架研究[D];解放军信息工程大学;2008年
6 叶军;涉外税务审计信息系统的设计和实现[D];苏州大学;2006年
7 陶振海;数据挖掘算法在行政审计中的应用[D];上海交通大学;2007年
8 李峰;枣庄学院一卡通中网络安全的分析研究[D];华东师范大学;2008年
9 闫龙;基于代理的数据库入侵检测技术研究[D];北京理工大学;2008年
10 高彩容;基于数据挖掘的网络安全审计技术研究[D];西安电子科技大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026