收藏本站
《西安电子科技大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

中文文字差错率统计软件的实现

曹林峰  
【摘要】: 为改变中文文字纠错手段的落后现状,提高新闻出版行业管理和信息化建设的水平,国家新闻出版总署设立了“图书编校质量差错率统计软件”科研项目,旨在开发一种通用的、标准化的中文图书编校质量检测软件。本课题源自该科研项目,主要针对软件开发需要的核心技术和功能实现过程进行技术研究。 文中介绍了中文自动分词和自动查错技术,分析对比了几类技术方法的优劣,给出了改进的、基于统计的语言模型的自动查错模型和软件系统的主要技术模块,重点介绍了实现差错率统计相关功能的方法。 本文以国家相关质量标准为依据,在对中文编校差错分类和差错统计规则分析的基础上,详细描绘了中文文字差错率统计软件的设计和实现过程。本文所涉及的中文编校差错的归类方法、差错数计算方法、中文文档字数的统计方法等,均为首次在软件中实现。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 唐亚伟;亚伟中文速录机的诞生与应用[J];中文信息;1994年05期
2 胡宜课;信息高速公路与中文信息处理技术[J];计算机工程;1996年S1期
3 张俊林;曲为民;杜林;孙玉芳;;跨语言信息检索研究进展[J];计算机科学;2004年07期
4 罗燕;中文信息检索系统中的自然语言理解技术研究[J];图书情报工作;2005年04期
5 谢谦;芮建武;吴健;;编码字符集标准及分类研究[J];中文信息学报;2006年05期
6 陈丹;李宁;李亮;;古文字的联机手写识别研究[J];北京机械工业学院学报;2008年04期
7 林浩;韩冰;杨乐华;;一种基于改进最大匹配快速中文分词算法[J];科技创新导报;2009年09期
8 吴新年;数字图书馆技术之进展[J];图书与情报;2000年02期
9 高定国,龚育昌;现代藏字全集的属性统计研究[J];中文信息学报;2005年01期
10 凌祺,樊孝忠;领域词汇自动获取的研究[J];微机发展;2005年08期
11 翟伟斌;周振柳;蒋卓明;许榕生;;汉语分词词典设计[J];计算机工程与应用;2007年01期
12 祁文青;;一种改进的中文分词算法[J];黄石理工学院学报;2007年04期
13 赵煜;蔡皖东;樊娜;刘念;;采用并行遗传算法的文本分割研究[J];西安交通大学学报;2009年12期
14 陈炼;中文信息处理的工资管理系统软件[J];湖北师范学院学报(自然科学版);1985年02期
15 易蓉湘,何克抗;计算机汉语文稿校对系统[J];计算机研究与发展;1997年05期
16 魏进;常朝稳;;单数组全映射分词词典[J];计算机工程与应用;2007年23期
17 吴保珍;何婷婷;李立;张勇;陈龙;;基于全切分获取网络流行语方法研究[J];计算机应用研究;2009年04期
18 曹叶新;;对HMM下的《光明日报》中文姓名的具体识别法的探究[J];技术与市场;2009年09期
19 苗夺谦;卫志华;王睿智;张志飞;;“中文信息处理”实践教学探索[J];计算机教育;2010年17期
20 谷川;田喜平;;基于条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2010年05期
中国重要会议论文全文数据库 前10条
1 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
2 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
4 吴岩;蔺荪;;中文自动查错与人机交互纠错系统的研究与实现—简介语科中文自动校对系统[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
7 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
9 孙广增;董程英;;清样中参考文献的高差错率及对策[A];学报编辑论丛(第六集)[C];1996年
10 龚梅;沈爱珠;李萌;王淼;;主责负责制能有效降低补液处方差错率[A];全国儿科护理学术交流会议论文汇编[C];2011年
中国重要报纸全文数据库 前10条
1 萧文王聪珍 胡清水;发票验旧互审降低差错率[N];中国税务报;2007年
2 记者 晋雅芳;总署首次对都市报质量检查[N];中国新闻出版报;2007年
3 石军;药方差错率调查引发轩然大波[N];医药经济报;2007年
4 张春梅胡英文 魏建军;承德建行夯实会计基础管理工作[N];承德日报;2008年
5 记者 李洪峰;图书编校质量差错率统计软件研发成功[N];中国新闻出版报;2006年
6 王凡凡;福建企业出口受影响[N];国际商报;2005年
7 记者 李德锐 通讯员 杨宝萍;“四点半学校”成为孩子乐园[N];连云港日报;2010年
8 后国权苗冠军;天津中货报关行差错率大幅下降[N];国际商报;2008年
9 晋雅芬;新闻或广告不规范 文字差错率较高[N];中国新闻出版报;2008年
10 宝忠 玲玲;泽国镇 计生窗口“四零”服务[N];中国人口报;2009年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
5 沈祖春;《类篇》与《集韵》《玉篇》比较研究[D];华东师范大学;2010年
6 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
7 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
8 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
9 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
10 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
2 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
3 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
4 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
5 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
6 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
7 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978