平面媒体语言资源监测软件包开发及应用
【摘要】:
国家语言资源监测与研究是一个全新的课题。本论文主要根据国家语言资源监测与研究中心平面媒体分中心的相关监测实践,对中文资源的监测进行了系统研究,总结出语言资源监测与研究主要包括两方面的工作,一是语言资源建设;二是研制开发用于语言资源监测与研究的软件工具。本文围绕这两个方面展开论述,所涉及的内容主要包括以下几个方面:
首先,对语言资源监测与研究的发展现状及目前国内外对语言资源进行监测和研究的水平进行了宏观分析。分国际和国内两大部分。国际方面主要介绍了监控语料库的发展情况,并分析了它与语言资源监测的关系;国内方面主要介绍了动态流通语料库及动态语言知识更新理论,还有就是国家语言资源监测与研究中心的情况。以此为背景,确定了本文的研究目标是设计一套用于辅助语言资源建设和语言资源监测与研究的软件工具包的架构,并根据现在的需求实现部分功能。
其次,在确定了研究目标以后,第三章论述了该软件工具包的主要功能,并以此为基础,完成了该软件工具包的架构设计。该软件工具包的主要功能包括辅助语言资源建设功能和辅助语言资源监测与研究功能。从架构来看,主要由辅助语言资源建设模块、语言资源索引模块和辅助语言资源监测与研究模块三部分构成。此外还介绍了该软件工具包的开发环境、开发基础、主要特色等。
再次,第四章主要是根据功能分析和架构设计,完成该软件包部分功能的开发。主要包括语料预处理、语言资源标注、语言资源深加工、语言资源索引等。其中最重要的是语言资源标注和语言资源索引这两个子模块的开发。以DC核心集为基础确定了一套语言资源标注基本集,并结合资源描述框架,用XML语言对语言资源进行标注。索引模块调用了一个开源的索引库——DotLucene,对标注好的语言资源建立索引,为监测与研究做好准备。
最后,第五章主要完成了监测模块的开发,还介绍了该软件包在实际项目中的使用情况。第六章是总结整个研究情况,包括具体的研究成果,对语言资源监测与研究的支持等。并对进一步的研究工进行了规划。
|
|
|
|
1 |
张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期 |
2 |
李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期 |
3 |
张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期 |
4 |
李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期 |
5 |
谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期 |
6 |
李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期 |
7 |
周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期 |
8 |
袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期 |
9 |
曹向东;基于JSP的数据访问技术[J];中国民航学院学报;2001年04期 |
10 |
李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期 |
11 |
李军怀,周明全,耿国华,张景西;XML在异构数据集成中的应用研究[J];计算机应用;2002年09期 |
12 |
文燕平,周宁;WWW中的XML数据管理研究[J];情报科学;2002年06期 |
13 |
尹桂秀;XML搜索引擎探微[J];图书情报工作;2002年03期 |
14 |
肖延松,孟波,熊德林,杨子晨;基于XML的数据交换在分布式Web系统中的应用[J];计算机系统应用;2002年03期 |
15 |
陈洪军,陈新度,陈新,郑德涛;新一代基于知识的工程系统[J];中国机械工程;2002年17期 |
16 |
周文生;基于SVG的WebGIS研究[J];中国图象图形学报;2002年07期 |
17 |
梅青;用XML技术实现电子对抗仿真的数据共享[J];舰船电子对抗;2002年06期 |
18 |
黄润才;基于XML的消息队列[J];上海工程技术大学学报;2002年03期 |
19 |
阎慧,李希民,李彩萍;基于XML的WEB安全模型[J];装备指挥技术学院学报;2002年04期 |
20 |
申飞驹,袁红,董建成;XML在数字图书馆中的应用[J];中华医学图书情报杂志;2002年06期 |
|