收藏本站
《苏州大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于网格的分词服务系统的研究与实现

郭翠珍  
【摘要】: 汉语分词是信息检索、机器翻译、文本校对等中文信息处理重要领域的基础。由于汉语中存在词语规范、歧义和未登录词等问题,汉语分词一直困扰着中文信息技术的发展。因此,研究汉语分词具有十分重要的意义。同时,在分词应用方面,基于网络的在线测试分词系统仅提供测试功能,存在只能处理少量文本、用户使用不方便、程序无法直接调用等缺点。 网格是近年来继Internet、WWW技术后兴起的一种新技术,能为复杂应用提供分布式并行环境。网格服务可以以不同的方式聚集起来满足应用的需要,提高代码重用率。所以,开发一个基于网格的面向用户和程序的分词服务系统,以服务形式为中文信息处理的基础研究提供支撑环境,有一定的意义。 本文首先研究了汉语分词应用需求的多样性,结合网格的特点设计了七个服务算法。为尽量减少代码移植的工作量,本文研究了GT4的C WS Core,分析用C语言实现网格服务的原理和方法,然后将上述七种算法封装成服务,在网格平台上发布。根据这些算法生成的网格服务,可以以不同的方式组合起来,形成多种类型的分词服务,从而满足不同的分词应用需求。基于GT4的网格服务多采用Java语言实现,而现有平台下的大量的应用程序使用C语言开发。因此本文的方法对C语言应用程序的网格移植有一定的参考意义。 同时,本文还研究了Globus的作业管理机制、Condor系统和PVM并行虚拟机系统,提出了Condor-PVM与Globus结合的并行计算机制,解决了网格环境中用C语言编程实现分布式并行计算的问题。实验证明该机制在处理大规模文本时能够加快分词速度,提高服务质量。 最后本文设计并实现了基于网格的汉语分词服务系统。用户通过系统网格门户可以选择服务类型,进行分词颗粒度、分词词典、输入输出等个性化设置,全透明使用分词服务;用户也可以获得分词服务的WSDL描述文件,在应用程序中直接调用和组合分词服务,满足特定的要求。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石晓红,郭绚,郑守淇;PVM动态跟踪机制的改进和扩充[J];计算机工程与科学;1999年01期
2 章勤,杨中志,张继顺;一种基于PVM的交错一致检查点算法[J];华中科技大学学报(自然科学版);2002年02期
3 王小牛,冯百明;基于LINUX的NOW系统的构建[J];西北师范大学学报(自然科学版);2002年01期
4 刘锋,陈国良,吴昊;PVM环境下求复函数方程根的并行遗传算法[J];小型微型计算机系统;2003年07期
5 李代平,张信一,王昌元,张伯泉;网络并行可视化平台的构架[J];计算机应用;2003年S2期
6 任碧宁,魏生民,罗卫平;基于PVM的三维矢量场流面构造[J];计算机工程与应用;1999年12期
7 戴光明,戴晓明;基于PVM的微机网络并行计算及其应用[J];计算机工程与应用;2000年09期
8 张信一,李代平,章文;基于Win32 PVM上的物探平台实现[J];微机发展;2003年08期
9 丁玲,韩君,李元香;Windows下PVM的配置与编程实践[J];计算机系统应用;2004年08期
10 秦忠国,姜弘道;一种新的并行计算环境:PVM on Win32[J];电子计算机与外部设备;1998年06期
11 孙济洲,Nicolas D Georganas;利用PVM实现整体光照的并行计算(英文)[J];Transactions of Tianjin University;2002年03期
12 张立民,徐良贤;分布式C语言的实现[J];微型电脑应用;1995年04期
13 冯百明,况正谦,肖骊,康继昌;PVM环境下SPMD程序模式探讨[J];西北工业大学学报;1999年02期
14 赵晓玲,孙济洲;粒子跟踪算法的并行实现[J];计算机工程;2003年18期
15 刘贤梅,李从信,梁久祯,任庆东;校园网分布式计算环境的建立[J];大庆石油学院学报;1999年02期
16 邵子立,宋杰;基于消息传递的并行计算环境:MPI与PVM的比较[J];小型微型计算机系统;2000年11期
17 廖湘科,卢宇彤,周子君;PVM用于Client/Server方式的网络编程[J];计算机应用与软件;1996年04期
18 孙建军,陈肇雄,薛选民,郭喜林,侯敏;基于多功能逻辑运算分析技术的汉语分词[J];计算机研究与发展;1998年05期
19 董春雷,郑纬民;基于Myrinet的用户空间精简协议[J];软件学报;1999年03期
20 王顺绪,李志英;微机环境下并行系统的建立与并行程序的开发[J];淮海工学院学报;2001年01期
中国重要会议论文全文数据库 前10条
1 李博渊;奚宁;黄书剑;张建兵;陈家骏;;一种适用于机器翻译的汉语分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 万升华;杨沐昀;李生;赵铁军;;基于字词混合翻译短语的统计机器翻译[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 付国宏;王晓龙;龚永红;;基于词形的汉语文本切分方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
7 李双龙;刘乐中;刘群;;利用单字碎片过滤改进汉语分词性能[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 周晓军;;一种基于PVM的二重网格并行Gauss-Seidel迭代算法[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
10 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前9条
1 汪洋 编译;网格迎接数据管理挑战[N];计算机世界;2004年
2 孙凝晖;高性能进入“后机群”时代[N];中国计算机报;2002年
3 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
4 周洪波 博士;从“牛计算”到云计算[N];计算机世界;2010年
5 龚强;美国网格研究现状[N];中国测绘报;2008年
6 上海航运交易所 刘圣琦;地中海航运扩大市场份额[N];国际商报;2009年
7 徐涛;鲁克石油海外公司今年将削减20%投资[N];中国石化报;2009年
8 柳芭;俄内务部公布三百名高级官员收入[N];远东经贸导报;2010年
9 晓洁;聚脲喷涂设备的新进展[N];中国建材报;2010年
中国博士学位论文全文数据库 前10条
1 谷青范;网格环境下的服务调度机制研究[D];东南大学;2006年
2 石胜友;制造网格资源管理与配置关键技术研究[D];西北工业大学;2007年
3 殷锋;基于QoS的校园网格中关键技术研究[D];四川大学;2006年
4 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
5 王嫚;网格环境下资源管理关键技术的研究[D];北京邮电大学;2006年
6 王方雄;基于原子服务的网格空间信息服务互操作研究[D];武汉大学;2005年
7 刘真;基于业务级互联的下一代网络业务生成研究[D];中国科学院研究生院(计算技术研究所);2006年
8 高宏卿;基于网格的远程教学研究[D];华东师范大学;2004年
9 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
10 唐阔;网格计算资源与任务的实时监测预报系统[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
2 苏勇;基于理解的汉语分词系统的设计与实现[D];电子科技大学;2011年
3 蒋龙;基于统计的汉语分词在机械产品设计中的应用[D];西安电子科技大学;2012年
4 刘福泉;基于GT4的校园计算网格研究[D];中南大学;2007年
5 刘卫强;基于PVM的最短路径求解方法的研究[D];昆明理工大学;2009年
6 厉彦奎;开放网格服务体系结构的研究与应用[D];大连海事大学;2004年
7 杨勤;网络环境下异构教学资源整合的研究[D];电子科技大学;2005年
8 董兴昌;面向服务网格的信息服务系统研究[D];华中科技大学;2004年
9 吕海华;利用网格技术实现网络化制造中的资源管理[D];沈阳工业大学;2004年
10 彭定;网格技术在政府信息门户中的应用研究[D];广东工业大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978