收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

藏文自动分词技术方法研究

普布旦增  
【摘要】: 藏文分词是藏文信息处理中一项不可缺少的基础性工作。从文本的输入系统〔如智能语句输入法、语音输入、手写输入),到文字处理(如文本校对)以及语音合成、文本检索、文本分类、自然语言接口、自动文摘等,无处不渗透着分词系统的应用,它是藏文信息处理重要基础之一。 众所周知,英文以词为单位,以空格隔开。计算机可以容易地理解英文单词。而藏文句子中,词与词之间没有明显的分隔符(如空格)。藏文以字(音节字)为单位,连字成句才能描述一个完整的意思。而对由词组成的藏文句子,必须通过藏文分词技术才得以理解。把藏文的音节字序列切分成有意义的词,是藏文分词的研究工作。 通过研究和分析藏文分词的概念以及国内外相关成果,本文系统地提出了分词系统中藏文分词切分单位的划定原则以及藏文分词技术方法,结合藏文自然标记断句、以格助词来为分块、块内匹配与统计相结合的分词方法,提出了藏文自动分词方法、格助词的识别方法、交集型和组合型歧义的识别方法及未登录词识别方法。进而提出了藏文自动分词的基础理论知识及分词技术方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 余娜;;从彭泽润、李葆嘉《语言理论》看分词连写[J];现代语文(语言研究版);2011年08期
2 黄昌宁;自动分词[J];语言文字应用;1997年01期
3 徐艳华;;新词语结构分析在自动分词中的作用[J];烟台职业学院学报;2007年04期
4 许林杰;汉语文本分词问题的形成原因和解决途径[J];山东行政学院.山东省经济管理干部学院学报;2002年03期
5 祁坤钰;;信息处理用藏文自动分词研究[J];西北民族大学学报(哲学社会科学版);2006年04期
6 李迅;;自动分词与分词规范——关于《信息处理现代汉语分词规范》的重新思考[J];山东文学;2010年01期
7 罗智勇;宋柔;朱小杰;;藏族人名汉译名识别研究[J];情报学报;2009年03期
8 年洪东;;利用现有资源快速实现汉语专用分词系统[J];文教资料;2007年29期
9 殷峰,何克抗;语句级拼音┐汉字转换系统的设计与实现[J];计算机研究与发展;1997年05期
10 文庭孝,侯经川,邱均平,张洋;汉语自动分词新思维:无词典切分[J];情报杂志;2005年02期
11 李良炎;;基于词联接的软分词技术[J];外国语言文学研究;2005年04期
12 李良炎;;基于词联接的古典诗词自动分词技术[J];外国语言文学研究;2006年03期
13 张霄军;;“两个半月”和“两个半天”——面向词法自动分析的涉数时间语素说略[J];语言教学与研究;2010年03期
14 杨宪泽;;机器翻译的一些难点探讨[J];西南民族大学学报(自然科学版);2011年03期
15 章森,宗成庆,孙建军;新一代中文输入系统面临的问题[J];中文信息;1997年01期
16 卢俊之;;分词不一致不同成因的自动识别研究[J];现代语文(语言研究版);2007年11期
17 冯志伟;汉语书面语的分词连写[J];语文建设;2001年03期
18 ;消息动态[J];术语标准化与信息技术;2005年03期
19 ;精彩小品[J];中文信息;1996年04期
20 韩维良;汉语自动分词系统中切分歧义与未登录词的处理策略[J];青海师范大学学报(自然科学版);2004年02期
中国重要会议论文全文数据库 前10条
1 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李小明;王亚莉;易立夫;杨静;孙金城;;自动分词中的单字虚词处理[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
3 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
5 高璐;陈琪;李永宏;于洪志;;藏语语音合成中本文分析的若干问题研究[A];第九届中国语音学学术会议论文集[C];2010年
6 黄昌宁;林娟;孙承杰;;何谓金本位[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
10 罗智勇;宋柔;荀恩东;;一种基于可信度的人名识别方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前2条
1 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年
2 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
3 段倩倩;面向信息处理的带典型前缀派生词的识别分析[D];上海师范大学;2010年
4 史迎馨;建筑图中有限自然语言的分析与理解的研究[D];长春工业大学;2010年
5 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
6 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
7 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
8 付蕾;知识元标引系统的设计与实现[D];华中师范大学;2009年
9 张敏;基于Internet的个性化信息检索关键技术研究[D];燕山大学;2006年
10 陈云;基于受限汉语和模块组合的自动程序设计研究[D];重庆大学;2008年
中国重要报纸全文数据库 前5条
1 王萍;Web文本的知识化管理[N];计算机世界;2006年
2 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年
3 田梦;软件篇软件只是工具[N];计算机世界;2007年
4 实习生 康晨;网络没有唯一:国内中文搜索引擎之比较[N];中国消费者报;2005年
5 教育部语信司;国家语言资源监测与研究中心召开2007数据发布专题研讨会[N];语言文字周报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978