收藏本站
《西安电子科技大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计的汉语分词在机械产品设计中的应用

蒋龙  
【摘要】:汉语分词是自然语言理解中的一个主要组成部分,同时也是文本挖掘,机器翻译,信息检索的基础。由于汉语分词问题本身的复杂性,故而寻求准确有效的汉语分词方法成为自然语言理解的主要研究内容之一。本文设计了基于统计和语义分析相结合的分词模型,将其应用在产品的设计过程中。通过该模型将用户以自然语言形式描述的需求进行切分,将切分结果经过自然语言理解系统的其余模块的处理转化成为计算机能够识别的概念设计要求。 本文分析了现有汉语分词的方法及其主要存在的问题,研究了基于语料库的分词方法及其关键技术,结合现有的分词方法,提出将机械分词、语料库统计分词和语义分析相结合的分词模型,并将此分词模型嵌入到某领域汉语理解系统之中。机械分词阶段,利用改进的最大匹配法,以求尽量得出所有的切分形式并用有向图的形式表现出来,并且找出分词中的歧义字段,对其进行消除歧义。语料库统计阶段,先将歧义字段中的各种常见搭配组合利用语料库统计方法统计,统计其共现度和搭配情况,并把搭配情况反馈到统计词典中,实现分词系统和整个自然语言理解系统的自我完善和良性互动,同时对合成词(“2+2”,“2+3”和“3+2”模式)的可信度进行统计;然后采用语义分析中的动名词结构,结合概念从属的知识表示方法,对分词结果进一步消除歧义,提高了分词系统的准确率,降低分词系统的复杂度。最后结合实际将该分词模型应用于产品设计的用户需求分析领域。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林亚平,李彦,童调生,尹锋;汉语自动分词中的神经网络技术研究[J];湖南大学学报(自然科学版);1997年06期
2 于江德;睢丹;樊孝忠;;基于字的词位标注汉语分词[J];山东大学学报(工学版);2010年05期
3 赵晓凡;胡顺义;刘永革;;CRF模型中参数f在字标注汉语分词中的适用性研究[J];郑州大学学报(工学版);2011年04期
4 王永成,李健;汉语的自动分词[J];上海交通大学学报;1989年02期
5 赵福君,黄厚宽,俞经善;基于期望的汉语分词模型的设计[J];哈尔滨工程大学学报;1990年02期
6 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
7 朱江涛;蔡东风;吕德新;周俏丽;;基于启发式信息的中文姓名识别方法[J];沈阳航空工业学院学报;2006年03期
8 徐紫云;徐雪松;;从自动分词角度看先秦与现代汉语词汇区别[J];华东交通大学学报;2009年06期
9 刘挺,吴岩,王开铸;最大概率分词问题及其解法[J];哈尔滨工业大学学报;1998年06期
10 林鸿飞,战学刚,姚天顺;中文文本挖掘的特征导航机制[J];东北大学学报(自然科学版);2000年03期
11 卢玉敏;;未登录名词短语识别现状初探[J];广西大学学报(自然科学版);2007年S1期
12 赵岩;王晓龙;徐志明;刘秉权;;利用词性信息改进Katz平滑算法[J];哈尔滨工业大学学报;2007年09期
13 姜文志;范洪达;聂心东;蒋伟俊;;作战命令的分词技术研究[J];海军航空工程学院学报;2008年01期
14 梁南元;汉语自动分词知识[J];北京航空航天大学学报;1988年04期
15 张珏成;机器自然语言理解研究性质的探讨[J];上海工程技术大学学报;2004年03期
16 马忠宝;刘冠蓉;;中文文本分类在信息技术中的应用研究[J];中国水运(学术版);2006年02期
17 李晓望;语言文字的层次生成切分[J];南京航空航天大学学报;1990年02期
18 唐佛南;张惕;;人脑中事实与自然语言的关系及其在计算机中的表达方法[J];铁道科学与工程学报;1983年01期
19 顾宏斌;沈俭;徐惠民;时芸;董宁航;;机务信息的规范化[J];江苏航空;1999年Z1期
20 邸书灵,赵志宏,雷宇,姚雄伟;基于自然语言理解的ISO标准WEB智能咨询系统研究[J];河北工业大学学报;2004年05期
中国重要会议论文全文数据库 前10条
1 李博渊;奚宁;黄书剑;张建兵;陈家骏;;一种适用于机器翻译的汉语分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 万升华;杨沐昀;李生;赵铁军;;基于字词混合翻译短语的统计机器翻译[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 付国宏;王晓龙;龚永红;;基于词形的汉语文本切分方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
8 李双龙;刘乐中;刘群;;利用单字碎片过滤改进汉语分词性能[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 穆飞;李维佳;薛巍;舒继武;;一种分布式信息检索系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
中国重要报纸全文数据库 前10条
1 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
2 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
3 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
4 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
5 ;国内语音合成技术“叫板”IBM[N];中国经营报;2000年
6 杨保国;中国科大研制的机器人会说话能干活[N];科技日报;2009年
7 记者 高敬云;我国少数民族语言信息化进程提速[N];中国民族报;2004年
8 IBM中国研究中心 沈丽琴博士;语音识别技术离我们有多远[N];光明日报;2000年
9 ;Edify公司中间件可靠、开放、易于集成[N];中国计算机报;2003年
10 陆元婕 飞侠;搜索技术发展及未来趋势[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
2 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
3 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
4 张蕾;概念结构及其应用[D];西北工业大学;2001年
5 刘根辉;计算语用学基础理论及其应用研究[D];华中科技大学;2005年
6 乐明;汉语财经评论的修辞结构标注及篇章研究[D];中国传媒大学;2006年
7 杨芸;汉语隐喻识别与解释计算模型研究[D];厦门大学;2008年
8 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
9 许中卫;基于双向搜索的ILP算法构建汉语语义自动切分系统[D];安徽大学;2006年
10 朱宏辉;基于知识驱动的拟人智能控制系统若干关键技术研究[D];武汉理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 苏勇;基于理解的汉语分词系统的设计与实现[D];电子科技大学;2011年
2 岳金媛;面向专利文献的汉语分词技术研究[D];北京交通大学;2013年
3 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
4 于长远;应用条件随机场进行汉语分词和词性标注的研究[D];辽宁科技大学;2008年
5 沈勤中;基于条件随机场的汉语分词研究[D];苏州大学;2008年
6 王红雨;网络教学汉语答疑系统关键技术的研究与应用[D];大连理工大学;2006年
7 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
8 陈先华;自然语言理解之汉语量词和名词搭配及查错系统[D];电子科技大学;2002年
9 冯蜀茗;网络环境下协作学习监控研究[D];西南师范大学;2005年
10 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978