收藏本站
《电子科技大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

搭配距离在自动分词分句中的应用

李明  
【摘要】: 随着自然语言应用系统的进步,对自然语言处理的基础部分,自动分词分句的准确率的要求也越来越高。汉语自动分词分句的自动评判系统的研究已经成为一项亟待解决的紧迫课题。 虽然学术界不断有研究人员提出自动评判的部分机制,但仍存在很多不足之处。例如,大部分机制都仅仅支持部分词类或部分搭配的评判;评判的召回率和准确率偏低等。汉语自动分词分句的自动评判的研究总的来说还处在刚刚起步的阶段。从事这方面研究的人员还不是很多,公开发表的论文也比较少。 本文在目前汉语分词分句技术和各种评判机制的深入研究和分析的基础上,借鉴了人们在类似问题上的思考模式,选择以语义知识库为问题的突破口,利用汉语词与词之间详细而复杂的关系网络,试图找到一种度量方法以确定其是否搭配。本文通过对现今主流语义知识库的研究和分析,提出了以知网为支撑,以语义距离为骨架的新概念:搭配距离。 本文详细介绍了搭配距离的概念定义和计算方法,并给出部分计算实例。从实例就能很明显的看到,搭配距离能很有效地度量词与词之间搭配的准确度。与其他分词、分句方法相结合,能产生相当好的结果。本文通过实验证明了这一点。从实验中还发现,搭配距离对简单歧义句和语法错误有一定判别能力。 最后指出了搭配距离在实验中体现出的一些不足之处以及下一步的主要工作方向。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
2 张建莉;;基于《知网》语义知识的名词短语识别过程中的排歧[J];福建电脑;2006年04期
3 唐歆瑜;乐文忠;李志成;李军义;;基于知网语义相似度计算的特征降维方法研究[J];科学技术与工程;2006年21期
4 ;2006年度清华同方知网CNKI年会在三亚召开[J];现代图书情报技术;2007年03期
5 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
6 柴晓丽;张丽伟;管玉玲;;基于HowNet自动文摘的研究[J];电脑编程技巧与维护;2009年S1期
7 袁国女;;中国知网力推我国数字出版“走出去”新平台[J];中国出版;2011年17期
8 周俏丽;蔡东风;吕德新;朱江涛;吴英泽;;基于语义相似度的句法歧义结构消解[J];沈阳航空工业学院学报;2006年01期
9 孙继明;李舟军;文健;;基于《知网》的汉语词语词义消歧方法[J];计算机与信息技术;2007年03期
10 姜东洋;;中文问答系统中问题理解的研究[J];电脑知识与技术;2008年05期
中国重要会议论文全文数据库 前10条
1 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 董强;董振东;;基于知网的相关概念场的构建[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 杨尔弘;米丽萍;郝秀兰;;基于《知网》的词义排岐方法[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 王智超;季铎;蔡东风;张桂平;;文本聚类中基于知网的特征抽取方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 邓辉;林柏钢;;一种基于《知网》的敏感信息预测技术[A];第十届中国科协年会论文集(三)[C];2008年
8 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
9 汪新红;王鹏;;“知网节”技术在科技期刊编辑过程中的作用[A];第5届中国科技期刊青年编辑学术研讨会论文集[C];2005年
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 陈磊;中国知网率先推出优先数字出版[N];科技日报;2010年
2 见习记者 廖小珊;中国知网推出优先数字出版 读者可多种数字渠道获取[N];中国新闻出版报;2010年
3 本报记者 杨杨;投资、创业两不误:李童的“新孩子”恒知网[N];21世纪经济报道;2011年
4 记者 王秀萍;“中国知网”集约化印刷华北基地在并建成[N];山西经济日报;2010年
5 程晓龙;中国知网联姻施普林格[N];中国新闻出版报;2008年
6 陈;思科用无线感知网络[N];中国计算机报;2003年
7 李大庆;中国知网与施普林格全面合作[N];科技日报;2008年
8 路华;中华行知网(www.sotrip.com)文化与旅游的契合[N];中国旅游报;2000年
9 高向东;千家数字图书馆对接“中国知网”数字出版平台[N];山西日报;2007年
10 计亚男;中国知网数据库携手施普林格[N];光明日报;2008年
中国博士学位论文全文数据库 前5条
1 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
2 景东升;基于本体的地理空间信息语义表达和服务研究[D];中国科学院研究生院(遥感应用研究所);2005年
3 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
4 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
5 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
2 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
3 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 尹本雄;中文搜索引擎中的文档特征提取研究[D];广西师范大学;2004年
6 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
7 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
8 周美希;汉语语句组块及消歧的研究与实现[D];电子科技大学;2005年
9 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
10 李佳;基于知网的中文本体映射研究[D];北京邮电大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026