收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

自适应歧义切分的汉语分词系统的设计与实现

温滔  
【摘要】:汉语自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对歧义字段的处理是影响分词精度的关键,国内外许多研究人员在这一领域都进行了深入的研究,但就目前现状来看,仍不能满足实际应用的需要。 本文针对分词中的两个方面:切分速度和歧义处理,进行了深入的研究。在速度方面,它首先对词典中的词进行排序,并对首字索引,同时还利用字符串顺序排列时的规律,大大提高了查找词时的速度,同时还对N-最短路径的粗分模型进行改进,通过过滤无覆盖型歧义切分结果的切分方案,使得剩余粗分结果数量大大减少,同时还使得在不考虑未登录词的情况下,粗分结果的召回率达到100%。最后通过分析目前算法的缺陷,提出目前算法的最大不足是语料信息的不完备性,然后介绍了一种在利用词的多元信息进行分词的基础上,通过收集切分错误歧义句,经过人工修正,由系统自动调节多元信息库,增强语料信息库的完备性,以此提高分词正确率的方法。 在分析阶段,本文就分词系统的速度与精度,与中科院计算所的汉语分词方法进行了全面的比较,在分析了本系统的优势的同时,也指出了本系统存在的一些不足之处,并由此作出了展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 曹勇刚;曹羽中;金茂忠;刘超;;面向信息检索的自适应中文分词系统[J];软件学报;2006年03期
2 孟维娟;;自然语言处理中的歧义[J];上海电机学院学报;2006年S1期
3 金希茜;孟志青;;中文文本相似度在商业网络中的应用[J];商场现代化;2009年29期
4 巫振新;林锦国;杨宇;;专业语料库建立及其在机器翻译中的应用[J];现代计算机(专业版);2008年02期
5 巫振新;林锦国;杨宇;;专业语料库建立及其在机器翻译中的应用[J];微型电脑应用;2008年04期
6 卢玉敏;;未登录名词短语识别现状初探[J];广西大学学报(自然科学版);2007年S1期
7 王睿,张洁,张由仪,于禛,姚天昉;基于混合模型的中文命名实体抽取系统[J];清华大学学报(自然科学版);2005年S1期
8 周文帅;冯速;;汉语分词技术研究现状与应用展望[J];山西师范大学学报(自然科学版);2006年01期
9 金在全;赵照;杜秀全;张东;;一种改进的增字最大匹配算法[J];科学技术与工程;2007年18期
10 刘春辉;金顺福;刘国华;李颖;;基于优化最大匹配与统计结合的汉语分词方法[J];燕山大学学报;2009年02期
11 王士杰;;乘除器似不能实现拉氏变换式的乘除[J];工业仪表与自动化装置;1987年05期
12 王宏;自适应鲁棒控制系统—稳定性和鲁棒性[J];控制理论与应用;1988年01期
13 向大威,顾亚平;自适应信号处理的研究进展[J];声学技术;1991年02期
14 邵京一;模拟自适应陷波器的原理与实现[J];电子学报;1992年01期
15 梁军,符雪桐,吕勇哉;自适应PID控制──Ⅱ.全局收敛性分析[J];浙江大学学报(工学版);1994年06期
16 郑叔芳;CAT(计算机辅助测试)技术──第六讲 CAT的发展[J];测控技术;1994年01期
17 仇佩亮,郑树生,姚庆栋;扩频通信中干扰抑制的自适应非线性滤波技术[J];通信学报;1995年02期
18 邱天爽,王宏禹;Eckart加权的自适应时间延迟估计[J];大连理工大学学报;1996年02期
19 肖健梅;船舶航向自适应控制算法及仿真[J];计算机辅助工程;1996年03期
20 陈晓青,蒋静坪;基于神经元状态的伺服系统自适应广义极点配置控制[J];电工技术学报;1997年03期
中国重要会议论文全文数据库 前10条
1 何宏;黄兴;孙虹;武聪聪;董宏;;基于VHDL和FPGA的自适应数字频率计设计[A];2010中国仪器仪表学术、产业大会(论文集2)[C];2010年
2 黎杰;周猛军;祝吾杰;胡丽媛;;基于自适应微分进化算法的供水调度优化[A];2010中国仪器仪表与测控技术大会论文集[C];2010年
3 曾杰;郭创新;刘育骐;梁年生;;记忆递归网络预测控制器及其在水压频率综合调节中的研究[A];1996中国控制与决策学术年会论文集[C];1996年
4 邢志伟;封锡盛;王宁;;水下机器人神经网络直接自适应控制[A];2003中国控制与决策学术年会论文集[C];2003年
5 袁驷;和雪峰;;一个高效的一维有限元自适应求解的新方案[A];工程力学学术研讨会论文集[C];2004年
6 程春悦;吕英华;;基于可变对角加载的自适应波束形成算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
7 刘程远;王小铭;;基于自适应融合系数矩阵的图像隐藏算法[A];第十二届全国图象图形学学术会议论文集[C];2005年
8 贾利琴;汪晋宽;田丹;;基于子空间跟踪的自适应多用户检测方法[A];第七届青年学术会议论文集[C];2005年
9 齐娜;;传声器阵列的宽带自适应恒定束宽波束形成方法[A];2005年声频工程学术交流会论文集[C];2005年
10 罗竑;;模糊控制在地铁地下站空调通风系统中的应用[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
中国博士学位论文全文数据库 前10条
1 邓国红;基于压电陶瓷的轿车顶棚振动主动控制技术研究[D];重庆大学;2010年
2 潘卉青;高速TIADC并行采样系统综合校正技术研究[D];电子科技大学;2010年
3 童立靖;实时系统的自适应进程调度方法研究[D];中国科学院研究生院(软件研究所);2005年
4 徐春光;非平稳信号的时频分析与处理方法研究[D];西安电子科技大学;1999年
5 彭健;多类小字符集自适应字符识别技术及系统的研究[D];重庆大学;2002年
6 宋超;非结构化自适应有限元网格生成的AFT方法[D];大连理工大学;2004年
7 傅少君;岩土结构仿真反馈分析的理论与实践[D];武汉大学;2005年
8 赵英;基于异步网络环境的自适应时钟同步[D];北京化工大学;2004年
9 刘军;自适应检测算法的性能分析及应用[D];西安电子科技大学;2012年
10 刘宏伟;平面阵连续波雷达自适应数字波束形成系统[D];西安电子科技大学;1999年
中国硕士学位论文全文数据库 前10条
1 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
2 李春光;自适应信号处理的神经网络方法[D];电子科技大学;2002年
3 孙琰;基于小波变换的图像边缘检测技术[D];西北工业大学;2004年
4 史悦;自适应超文本/超媒体学习系统的研究与开发[D];贵州师范大学;2004年
5 宫翔飞;WENO格式和自适应网格方法数值模拟[D];中国工程物理研究院;2003年
6 秦杰;模式识别自适应控制器(PRAC)应用研究[D];西安建筑科技大学;2005年
7 张昌青;电解镍板的自适应点焊控制器研制及其工艺性研究[D];兰州理工大学;2005年
8 韩正英;WPVM环境下的动态任务分配研究[D];广东工业大学;2005年
9 周岩;自适应的集中管理式Web缓存系统研究[D];燕山大学;2004年
10 李辉;自适应模型算法控制的研究与仿真[D];郑州大学;2005年
中国重要报纸全文数据库 前10条
1 清华大学计算机系 陈恩义;无缝移动[N];计算机世界;2002年
2 ;三大步迈向NGeN[N];中国计算机报;2005年
3 程雁;自适应对千兆有益吗[N];中国计算机报;2004年
4 吴中秋 王鑫;重视“自适应协同”训练[N];解放军报;2005年
5 李怀斌;不确定性市场环境与自适应型企业范式[N];经济日报;2003年
6 李强;排除自适应网卡引起的故障[N];中国电脑教育报;2004年
7 ;思科推出多合一系统级安全工具[N];人民邮电;2005年
8 ;长城推出自适应以太网交换机[N];通信产业报;2000年
9 云飞;北电推出自适应LAN解决方案[N];中国计算机报;2003年
10 ;给无线增添自适应[N];网络世界;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978