收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于本体与模糊数学的自动分词系统研究

吴虹  
【摘要】: 中文自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一。其中对歧义字段的处理是影响分词精度的关键,国内外许多研究人员在这一领域都进行了深入的研究,但就目前现状来看,仍不能满足实际应用的需要。 本文介绍了中文自动分词的现状和基本的自动分词方法,分析了分词系统的困难。深入学习和研究了《知网》语义网络和模糊数学理论,并发现它们与自动分词的结合点,提出基于《知网》和模糊数学的分词方案:对输入中文文本进行两次扫描,第一次扫描找出句子中确定无歧义的词和歧义字段信息,第二次扫描找出正确的歧义字段切分方案,进而得到整个句子的分词结果。 《知网》语义网络作为主要知识来源,建立《知网》义原网络体系和概念网络体系,有效存储义原和概念的条目内容及内在的关系。采用《知网》的概念知识词典作为基本分词词典。根据模糊数学的理论制定排歧规则。对中文句子用“砌词”思想初步分词后,利用概念网络体系知识和排歧规则解决有歧义的问题。 针对中文自动分词的歧义问题,提出了基于《知网》语义关系网络和模糊推理机制的分词系统设计目标,结合“砌词”思想阐述了它的工作原理和设计方案,并初步实现了原型系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 卢天贶 ,唐丙阳 ,万鹏;模糊数学在机械工程中应用的现状[J];中国机械工程;1989年01期
2 杨国才,王凭青,李兴癸,蒋庆,文国兴,邓明华;应用模糊线性规划优选畜禽饲料配方[J];西南农业大学学报;1992年05期
3 王磊,野学范;模糊评判在舰艇作战系统效能评估中的应用[J];舰船电子工程;2005年05期
4 程瑾;企业信息化实施的模糊综合评价[J];理论与现代化;2005年S1期
5 杨中华;张志清;;基于模糊层次分析法的BPR风险评价[J];武汉科技大学学报(社会科学版);2006年02期
6 席代昭;范体军;;基于ADGF集成法的IT外包决策[J];情报杂志;2007年04期
7 金明;胡小丽;;基于模糊数学的电视节目综合评价方法[J];广播与电视技术;2009年02期
8 秦晓倩;;模糊神经网络在洪泽湖水质评价中的应用研究[J];微计算机信息;2010年28期
9 丁红军;蔡鸿杰;邢克礼;;基于遗传算法的图像模糊增强的研究[J];内蒙古大学学报(自然科学版);2011年03期
10 杨和雄;;模糊聚类分析在成组技术中的应用[J];南京邮电大学学报(自然科学版);1990年04期
11 戴进华;;模糊数学在电视机故障诊断中的应用[J];电视技术;1993年02期
12 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
13 张建莉;;基于《知网》语义知识的名词短语识别过程中的排歧[J];福建电脑;2006年04期
14 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
15 唐歆瑜;乐文忠;李志成;李军义;;基于知网语义相似度计算的特征降维方法研究[J];科学技术与工程;2006年21期
16 刘长吉;陈建生;陈亮;;应用模糊优选BP网络模型研究龙羊峡水电站坝区地下水渗流场[J];中国水运(学术版);2006年11期
17 张阳;王东;杨贯中;;模糊最小树分析[J];计算机仿真;2007年06期
18 ;2006年度清华同方知网CNKI年会在三亚召开[J];现代图书情报技术;2007年03期
19 苑畅;胡克谨;;软件质量方案模糊决策模型的研究[J];计算机工程与设计;2008年18期
20 于蕾;吴彦历;罗绍军;;基于模糊数学的档案安全管理综合评价模型及应用问题研究[J];中国科技信息;2008年23期
中国重要会议论文全文数据库 前10条
1 石行让;李国英;;玉米螟模糊数学预报方法[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年
2 陈式龙;;模糊数学对用户满意度的综合评判[A];模糊集理论与模糊应用专辑——中国系统工程学会模糊数学与模糊系统委员会第十届年会论文选集[C];2000年
3 杨君岐;陈晓暾;上官鸣;;企业最佳融资方案的模糊综合评判系统及软件[A];第六届全国计算机应用联合学术会议论文集[C];2002年
4 陈贺林;韩云峰;温继勇;朱勇兴;;基于模糊数学的高炉炉况判定模型[A];工业自动化应用实践——全国(第五届)炼钢、连铸和轧钢自动化学术会议论文集[C];2002年
5 石义;秦涛;彭艳丽;张扬;;基于模糊综合判别的城乡一体化水平评价研究[A];2009年中国土地学会学术年会论文集[C];2009年
6 龚德忠;徐云峰;吴燕波;;基于模糊决策理论的入侵检测系统可行性评估[A];第十九次全国计算机安全学术交流会论文集[C];2004年
7 李淼泉;薛善坤;熊爱明;;应用模糊数学预测钛合金高温变形时的晶粒尺寸[A];2000年材料科学与工程新进展(下)——2000年中国材料研讨会论文集[C];2000年
8 尚修刚;蒋慰孙;;系统非精确量算术运算规则初探[A];1997中国控制与决策学术年会论文集[C];1997年
9 张振良;;模糊数投入产出表的一个注记[A];模糊数学和系统成果会论文集[C];1991年
10 李文蛟;石磊;徐可培;;等离子点火燃烧器燃烧特性的预测与评判研究[A];2010全国能源与热工学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 陈雷;应用模糊数学中模式识别方法进行脾虚大鼠模型评价研究[D];辽宁中医学院;2004年
2 吴建发;优选压裂井方法研究[D];西南石油学院;2005年
3 张定强;初中数学教科书建构与评价中的若干问题研究[D];西北师范大学;2008年
4 吴薇薇;堵塞流理论在随机流动网络优化设计、改造及运行中的应用[D];南京航空航天大学;2006年
5 陈明浩;模糊微分方程的定解问题及模糊优化问题[D];哈尔滨工业大学;2007年
6 周启发;汽车企业并购及其整合策略研究[D];华中科技大学;2007年
7 张宗强;投资者有限理性与证券价格行为研究[D];青岛大学;2007年
8 司书宾;基于故障预测的装备维修备件协同库存控制系统研究[D];西北工业大学;2006年
9 王开凤;山区高速公路施工安全评价及预警研究[D];武汉理工大学;2009年
10 潘建江;数字图像分割及变形技术研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前10条
1 吴虹;基于本体与模糊数学的自动分词系统研究[D];北京理工大学;2008年
2 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
3 蒋才智;中文自动分词及人名识别技术研究[D];合肥工业大学;2011年
4 王万超;郑州电视台中文自动分词系统研究与实现[D];电子科技大学;2009年
5 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
6 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
7 江兆中;基于语境和停用词驱动的中文自动分词研究[D];合肥工业大学;2010年
8 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
9 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
10 张明芝;苏州市社区卫生服务工作调查与评价[D];苏州大学;2004年
中国重要报纸全文数据库 前10条
1 记者 陈磊;中国知网率先推出优先数字出版[N];科技日报;2010年
2 见习记者 廖小珊;中国知网推出优先数字出版 读者可多种数字渠道获取[N];中国新闻出版报;2010年
3 本报记者 杨杨;投资、创业两不误:李童的“新孩子”恒知网[N];21世纪经济报道;2011年
4 潘国彦;新闻与模糊数学[N];中国新闻出版报;2002年
5 记者 王秀萍;“中国知网”集约化印刷华北基地在并建成[N];山西经济日报;2010年
6 程晓龙;中国知网联姻施普林格[N];中国新闻出版报;2008年
7 陈;思科用无线感知网络[N];中国计算机报;2003年
8 张继增;模糊数学能应用于中医吗[N];中国医药报;2003年
9 通讯员 邓良伦 易延田;模糊数学介入工资评判[N];工人日报;2000年
10 李大庆;中国知网与施普林格全面合作[N];科技日报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978