收藏本站
《大连理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于层叠条件随机场的中文机构名识别的研究

红霞  
【摘要】: 中文命名实体识别是中文信息处理的基础任务,是机器翻译、信息检索、问答系统等技术的基础。中文机构名识别属于中文命名实体识别范涛,对提高汉语自动分词和句法分析的效果都有重要的意义。 目前,中文机构名识别的方法主要是基于统计的方法和基于规则的方法以及规则与统计相结合的方法,其中条件随机场(Conditional Random Fields, CRFs)模型取得了很好的效果。本文在已有研究的基础上,利用条件随机场模型进行中文机构名识别的研究。 本文的核心工作可以概括为以下几个方面: (1)简要介绍了CRFs模型和支持向量机(SVM)模型理论。CRFs模型是目前比较优秀的无向图条件概率模型,主要用于标记和分割序列数据,可以利用上下文特征获得全局最优的标注结果。SVM模型是一个优秀的二值分类器,具有较好的推广能力和高维处理能力。 (2)在单层CRFs模型中采用CRFs与SVM相结合的方法进行中文机构名识别,提高机构名右边界的识别准确性,从而优化系统的识别效果。 (3)由于现实文本中存在着实体特征词的兼类问题,复杂地名对机构名的识别有一定的干扰性。首先识别复杂地名可以对机构名的识别起到一定的消歧作用,同时对机构名的识别带来有利的输入信息。从而,尝试了使用层叠CRFs模型进行机构名识别。 (4)对基于CRFs模型的机构名识别结果分析,发现机构名标注结果中错误的标注大部分都有较低的边缘概率,采用概率统计模型构建潜在机构名的方法对边缘概率较低的样本进行修正,以优化系统的识别效果。实验证明,基于CRFs边缘概率的方法取得了较好的机构名识别结果。 本文的主要贡献是在进行中文机构名识别时使用层叠CRFs模型获得低层模型的复杂地名识别结果从而在一定程度上解决了复杂地名与机构名的兼类问题,给机构名识别起到了排歧的作用。同时,给高层模型提供了有利的输入信息。提出了利用CRFs边缘概率信息来修正中文机构名标注的结果,从而提高机构名识别的效果。实验证明,基于层叠CRFs进行中文机构名的识别,是一种可行的方法。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 程兵,王莹,郑南宁,贾新春,袁泽剑,李青,卞正中;基于Markov随机场和FRAME模型的无监督图像分割[J];中国科学E辑;2004年04期
2 王建栋,冯前进,陈武凡;基于模糊增强的医学超声图像分割[J];中国医学物理学杂志;2005年02期
3 王荣霞,刘春原,杨小明;城市三维地基信息咨询系统的设计与开发[J];河北工业大学学报;2002年01期
4 胡净;胡洁;叶盛;;基于Markov随机场和Bayesian理论的脑内磁源重建[J];计算机科学;2003年09期
5 匡锦瑜,刘来福,朱俊秀,郭宇春;马尔可夫随机场与离散多值玻尔兹曼机[J];电子学报;1994年10期
6 李华北,赵杰文;基于Markov随机场的猪肉糜微结构图像模拟[J];农业机械学报;2001年02期
7 冯志林,尹建伟,陈刚,董金祥;彩色图像的马尔可夫随机场恢复算法[J];浙江大学学报(工学版);2004年09期
8 黄英,丁晓青,王生进;基于Markov随机场的三维物体识别算法[J];清华大学学报(自然科学版);2005年01期
9 曹永锋,孙洪,杨文,徐新;基于MPM准则的无监督SAR图像分割[J];武汉大学学报(信息科学版);2004年09期
10 汪涛,庄新华,邢小良;线元马尔可夫随机场模型和重建[J];电子学报;1992年07期
11 匡锦瑜,姚小燕;一种低信噪比图像的模拟退火恢复算法[J];计算机学报;1991年07期
12 汪涛,邢小良,庄新华;一种新的边缘检测算法[J];电子学报;1992年01期
13 匡锦瑜,王颖;多尺度边缘检测与图像分割的马尔可夫随机场模型[J];北京师范大学学报(自然科学版);1996年03期
14 刘一舟,罗斌,罗宏建;基于Matlab平台的含噪图像恢复[J];现代电子技术;2004年21期
15 ;图象的随机场模拟、估计和分形的研究[J];北京理工大学学报;1990年02期
16 徐全智;关于平面Clipping随机场的若干性质[J];电子科技大学学报;1990年02期
17 邱振戈,钱曾波,马东洋,黄野;基于Markov随机场的彩色图像区域分析方法[J];测绘学院学报;1999年02期
18 李峰,彭嘉雄;基于Wold特征的遥感图像的分割[J];测绘学报;2003年04期
19 俞涛,邹采荣;一种用于多值吉布斯随机场的参数估计方法[J];东南大学学报(自然科学版);1997年02期
20 郑肇葆,周月琴;马尔柯夫随机场的参数估计与影像纹理分类[J];测绘学报;1995年01期
中国重要会议论文全文数据库 前10条
1 游世辉;李雪芹;陈子娟;万小平;;结构可靠性分析的随机无网格法与蚂蚁算法[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
2 邵久书;;量子耗散动力学随机场方法[A];第九届全国化学动力学会议论文摘要集[C];2005年
3 金郭赟;朱秀昌;;多幅连续CCD图像间关系模型的研究[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
4 杨绿峰;刘萍;刘颖;唐冲;;大变异随机结构数值分析理论及其比较研究[A];随机振动理论与应用新进展——第六届全国随机振动理论与应用学术会议论文摘要集[C];2008年
5 刘春华;秦权;;虎门大桥静力问题的随机有限元分析[A];中国土木工程学会桥梁及结构工程学会第十二届年会论文集(下册)[C];1996年
6 范么清;楼梦麟;;非线性单自由度复合随机振动系统的反应特性[A];第16届全国结构工程学术会议论文集(第Ⅲ册)[C];2007年
7 郭怀志;陈祖坪;;论拱坝系统可靠度分析方法[A];水力发电工程与水工建筑物学术论文集[C];2000年
8 吴传清;陆达远;常晓林;赖国伟;;岩体结构面宏观抗剪强度的随机场分析[A];岩石力学新进展与西部开发中的岩土工程问题——中国岩石力学与工程学会第七次学术大会论文集[C];2002年
9 史勇红;戚飞虎;;基于弱膜模型的自适应立体脑图像分割方法[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 黄斌;高洪波;;分层土中单桩水平动力阻抗的统计特性[A];第十三届全国结构工程学术会议论文集(第Ⅱ册)[C];2004年
中国重要报纸全文数据库 前2条
1 谢国宁 谢敬爱;天津临空产业等待起飞[N];中国现代企业报;2006年
2 ;杨元元还在飞的民航局长[N];市场报;2006年
中国博士学位论文全文数据库 前10条
1 张晓峰;基于条件随机场的目标提取[D];华东师范大学;2012年
2 刘春原;基于GIS系统的岩土参数随机场特性研究[D];天津大学;2003年
3 杨卫国;关于强极限定理的若干研究及应用[D];上海交通大学;2007年
4 陈振龙;独立增量随机场的分形性质[D];西安电子科技大学;2004年
5 苏项庭;基于粘结裂缝模型的非均匀准脆性材料断裂模拟研究[D];浙江大学;2011年
6 莫文辉;线性振动的随机有限元研究[D];华中科技大学;2009年
7 吴长富;杭州地区土性概率特征及单桩承载力可靠度研究[D];浙江大学;2005年
8 穆一夫;基于认知的非结构化信息抽取关键技术与算法研究[D];中国矿业大学(北京);2013年
9 赵红亮;基于集合卡尔曼滤波数据同化方法的岩土力学参数时空变异性研究[D];中国科学院研究生院(武汉岩土力学研究所);2006年
10 吕学斌;Gel'fand三元组上的Lévy白噪声和分数Lévy噪声[D];华中科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
2 张华;算子标度随机场[D];暨南大学;2010年
3 林泽鑫;基于条件随机场的网络短评论挖掘系统研究与实现[D];华南理工大学;2012年
4 王立文;基于深度学习与条件随机场的多标记学习方法的中医问诊建模研究[D];华东理工大学;2013年
5 王鸿飞;基于条件随机场的中文微博情感分析研究[D];广东工业大学;2013年
6 熊鋆洋;基于条件随机场的入侵检测系统的研究与实现[D];华中科技大学;2012年
7 陈天缘;线性链条件随机场训练算法优化的研究[D];复旦大学;2010年
8 郭永生;基于条件随机场的汉语短语识别研究[D];东北大学;2008年
9 李阳;基于条件随机场的RNA二级结构预测算法[D];北京理工大学;2011年
10 木合塔尔·艾尔肯;基于条件随机场的维吾尔语人名识别[D];新疆大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978