收藏本站
《华中师范大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于种子自扩展的命名实体关系抽取方法的研究

徐超  
【摘要】:信息抽取对语言信息的自动化处理有着重要的意义,而命名实体之间关系是信息抽取中的一个重要研究课题。它与信息检索、问答系统、信息过滤有直接的关联,同时,作为一项基础性研究,它对于自动文摘、机器翻译、内容理解、语境生成、文本分类以及数字图书馆建设都有重要的研究意义。 对于命名实体之间关系的抽取,主要有知识工程和自动训练两种主要的方法。知识工程的方法有相对较好的效果。但是它也有明显的不足,知识工程的方法的开发非常昂贵,且适应性不强。越来越多的学者都开始致力于自动训练方法的研究。 本文在目前命名实体之间关系抽取的研究现状下,对命名实体之间关系抽取进行了比较深入的探讨。本文的主要工作是利用统计学的方法,利用自动训练的方法自动获取知识进行命名实体之间关系的抽取。研究工作主要包括以下两个方面: (1)提出了一种基于种子自扩展的命名实体之间关系抽取的方法,运用这种方法可以对大规模文本集合中的命名实体之间关系进行抽取; (2)基于向量空间模型,并采用潜在语义分析和特征提取等技术,完成了对关系抽取时信息的获取。 通过以上两种方法,使命名实体之间关系抽取结果的性能大大提高。 本文提出的方法在开放语料的测试中,取得了平均72.9%的召回率和平均69.3%的准确率,从而验证了方法的有效性。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.1

【引证文献】
中国博士学位论文全文数据库 前1条
1 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前6条
1 邱艳霞;领域术语自动抽取及关系分类研究[D];昆明理工大学;2009年
2 邹永强;新闻网页中人物实体关系提取技术研究[D];国防科学技术大学;2011年
3 雷春雅;领域实体关系自动抽取研究[D];昆明理工大学;2011年
4 孟晓亮;产品命名实体识别研究[D];中国传媒大学;2009年
5 王苑;基于依存树的中文命名实体语义关系抽取的研究[D];中南大学;2009年
6 李庆玲;弱指导中文实体关系抽取方法研究[D];华东师范大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
4 李芳,盛焕烨,姚天昉;信息检索与信息抽取技术的研究[J];计算机应用研究;2002年01期
5 盖杰,王怡,武港山;潜在语义分析理论及其应用[J];计算机应用研究;2004年03期
6 林鸿飞,姚天顺;基于潜在语义索引的文本浏览机制[J];中文信息学报;2000年05期
7 鲁松,李晓黎,白硕,王实;文档中词语权重计算方法的改进[J];中文信息学报;2000年06期
8 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
9 郑家恒,王兴义,李飞;信息抽取模式自动生成方法的研究[J];中文信息学报;2004年01期
10 郭志红;基于Web资源的信息抽取技术[J];情报科学;2002年12期
【共引文献】
中国期刊全文数据库 前10条
1 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
2 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
3 李玉鑑;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期
4 宋涛;施水才;房祥;吕学强;;基于改进的潜在语义分析的文本聚类[J];北京信息科技大学学报(自然科学版);2012年03期
5 高庆狮;李莉;刘宏岚;;基于语义单元表示树剪枝的关键字过滤方法[J];北京科技大学学报;2006年12期
6 李蕾;周延泉;王菁华;;基于全信息的中文信息抽取系统及应用[J];北京邮电大学学报;2005年06期
7 卢美华;;《实用英语语料库》的建立与英语教学[J];北京农业职业学院学报;2007年01期
8 张璇;左敏;;一种改进的朴素贝叶斯分类器在文本分类中的应用研究[J];北京工商大学学报(自然科学版);2009年04期
9 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
10 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期
中国重要会议论文全文数据库 前10条
1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 闭剑婷;邓琦;卢佳佳;曹波;;A Model of Bi-directional Translation based on Latent Semantic Analysis[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 张二梅;刘辰;杨正球;;基于HTMLParser自动生成测试用例的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
7 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
8 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
9 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
10 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
中国博士学位论文全文数据库 前10条
1 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
2 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
3 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
4 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
5 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
6 黄雪霞;新加坡华语词汇五十年发展变化研究[D];华中师范大学;2011年
7 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
8 海淑英;吉尔吉斯语中的俄语借词研究[D];中央民族大学;2011年
9 王玉龙;D.那木达嘎戏剧语料库分析与文体研究[D];中央民族大学;2011年
10 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海鸥;基于Ajax和Soap Service的应用框架及实现方法研究[D];山东科技大学;2010年
2 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
3 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
4 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
5 何昌钦;图像检索方法研究[D];大连理工大学;2010年
6 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
7 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年
8 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
9 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
10 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
2 张素香;李蕾;谭咏梅;;特定领域下关系模板的研究[J];北京邮电大学学报;2006年05期
3 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报;2003年03期
4 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
5 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
6 李维刚;刘挺;李生;;基于网络挖掘的实体关系元组自动获取[J];电子学报;2007年11期
7 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
8 奚斌;周国栋;钱龙华;潘珅;;基于分层策略的弱指导语义关系抽取[J];广西师范大学学报(自然科学版);2008年01期
9 张文静;梁颖红;;术语抽取技术研究[J];信息技术;2008年03期
10 李治国;蔡东风;周俏丽;杨者青;;在篇章中利用互信息识别命名实体的研究[J];沈阳航空工业学院学报;2007年01期
中国重要会议论文全文数据库 前4条
1 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
4 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 李锦姬;现代汉语补语研究[D];复旦大学;2003年
2 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
3 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
4 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
5 孔芳;指代消解关键问题研究[D];苏州大学;2009年
6 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
中国硕士学位论文全文数据库 前10条
1 王莉峰;领域自适应的中文实体关系抽取研究[D];哈尔滨工业大学;2011年
2 刘建舟;术语自动抽取系统的设计及关键技术研究[D];华中师范大学;2004年
3 魏庭新;现代汉语介词结构位置的考察及影响其位置的句法、语义因素分析[D];北京语言大学;2004年
4 方莹;基于句子聚类的信息抽取方法研究[D];山西大学;2005年
5 张勇;中文术语自动抽取相关方法研究[D];华中师范大学;2006年
6 顾雪峰;基于动态粒度思想的实体关系识别方法研究[D];山西大学;2006年
7 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
8 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
9 朱江涛;中文信息处理中命名实体识别问题的研究[D];沈阳航空工业学院;2006年
10 赵君喆;汉语专业领域命名实体语义关系自动抽取研究[D];华中师范大学;2007年
【二级引证文献】
中国期刊全文数据库 前9条
1 赵江江;秦兵;;基于BootStrapping的中文事件元素抽取系统设计与实现[J];智能计算机与应用;2012年01期
2 陈天莹;;文本信息中的目标动向感知技术[J];电讯技术;2014年06期
3 许旭阳;李弼程;张先飞;韩永峰;;基于事件实例驱动的新闻文本事件抽取[J];计算机科学;2011年08期
4 肖升;何炎祥;;基于动词论元结构的中文事件抽取方法[J];计算机科学;2012年05期
5 侯立斌;李培峰;朱巧明;;基于CRFs和跨事件的事件识别研究[J];计算机工程;2012年24期
6 张怡文;程家兴;林京;岳丽华;王云;;社交网络中分类推荐用户的设计与实现[J];贵州师范大学学报(自然科学版);2013年01期
7 葛琳;季新生;卫红权;江涛;;基于LDA模型的在线网络信息内容安全事件分类[J];四川大学学报(工程科学版);2014年03期
8 许旭阳;韩永峰;宋文政;;事件抽取技术的回顾与展望[J];信息工程大学学报;2011年01期
9 张怡文;李倩;吴正;袁翠霞;;一种基于Interest-Model的用户推荐算法[J];江苏师范大学学报(自然科学版);2013年02期
中国博士学位论文全文数据库 前3条
1 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
2 雷兵;基于网站客户访问行为的客车产品需求获取方法研究[D];武汉理工大学;2013年
3 徐元子;Web数据集成中有价值事件识别研究[D];山东大学;2014年
中国硕士学位论文全文数据库 前10条
1 常卫丽;领域本体在中文命名实体识别中的应用研究[D];武汉理工大学;2011年
2 吴靓;基于自然语言理解的3D场景构造研究[D];汕头大学;2011年
3 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
4 李建军;比较句与比较关系识别研究及其应用[D];重庆大学;2011年
5 雷春雅;领域实体关系自动抽取研究[D];昆明理工大学;2011年
6 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
7 董萍;基于知网语义关系的中文事件信息抽取研究[D];西安电子科技大学;2010年
8 李庆玲;弱指导中文实体关系抽取方法研究[D];华东师范大学;2012年
9 王晶;无监督的中文实体关系抽取研究[D];华东师范大学;2012年
10 侯立斌;中文事件抽取与缺失角色填充的研究[D];苏州大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 林鸿飞;基于示例的文本标题分类机制[J];计算机研究与发展;2001年09期
2 朱寰,阮彤,于庆喜;文本分割算法对中文信息过滤影响研究[J];计算机工程与应用;2002年13期
3 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
4 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
5 刁倩,王永成,张惠惠,何骥;文本自动分类中的词权重与分类算法[J];中文信息学报;2000年03期
6 林鸿飞,姚天顺;基于潜在语义索引的文本浏览机制[J];中文信息学报;2000年05期
7 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
8 何新贵,彭甫阳;中文文本的关键词自动抽取和模糊分类[J];中文信息学报;1999年01期
9 林鸿飞,战学刚,姚天顺;文本层次分析与文本浏览[J];中文信息学报;1999年04期
10 杨文清,黄宜华,张福炎;中文Web文档库全文检索技术研究与实现[J];中文信息学报;1999年04期
【相似文献】
中国期刊全文数据库 前10条
1 赵君喆;何婷婷;李晶;;一种无指导命名实体关系抽取研究[J];咸宁学院学报;2009年06期
2 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
3 乐小虬,杨崇俊,刘冬林;空间命名实体的识别[J];计算机工程;2005年20期
4 何婷婷;徐超;李晶;赵君喆;;基于种子自扩展的命名实体关系抽取方法[J];计算机工程;2006年21期
5 蒋龙;周明;简立峰;;利用音译和网络挖掘翻译命名实体[J];中文信息学报;2007年01期
6 陈怀兴;尹存燕;陈家骏;;一种命名实体翻译等价对的抽取方法[J];中文信息学报;2008年04期
7 翟海军;郭勇;郭嘉丰;程学旗;;基于转移学习的命名实体挖掘技术[J];上海交通大学学报;2011年02期
8 邢富坤;;基于隶属度的命名实体自动获取研究[J];计算机应用与软件;2012年08期
9 彭庆喜;陈军威;;互联网命名实体抽取及关联关系挖掘研究[J];软件导刊;2013年03期
10 刘高军;马砚忠;段建勇;;基于维基百科的中文命名实体关联度计算[J];北方工业大学学报;2012年01期
中国重要会议论文全文数据库 前10条
1 庞薇;徐波;;基于双语平行语料的分层次命名实体抽取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 翟海军;郭勇;郭嘉丰;程学旗;;基于转移学习的命名实体挖掘技术[A];第五届全国信息检索学术会议论文集[C];2009年
3 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 罗维;吉宗诚;吕雅娟;刘群;;一种改进词语对齐的新方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 张磊;王斌;靖红芳;吴丽辉;;中文网页搜索日志中的特殊命名实体挖掘[A];第五届全国信息检索学术会议论文集[C];2009年
6 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
9 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
10 赵明明;洪宇;姚建民;朱巧明;;基于音译和网络的命名实体翻译方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前5条
1 伍大勇;搜索引擎中命名实体查询处理相关技术研究[D];哈尔滨工业大学;2012年
2 刘晓江;基于统计滚雪球模型的知识挖掘理论与方法[D];中国科学技术大学;2011年
3 郑志诚;用户查询歧义性分析研究[D];清华大学;2013年
4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 李晶;基于网络抱团发现的命名实体关系抽取[D];华中师范大学;2006年
2 周荣鹏;生物医学文献中命名实体的识别[D];大连理工大学;2009年
3 林声;可比语料中命名实体翻译等价对抽取方法研究[D];大连理工大学;2009年
4 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
5 杜俊武;基于点击数据和搜索结果片断的命名实体挖掘[D];北京理工大学;2011年
6 王鹏;从可比较语料中抽取中英命名实体等价对[D];大连理工大学;2011年
7 于凌;基于本体的命名实体检索的研究与实现[D];东北大学;2010年
8 茹旷;日汉双语命名实体对获取方法及其应用研究[D];北京交通大学;2014年
9 周磊;基于混合方法的复杂命名实体抽取研究[D];上海交通大学;2009年
10 赵君喆;汉语专业领域命名实体语义关系自动抽取研究[D];华中师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026