收藏本站
《北京语言大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

突发事件信息提取研究

杨尔弘  
【摘要】:随着Internet的飞速发展,我们被包围在信息的汪洋大海之中。准确、有效地从信息海 洋中提取有用的信息,正是信息提取任务要解决的问题。信息提取(Information Extraction,简 称IE)是指从大量的文本中提取出特定的感兴趣的信息,并以结构化的形式表现出来。其 基本目标是提高信息处理的速度和质量,把人们从大量、低效的文本阅读劳动中解放出来。 信息提取与信息检索、文本摘要等同属于文本信息处理的范畴,是自然语言处理的一个 研究领域。20世纪80年代末以来,信息提取一直是该领域的热点研究问题。美国、欧洲都 制定了相应的文本处理计划,信息提取技术及评测是其中一项重要的研究内容。有关汉语的 信息提取研究起步较晚,尚处在探索阶段。 近年来,各种突发事件频繁地发生,突发事件的应对已经成为考验政府执政能力的一个 重要方面。应对突发事件是一个系统工程,其中一个重要环节就是信息的收集、整理、加工 和发布。及时、客观、准确地收集信息,快速、高效地提取有用信息,为分析形势、制定策 略提供翔实可靠的参考数据,已经成为提高突发事件应对能力的一个重要方面,也是衡量突 发事件应对能力的一个重要指标。 本文在对突发事件新闻报道特点广泛分析的基础上,以同一突发事件的多个新闻报道 (同事件多文本)为处理对象,进行突发事件的信息提取研究。主要内容包括:同事件多文 本的数据分析,从中获取支持突发事件信息提取的有关特征:基于多特征融合的命名实体识 别(Named entity recognition)方法研究与分析;特定信息的模式自动获取(automatic pattern acquisition)方法研究;突发事件信息提取的模型研究,在此基础上获得突发事件的信息结构 及特定信息。 信息提取是一个有机融合多种资源和技术、面向实际应用的研究。我们的研究是在对文 本进行分词和词性标注的基础上进行的,与英语信息提取相比,在文本处理深度、知识资源 支持等方面都有较大的差距。因此,在研究过程中,对于每一项研究内容,我们都分析了现 有资源和文本加工深度对信息提取任务的支持和制约,探索性地研究了具有一定鲁棒性的突 发事件信息提取方法,以期为进一步的研究奠定基础、找到突破口。 本文的研究特色主要包括: 1. 提出了一个突发事件信息提取模型; 在充分分析待处理数据特点的基础上,利用同事件多文本表现出来的相关信息的优势, 根据突发事件的发展变化特点,探索了突发事件信息提取的一种模型。该模型在进行文本词 语分析的基础上,通过句子聚类的方法,自动地获取事件的信息结构,在此基础上,通过特 征的价值计算,获得特定信息的特征表达。该方法具有较强的鲁棒性,可用于任何突发事件 的文本集合。 2. 实现了一种具有较强适应性的无指导的模式获取方法; 该方法利用相关句的性质,采用简单的词语串搭配信息,获得关于特定信息的模式结构, 通过模式匹配进一步获得突发事件某个方面的具体信息。并通过模式的组合来完成动态信息 的发现; 3. 分析、论述了现有资源和基础加工对信息提取任务的支持和制约,探讨了在弱知识 条件下信息提取技术的发展空间。 本文研究的信息提取与传统的信息提取任务有些区别,它介于传统的信息提取与文本自 动摘要之间,信息提取的结果也可以更直接地服务于文本摘要和问答系统。
【关键词】:信息提取 突发事件 命名实体识别 模式获取 信息结构 特定信息 特征分析
【学位授予单位】:北京语言大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:G202
【目录】:
  • 摘要5-7
  • ABSTRACT7-15
  • 第一章 绪论15-26
  • 1.1 本文动因15-17
  • 1.2 研究背景17-22
  • 1.2.1 关于信息提取17-20
  • 1.2.2 信息提取与信息检索20
  • 1.2.3 信息提取的一般过程20-21
  • 1.2.4 信息提取的处理内容21-22
  • 1.2.5 信息提取研究的关键内容22
  • 1.3 本文研究目标22-23
  • 1.4 研究内容23-24
  • 1.5 本研究的工作基础24-25
  • 1.6 研究特色25
  • 1.7 论文结构25-26
  • 第二章 信息提取综述26-52
  • 2.1 一些基本术语26-27
  • 2.2 信息提取研究的代表性工作27-40
  • 2.2.1 MUC简介28-32
  • 2.2.2 ACE简介32-40
  • 2.3 信息提取的技术40-48
  • 2.3.1 基于语言分析的信息提取技术40-41
  • 2.3.2 知识获取技术41-45
  • 2.3.3 命名实体的识别45-46
  • 2.3.4 实体间关系的识别46
  • 2.3.5 指代的解决46-47
  • 2.3.6 事件识别47-48
  • 2.4 信息提取的内容研究48-49
  • 2.5 信息提取的应用系统49
  • 2.6 英语中进行信息提取的方法小结49-50
  • 2.7 汉语信息提取研究现状50
  • 2.8 本文研究定位50-51
  • 2.9 本章小结51-52
  • 第三章 突发事件文本特征分析52-70
  • 3.1 突发事件新闻报道的特征52-55
  • 3.1.1 形式方面52-54
  • 3.1.2 内容方面54-55
  • 3.2 文本中的指代现象55-58
  • 3.2.1 指代55
  • 3.2.2 指代的消解55-56
  • 3.2.3 突发事祥报道中的指代现象56-58
  • 3.3 文本的词汇语义关系58-62
  • 3.3.1 文本中的词语语义聚类59-60
  • 3.3.2 文本中的词汇链60-61
  • 3.3.3 一点讨论61-62
  • 3.4 关键词串62-66
  • 3.4.1 文本中词语串的提取方法62-65
  • 3.4.2 关键串的计算方法65-66
  • 3.5 突发事件的时间信息66-68
  • 3.5.1 时间表达式的类型66-67
  • 3.5.2 时间信息的识别与规范化67-68
  • 3.6 本章小结68-70
  • 第四章 命名实体识别分析70-94
  • 4.1 引言70-71
  • 4.2 命名实体识别71
  • 4.3 资源建设71-72
  • 4.4 命名实体识别模型72-76
  • 4.4.1 问题定义72-73
  • 4.4.2 相关定义73-74
  • 4.4.3 最大熵原理74-75
  • 4.4.4 参数估计75-76
  • 4.5 多特征融合的中文人名识别方法76-92
  • 4.5.1 识别的对象界定及特点分析76-77
  • 4.5.2 特征集77-82
  • 4.5.3 特征选择实验82-84
  • 4.5.4 潜在人名的提取84-88
  • 4.5.5 人名识别实验88-92
  • 4.6 本章小结92-94
  • 第五章 模式的自动获取94-111
  • 5.1 引言94
  • 5.2 模式自动获取的相关工作94-97
  • 5.2.1 Riloff的工作94-95
  • 5.2.2 Yangarber的工作95
  • 5.2.3 Chikashi NOBATA的工作95-96
  • 5.2.4 Sudo的工作96-97
  • 5.3 模式及其提取的过程97-100
  • 5.3.1 突发事件信息表达的特点97-98
  • 5.3.2 模式的表达98-99
  • 5.3.3 模式的分类99
  • 5.3.4 模式获取的方法99-100
  • 5.4 无指导的模式提取方法100-103
  • 5.4.1 候选模式的产生算法100-101
  • 5.4.2 模式的获取方法101-102
  • 5.4.3 模式的泛化102-103
  • 5.5 实验及分析103-110
  • 5.5.1 实验数据和实验步骤103
  • 5.5.2 评价内容和评价方法103-105
  • 5.5.3 实验结果及分析105-108
  • 5.5.4 结论108-110
  • 5.6 本章小结110-111
  • 第六章 突发事件的信息提取111-130
  • 6.1 引言111-112
  • 6.2 突发事件信息提取的模型112-113
  • 6.3 问题定义113-115
  • 6.4 突发事件信息结构的获取115-123
  • 6.4.1 句子的聚类算法115-117
  • 6.4.2 句子的特征117-118
  • 6.4.3 句子的相似度计算118-120
  • 6.4.4 句子聚类实验120-123
  • 6.5 特定侧面的信息获取123-126
  • 6.6 突发事件信息提取实验126-127
  • 6.6.1 事件的信息提取126
  • 6.6.2 信息提取实验126-127
  • 6.7 本章小结127-130
  • 第七章 信息提取实验系统130-137
  • 7.1 系统结构130-131
  • 7.2 工作流程131-135
  • 7.2.1 数据准备131-132
  • 7.2.2 信息提取132-135
  • 7.3 本章小结135-137
  • 第八章 结束语137-140
  • 8.1 全文总结137
  • 8.2 进一步的工作137-140
  • 参考文献140-145
  • 附录1 马德里311爆炸案词语串示例145-148
  • 附录2 海啸词语串示例148-151
  • 附录3 文本的词汇链151-154
  • 附录4 海啸救援特定信息154-156
  • 附录5 马德里311爆炸案伤亡信息示例156-159
  • 附录6 海啸伤亡信息示例159-161
  • 附录7 海啸“救援”类部分句子及词汇链161-166
  • 附录8 西班牙“基本信息”类部分句子及词汇链166-169
  • 附录9 西班牙各个侧面信息的特征项示例169-171
  • 附录10 海啸各个侧面信息的特征项示例171-173
  • 作者在攻读博士学位期间的科研情况173-175
  • 致谢175-176

【引证文献】
中国期刊全文数据库 前10条
1 刘晓东;朱翊;孙立坚;柳棽;;面向突发事件的地理信息服务研究[J];测绘科学;2010年06期
2 刘晓东;马强;邓忠军;朱翊;;突发事件的地理信息定位匹配方法研究[J];地理信息世界;2011年03期
3 霍娜;吕国英;;基于规则匹配的灾难性追踪事件信息抽取的研究[J];电脑开发与应用;2012年06期
4 王宁;王延章;;应急管理体系及其业务流程研究[J];公共管理学报;2007年02期
5 付剑锋;刘宗田;付雪峰;周文;仲兆满;;基于依存分析的事件识别[J];计算机科学;2009年11期
6 林达真;李绍滋;曹冬林;;基于时间分布特征的博客突发事件检测[J];计算机工程与科学;2010年10期
7 陈炯;张永奎;;一种基于文档差异度的Web突发事件新闻个性化推荐算法[J];计算机应用与软件;2010年11期
8 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
9 杨尔弘;曾青青;李婷婷;;事件信息结构分析[J];中文信息学报;2012年03期
10 刘敬培;李江;季文平;潘鹏辉;;面向文本的事件信息抽取方法的研究[J];计算机与现代化;2012年07期
中国重要会议论文全文数据库 前4条
1 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 刘晓东;朱翊;柳棽;;基于突发事件的空间信息定位匹配方法研究[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
3 陈慧;张普;;基于DCC动态流通语料库的中文组织名监测与研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 单建芳;面向事件的文本表示研究[D];上海大学;2012年
2 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
3 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
4 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
5 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
6 丁锋;基于OB4LAC的政府组织授权系统模型研究[D];大连理工大学;2009年
7 周科松;全文检索与GIS一体化及在应急管理中的应用研究[D];华东师范大学;2009年
8 吴志山;定制式数字化汉语教材辅助分析与重组方法研究[D];北京语言大学;2009年
9 石磊;企业灾难捐赠的决策模型与效果评估研究[D];中国科学技术大学;2010年
10 刘智;网络社区危机信息传播与干预研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
2 周婧歆;基于ECA规则的突发事件应急信息中心建模[D];大连理工大学;2011年
3 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
4 张锡平;危机信息的整合沟通模式研究[D];中国科学技术大学;2011年
5 田彩华;英语灾难新闻书面报道的文体研究[D];太原理工大学;2008年
6 董萍;基于知网语义关系的中文事件信息抽取研究[D];西安电子科技大学;2010年
7 孙中友;基于主题的事件融合技术的研究与实现[D];苏州大学;2010年
8 霍娜;突发事件追踪报道信息抽取的研究[D];山西大学;2012年
9 陈帅;危机管理情境下的网络关键信息传播及政府应对研究[D];电子科技大学;2012年
10 韩永峰;网络新闻突发事件信息抽取技术研究[D];解放军信息工程大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 廖乐健,曹元大,李新颖;基于Ontology的信息抽取[J];计算机工程与应用;2002年23期
3 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
4 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
5 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
6 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
7 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
8 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
9 郑家恒,王兴义,李飞;信息抽取模式自动生成方法的研究[J];中文信息学报;2004年01期
10 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
中国重要会议论文全文数据库 前1条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 单建芳;面向事件的文本表示研究[D];上海大学;2012年
2 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
3 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
4 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
5 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
6 丁锋;基于OB4LAC的政府组织授权系统模型研究[D];大连理工大学;2009年
7 周科松;全文检索与GIS一体化及在应急管理中的应用研究[D];华东师范大学;2009年
8 吴志山;定制式数字化汉语教材辅助分析与重组方法研究[D];北京语言大学;2009年
9 石磊;企业灾难捐赠的决策模型与效果评估研究[D];中国科学技术大学;2010年
10 刘智;网络社区危机信息传播与干预研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前2条
1 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
2 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
2 康伟;;毕业(设计)论文题目审核及选题管理系统[J];辽宁科技大学学报;2009年03期
3 李玉鑑;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期
4 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
5 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
6 胡思康;曹元大;;Web网页知识获取技术[J];北京理工大学学报;2006年12期
7 李蕾;周延泉;王菁华;;基于全信息的中文信息抽取系统及应用[J];北京邮电大学学报;2005年06期
8 王智强;李蕾;王枞;;基于决策树的汉语代词共指消解[J];北京邮电大学学报;2006年04期
9 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
10 何章鸿;董守斌;;基于XPath的广告数据提取研究[J];江西师范大学学报(自然科学版);2008年02期
中国重要会议论文全文数据库 前10条
1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
7 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
8 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
9 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
10 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
3 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
4 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
5 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
6 杨一飞;语篇中的连接手段[D];复旦大学;2011年
7 邱明波;动词的指向对汉语第三人称代词和反身代词的句内回指的制约[D];复旦大学;2011年
8 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
9 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
10 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
4 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
5 王浩;NetFlow数据处理与异常检测研究[D];哈尔滨工程大学;2010年
6 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
7 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
8 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
9 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年
10 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 曹春雷;李门楼;罗赟莹;孙占法;;GIS技术在地质灾害区划中的应用——以山西省兴县为例[J];安徽农业科学;2007年07期
2 苏英;刘晓;;2001~2007年四川及周边地区地震时空分布特征[J];安徽农业科学;2009年35期
3 陈安;赵燕;;我国应急管理的进展与趋势[J];安全;2007年03期
4 徐国庆;关于汉语词汇层的研究[J];北京大学学报(哲学社会科学版);1999年02期
5 徐国庆;再论现代汉语词汇层[J];北方论丛;1998年06期
6 石建军,许国华,何民,宋延;交通地理信息系统数据模型的研究进展[J];北京工业大学学报;2004年03期
7 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
8 陈英,李丰,邬延风;软件复用技术研究[J];北京理工大学学报;1998年06期
9 王文生;关于机动车辆安全行驶与道路交通事故[J];北京汽车;1998年03期
10 亓华;中国对外汉语教学界文化研究20年述评[J];北京师范大学学报(社会科学版);2003年06期
中国重要会议论文全文数据库 前10条
1 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
3 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
4 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
5 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 杨尔弘;方莹;;突发事件信息提取中模式的自动获取[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 冯志伟;;自然语言处理中的理性主义和经验主义[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 姚天昉;娄德成;;汉语语句主题语义倾向分析方法的研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 唐慧丰;谭松波;程学旗;;监督学习方法在语气挖掘中的应用研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 方付建;突发事件网络舆情演变研究[D];华中科技大学;2011年
2 张岩;非常规突发事件态势演化和调控机制研究[D];中国科学技术大学;2011年
3 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
4 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
5 刘岩;关于图的最大匹配问题的若干结果[D];郑州大学;2000年
6 刘小红;PKI:证书状态信息分发方法研究和系统设计[D];浙江大学;2001年
7 干红华;基于事件的因果关系可计算化分析研究[D];浙江大学;2003年
8 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
9 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
10 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
中国硕士学位论文全文数据库 前10条
1 张怡;政府在应对突发公共事件中协调与媒体关系的研究[D];苏州大学;2010年
2 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
3 蔡颂梅;语义增强的关系相似度度量算法研究[D];华东师范大学;2011年
4 潘胜一;基于倒排索引的压缩算法性能研究[D];杭州电子科技大学;2009年
5 谷宇;HL7消息解析及传输技术的研究与实现[D];内蒙古科技大学;2010年
6 杨宸铸;基于HADOOP的数据挖掘研究[D];重庆大学;2010年
7 李勇君;基于Hadoop的海量期货数据的分布式存储和算法分析[D];天津大学;2012年
8 李正文;基于SVM分类算法的主题爬虫研究[D];哈尔滨工程大学;2011年
9 过志峰;基于高效空间存取机制的地理空间数据查询研究[D];中国科学院研究生院(遥感应用研究所);2002年
10 贾爱平;科技文献中术语定义的语言模式研究[D];北京语言文化大学;2002年
【二级引证文献】
中国期刊全文数据库 前10条
1 曹一冰;华一新;汪军;王关军;;基于DotLucene的全文检索及其在GIS中的应用[J];测绘工程;2011年06期
2 李志刚;李永练;王建春;;地理信息储备用于应急保障需要解决的问题分析[J];测绘技术装备;2011年01期
3 曾小兵;邱丽娜;张普;张志平;杨尔弘;;语言监测中词语构造能力的分析及其应用[J];长江学术;2011年03期
4 霍娜;吕国英;;基于规则匹配的灾难性追踪事件信息抽取的研究[J];电脑开发与应用;2012年06期
5 李明洁;;流行语的概念梳理与符号学的新观察[J];符号与传媒;2012年01期
6 邹煜;李开拓;;汉语新词语监测:监测的不只是语言——新词语监测与研究5年回顾[J];北华大学学报(社会科学版);2012年05期
7 马彬;洪宇;杨雪蓉;姚建民;朱巧明;;基于语义依存线索的事件关系识别方法研究[J];北京大学学报(自然科学版);2013年01期
8 罗文伯;;社会网络视角下的微博研究[J];今传媒;2013年02期
9 曹建成;张智;贠建明;;陕西省应急体系地理信息平台设计与实现[J];测绘通报;2012年S1期
10 孙帅;周毅;;2008-2012年国内突发事件网络舆情管理研究综述[J];电子政务;2013年05期
中国重要会议论文全文数据库 前6条
1 王雅莉;古丽拉·阿东别克;;哈萨克语通用词汇自动提取方法研究与实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 刘知远;孙茂松;;基于WEB的计算机领域新术语的自动检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 王强军;张莉;张普;;面向术语提取和定义识别的评测语料库建设[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 韩艳;林煜熙;姚建民;;基于统计信息的未登录词的扩展识别方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 曾小兵;邱丽娜;张普;张志平;杨尔弘;;语言监测中词语构造能力的分析及其应用[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 曹建成;张智;贠建明;;陕西省应急体系地理信息平台设计与实现[A];第四届“测绘科学前沿技术论坛”论文精选[C];2012年
中国博士学位论文全文数据库 前10条
1 孙云潭;中国海洋灾害应急管理研究[D];中国海洋大学;2010年
2 黄健;城市供水水质监测与预警平台构建及关键技术研究[D];中国地质大学(北京);2011年
3 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
4 郭玉清;网络学习社群的信息聚集与推送机制研究[D];华东师范大学;2011年
5 潘奇;企业慈善捐赠的形成机制及其价值机理研究[D];浙江大学;2011年
6 周慧娟;铁路应急管理中的预案管理与资源配置优化[D];北京交通大学;2011年
7 王绍仁;震后应急物流系统优化中的LRP研究[D];西南交通大学;2010年
8 单建芳;面向事件的文本表示研究[D];上海大学;2012年
9 姜伟;基于知识发现的林火灾害应急管理研究[D];北京林业大学;2008年
10 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前10条
1 苟婷婷;地震应急管理时间操纵法研究[D];大连理工大学;2010年
2 杨帅;电子政务中面向组织协作的访问控制模型研究[D];大连理工大学;2010年
3 张莉莉;青岛市突发公共事件应急管理研究[D];中国海洋大学;2010年
4 史迎馨;建筑图中有限自然语言的分析与理解的研究[D];长春工业大学;2010年
5 陈莉莉;中外防震减灾管理体系比较研究[D];云南大学;2010年
6 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
7 胡浩;突发通信工程的应急管理[D];北京邮电大学;2010年
8 孙杰;我国自然灾害应对的政府绩效评估研究[D];浙江大学;2011年
9 汪婷婷;英语灾难新闻报道的语用学解释[D];华东师范大学;2011年
10 吕吟;公共危机与微博传播[D];浙江大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报;1999年03期
3 顾阳;论元结构理论介绍[J];国外语言学;1994年01期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
6 王建勇,谢正茂,雷鸣,李晓明;近似镜像网页检测算法的研究与评价[J];电子学报;2000年S1期
7 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
8 马红妹,王挺,陈火旺;汉语篇章时间短语的分析与时制验算[J];计算机研究与发展;2002年10期
9 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
10 郑毅,吴斌,史忠植;基于概念空间的文本检索系统[J];计算机工程与应用;2002年12期
中国重要会议论文全文数据库 前3条
1 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 李芸;王强军;张普;;信息技术领域术语自动提取和动态更新研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 刘桐菊;于浩;杨沐昀;;基于TFIDF的专业领域词汇获取的研究[A];第一届学生计算语言学研讨会论文集[C];2002年
中国硕士学位论文全文数据库 前1条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
【相似文献】
中国期刊全文数据库 前10条
1 赵君喆;何婷婷;李晶;;一种无指导命名实体关系抽取研究[J];咸宁学院学报;2009年06期
2 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
3 乐小虬,杨崇俊,刘冬林;空间命名实体的识别[J];计算机工程;2005年20期
4 何婷婷;徐超;李晶;赵君喆;;基于种子自扩展的命名实体关系抽取方法[J];计算机工程;2006年21期
5 蒋龙;周明;简立峰;;利用音译和网络挖掘翻译命名实体[J];中文信息学报;2007年01期
6 陈怀兴;尹存燕;陈家骏;;一种命名实体翻译等价对的抽取方法[J];中文信息学报;2008年04期
7 翟海军;郭勇;郭嘉丰;程学旗;;基于转移学习的命名实体挖掘技术[J];上海交通大学学报;2011年02期
8 邢富坤;;基于隶属度的命名实体自动获取研究[J];计算机应用与软件;2012年08期
9 彭庆喜;陈军威;;互联网命名实体抽取及关联关系挖掘研究[J];软件导刊;2013年03期
10 王睿,张洁,张由仪,于禛,姚天昉;基于混合模型的中文命名实体抽取系统[J];清华大学学报(自然科学版);2005年S1期
中国重要会议论文全文数据库 前10条
1 庞薇;徐波;;基于双语平行语料的分层次命名实体抽取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 翟海军;郭勇;郭嘉丰;程学旗;;基于转移学习的命名实体挖掘技术[A];第五届全国信息检索学术会议论文集[C];2009年
3 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 罗维;吉宗诚;吕雅娟;刘群;;一种改进词语对齐的新方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 张磊;王斌;靖红芳;吴丽辉;;中文网页搜索日志中的特殊命名实体挖掘[A];第五届全国信息检索学术会议论文集[C];2009年
6 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
9 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
10 赵明明;洪宇;姚建民;朱巧明;;基于音译和网络的命名实体翻译方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前6条
1 伍大勇;搜索引擎中命名实体查询处理相关技术研究[D];哈尔滨工业大学;2012年
2 刘晓江;基于统计滚雪球模型的知识挖掘理论与方法[D];中国科学技术大学;2011年
3 郑志诚;用户查询歧义性分析研究[D];清华大学;2013年
4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
6 怀宝兴;基于概率主题模型的情境建模方法研究[D];中国科学技术大学;2014年
中国硕士学位论文全文数据库 前10条
1 李晶;基于网络抱团发现的命名实体关系抽取[D];华中师范大学;2006年
2 周荣鹏;生物医学文献中命名实体的识别[D];大连理工大学;2009年
3 林声;可比语料中命名实体翻译等价对抽取方法研究[D];大连理工大学;2009年
4 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
5 杜俊武;基于点击数据和搜索结果片断的命名实体挖掘[D];北京理工大学;2011年
6 王鹏;从可比较语料中抽取中英命名实体等价对[D];大连理工大学;2011年
7 于凌;基于本体的命名实体检索的研究与实现[D];东北大学;2010年
8 茹旷;日汉双语命名实体对获取方法及其应用研究[D];北京交通大学;2014年
9 张静;基于英汉平行语料库的命名实体对自动获取方法研究[D];北京交通大学;2014年
10 周磊;基于混合方法的复杂命名实体抽取研究[D];上海交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026