收藏本站
《北京邮电大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

信息抽取中关键技术的研究

张素香  
【摘要】: 随着Internet技术的不断发展和网上电子文本的日益增多,使得用户从网上获取有效信息变得日趋困难。面对信息爆炸带来的问题,亟需一些智能化工具来帮助人们从海量信息中获取真正需要的信息,信息抽取正是基于这一需求而产生的。信息抽取目前已经成为人们研究的热点,根据ACE(Automatic Content Extraction)会议评测任务的划分,它主要研究命名实体识别、实体关系抽取、指代消解、事件探测这四个领域。其中,实体识别和关系抽取又是这些任务中最重要的部分。本文对信息抽取技术的研究主要集中在命名实体识别和实体关系抽取两个方面,将先进的机器学习算法和全新的理论方法—全信息理论运用到我们的整个研究过程中。本文的贡献主要有以下几个方面: 1、提出了一种专家知识和多模型相结合的命名实体识别方法,充分考虑了专家知识在命名实体识别中的作用。根据实体类型的不同,分别采用不同的实现方法,人名、地名识别采用先规则后统计的方法,而组织机构名识别则采用先统计后规则的方法。统计学习方法应用了最大熵(Maximum Entropy,ME)和条件随机场(Conditional Random Fields,CRFs)算法。命名实体识别的主要贡献详细描述如下: 首先,命名实体识别系统利用专家知识和规则进行人名、地名的候选,然后再将候选的实体输入统计模型进行判断,其中,在处理候选人名时,为了防止一个外国译名被部分识别为一个或几个中国人名,提出了动态优先级方法,该方法首先建立高频的歧义字,这些字既可用作中国人名的姓氏,又可经常出现在外国译名中,实体识别系统在处理候选人名时一旦遇到这些高频歧义字,利用前后向探测方法灵活地调用中外人名识别模型,实验证明,该方法极大地提高了人名识别的性能指标。地名的候选也充分利用了“省、市、山、湖、自治县”等明显的后缀信息以及“奔赴、赴、故都”等前缀信息,作为触发地名识别模块工作的条件。模型中的特征包括了各个层面:实体的上下文环境、上下文的特定语义、实体中不同字或词对实体识别的贡献度等。本文使用了概率信息,增强了样本的差异性,提高了人名、地名识别的召回率和准确率。除此之外,还首次提出自信度函数、顺序等特征,这些特征在实体识别中发挥了巨大作用。 其次,细化分类模型。为了提高实体识别的性能指标,采用层叠方式的多模型结构,模型分为中国人名、外国译名、地名和组织机构名等识别模型,针对不同的模型抽取了不同的特征。 第三,由于组织机构名长度不一,很难直接用规则的方法进行机构名候选,因此,本文采用先统计后规则的方法,并借鉴了短语识别技术,与常用的短语BIO识别方法相比,本文定义了BILO四类标记,增加一类标记L。采用BILO方法,将机构名识别转化为相应的标记分类任务,使机构名识别任务简单化。并且,本文还针对不同的机器学习方法开发了相应特征。最后,利用规则——特殊模板来识别利用统计方法没有识别出的机构名。 利用该命名实体识别系统参加了2006年SIGHAN中的命名实体比赛,实验语料来自微软亚洲研究院,获取了最好成绩。本文还利用1998年1月的《人民日报》进行实验,对比了ME、CRFs用于汉语命名实体识别的实验结果,通过对结果的分析和比较,表明CRFs模型在性能上优于ME模型。 2、提出了基于CRFs的实体关系自动抽取方法,主要自动抽取句子中二元实体之间的关系,主要从以下两个方面完成: 首先,收集和标注语料。以“人事变动”领域为例,基于《人民日报》和互联网进行语料收集工作,将收集到的语料进行切分、POS等预处理后,再改写为XML树。在此基础上,我们标注了三类实体关系:职位、人、公司三者之间的关系,以及一定数量的反例,从而为后续研究打下基础。 其次,在完成语料的收集、整理和标注工作后,建立了实验系统模型,利用CRFs算法进行实体关系的自动抽取实验。针对不同的实体关系选取不同特征,实验结果证明,CRFs和其它算法相比,可以有效地解决二元实体关系的自动抽取问题。 3、为了正确获取文本中隐含的实体关系并推送给用户一个更完整的结果,以全信息理论为方法论,在该方法论的指引下,充分利用语法、语义、语用等方面的知识,挖掘、获取多个实体之间的关系。具体表现为以下两点: 首先利用机器学习方法获取分析实体关系时必不可少的语法知识,该语法知识由若干抽取模板组成。为了克服获取大规模标注语料这一困难,提出利用无监督的学习方法——Bootstrapping方法获取抽取模板,并提出了层次知识获取模型,该模型由内外两层知识获取模块组成,内外两层模块互相嵌套获取了实体关系抽取所需的领域专业特征词表和抽取模板库,从而完成语法知识的获取任务。 其次,建立全信息知识库。采用语义框架的表示方法,结合“模式—行为”规则,对抽取模板进行语义分析和施效结果分析,挖掘出隐含的实体关系,同时修正已得到的错误实体关系,通过对最终实体关系的推理和整合,给用户推送一个完整的结果。实验结果表明,基于全信息的实体关系获取方法能有效地解决多个实体关系的同时获取问题。
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前3条
1 刘鹏博;车海燕;陈伟;;知识抽取技术综述[J];计算机应用研究;2010年09期
2 倪吉;孔芳;朱巧明;李培峰;;基于可信度模型的中文人名识别研究[J];中文信息学报;2011年03期
3 来建梅;曹慧;马金刚;;中医药领域信息抽取技术的研究与应用[J];山东科学;2011年06期
中国重要会议论文全文数据库 前1条
1 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前5条
1 孙静宇;基于CBR的协同Web搜索研究[D];太原理工大学;2010年
2 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
3 车海燕;面向中文自然语言Web文档的自动知识抽取和知识融合[D];吉林大学;2008年
4 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
5 丁艳辉;面向Web数据集成的数据抽取问题研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
2 郎凤举;基于热点网站内容分析的超链接提取研究[D];中国海洋大学;2010年
3 陈慧炜;刑事案件文本信息抽取研究[D];南京师范大学;2011年
4 胡航丽;基于Web的股评观点倾向性分析研究[D];北京工商大学;2010年
5 李建军;比较句与比较关系识别研究及其应用[D];重庆大学;2011年
6 倪吉;中文人名跨文档指代消解研究[D];苏州大学;2011年
7 王慧慧;基于社会化网络帮助中心的设计与实现[D];电子科技大学;2011年
8 刘乐;“中国科技论文在线”论文质量评价研究[D];长春工业大学;2011年
9 王铮;基于CRF的古籍地名自动识别研究[D];广西民族大学;2008年
10 杨华;基于最大熵模型的中文命名实体识别方法研究[D];哈尔滨工程大学;2008年
【参考文献】
中国期刊全文数据库 前10条
1 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
2 钟义信;面向智能研究的全信息理论——纪念Shannon信息论50周年[J];北京邮电大学学报;1998年04期
3 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
4 袁颖芬 ,张玥杰;英汉机译中未登录词的识别[J];电子技术;2004年02期
5 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
6 王鑫,王丁,李向宏;基于汉语分词的信息抽取技术[J];信息技术;2003年04期
7 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
8 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
9 尤昉,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期
10 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
中国硕士学位论文全文数据库 前1条
1 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
2 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
3 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
4 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
5 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
6 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期
7 葛文英;吕靖;;基于条件随机场的中文人名识别[J];安阳师范学院学报;2010年05期
8 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期
9 邹心遥;姚若河;;基于LSSVM的小子样元器件寿命预测[J];半导体技术;2011年09期
10 李卓远,吴为民,王旸,洪先龙;一种新的光学临近校正方法(英文)[J];半导体学报;2003年12期
中国重要会议论文全文数据库 前10条
1 陈红兵;;基于XML的电子政务信息集成框架[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
3 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
4 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
5 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
6 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
7 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
8 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中国自动化学会控制理论专业委员会D卷[C];2011年
9 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前10条
1 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 王红;基础地理信息地形数据库信息量度量方法研究[D];辽宁工程技术大学;2010年
5 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
6 苏日建;信息测量系统及其若干问题的研究[D];华中科技大学;2010年
7 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
8 彭永祥;基于旅游者收益的地质公园核心竞争力及其评价[D];陕西师范大学;2010年
9 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
10 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
4 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
5 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
6 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
7 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
8 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
9 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
10 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
2 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
3 付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军;;基于实体识别的在线主题检测方法[J];北京大学学报(自然科学版);2009年02期
4 刘芸;唐发根;林广艳;;一种改进的近似支持向量机算法[J];北京航空航天大学学报;2007年09期
5 来新夏;中国地方志的史料价值及其利用[J];国家图书馆学刊;2005年01期
6 刘刚;中国方志书目与索引述略[J];北京图书馆馆刊;1997年01期
7 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期
8 韩光辉;论中国地名学发展的三个阶段[J];北京社会科学;1995年04期
9 张玉华,潘云涛,马峥;科技论文评估方法研究[J];编辑学报;2004年04期
10 郭红;潘云涛;;影响因子分数平均值:一个评价学术论文质量的新指标[J];编辑学报;2006年06期
中国重要会议论文全文数据库 前5条
1 欧阳佑;李素建;;条件随机域模型和实验分析[A];第三届学生计算语言学研讨会论文集[C];2006年
2 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
4 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
5 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
2 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 周伟军;拟牛顿法及其收敛性[D];湖南大学;2006年
5 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
6 谢能付;基于语义Web技术的知识融合和同步方法研究[D];中国科学院研究生院(计算技术研究所);2006年
7 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
8 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
9 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
10 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 吴贵鑫;云计算中的MapReduce并行编程模式研究[D];河南理工大学;2010年
2 梁雷;基于网络评论的客户观点挖掘方法研究[D];哈尔滨工业大学;2010年
3 杨宸铸;基于HADOOP的数据挖掘研究[D];重庆大学;2010年
4 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
5 吕晓辉;Web信息提取技术研究[D];西北工业大学;2001年
6 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
7 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
8 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
9 董树明;半结构化Web信息抽取技术及其应用研究[D];东南大学;2004年
10 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 努尔比亚·吐拉甫;于洪志;李亚超;;基于CRF的维吾尔文命名实体识别研究[J];消费电子;2012年07期
2 胡人月;姚逸;;中医药信息学的应用研究概述[J];大众科技;2012年08期
3 顾佼佼;姜文志;栗飞;胡文萱;;基于条件随机场的实时入侵检测系统框架实现[J];海军航空工程学院学报;2011年05期
4 姜文志;顾佼佼;胡文萱;栗飞;;条件随机场模型的应用研究及改进[J];计算机与现代化;2011年11期
5 陈巧;施佺;;基于蚂蚁算法的Deep Web页面信息抽取方法研究[J];煤炭技术;2013年02期
6 牛之贤;孙静宇;石淑萍;;基于采样特异性因子的实时异常检测[J];计算机科学;2013年03期
7 邱泉清;苗夺谦;张志飞;;中文微博命名实体识别[J];计算机科学;2013年06期
8 郑彦宁;化柏林;;句子级知识抽取在情报学中的应用分析[J];情报理论与实践;2011年12期
9 郑霞;陈建国;;基于XML的Web内容挖掘方法[J];沈阳大学学报(自然科学版);2012年03期
10 朱锁玲;包平;;方志类古籍地名识别及分析研究——以《方志物产》(广东分卷)为例[J];图书馆论坛;2012年04期
中国博士学位论文全文数据库 前7条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
3 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
4 叶育鑫;语义Web下的知识搜索及其核心技术[D];吉林大学;2010年
5 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
6 李思;WEB观点挖掘中关键问题的研究[D];北京邮电大学;2012年
7 王芳;基于本体的广域农业信息服务系统关键技术研究[D];河北农业大学;2012年
中国硕士学位论文全文数据库 前10条
1 蔡颂梅;语义增强的关系相似度度量算法研究[D];华东师范大学;2011年
2 张东;基于语义相似度的地理信息检索技术研究[D];山东农业大学;2011年
3 常卫丽;领域本体在中文命名实体识别中的应用研究[D];武汉理工大学;2011年
4 徐德;关于互联网文本数据挖掘的一些关键技术研究[D];电子科技大学;2011年
5 徐秀星;Web数据集成中全局模式构建方法研究[D];山东大学;2011年
6 金昊;内容相关性驱动的Web资源离群点挖掘技术研究与系统实现[D];西南交通大学;2010年
7 王静;基于熵原理的电能质量综合评估新方法[D];天津大学;2010年
8 张佳宝;基于条件随机场的中文命名实体识别研究[D];国防科学技术大学;2010年
9 林伟贇;基于海量网页的同类命名实体共现统计规律的研究[D];北京工业大学;2011年
10 邓冰娜;面向博客的垃圾评论识别方法研究[D];河北大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
2 邱广君,张俐,王宝库,朱靖波,邱波;汉语信息处理中的语义关系类型分析[J];东北大学学报;1998年01期
3 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
4 钟义信;知行学引论——信息 知识 智能的统一理论[J];中国工程科学;2004年06期
5 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
6 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
7 孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期
8 陈其晖,应志伟,柴佩琪;基于歧义二叉树的汉语分词方法[J];计算机辅助工程;1999年04期
9 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
10 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
中国重要会议论文全文数据库 前2条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前1条
1 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
【相似文献】
中国期刊全文数据库 前10条
1 姜维;王晓龙;关毅;赵健;;基于多知识源的中文词法分析系统[J];计算机学报;2007年01期
2 王俊生,韦钰;复参数最大熵图像重建的剑桥算法[J];通信学报;1994年06期
3 吕红,李时光,徐问之,闫旭,吕怡;不完全扇形投影数据的图象重建算法研究[J];重庆大学学报(自然科学版);1997年05期
4 张晓艳;王挺;陈火旺;;基于混合统计模型的汉语命名实体识别方法[J];计算机工程与科学;2006年06期
5 吴谨,李娟,刘成云,夏贝贝;基于最大熵的灰度阈值选取方法[J];武汉科技大学学报(自然科学版);2004年01期
6 余卫雄,姜礼平;基于粗集和最大熵的模式识别方法[J];海军工程大学学报;2004年03期
7 江兴方,陶纯堪,是度芳;用最大熵方法改善图像质量[J];江苏工业学院学报;2005年01期
8 魏明果,刘润泽;射线方程及最大熵图像重建方法的应用研究[J];三峡大学学报(自然科学版);1997年02期
9 陈韶华;最大熵少数投影层析图像重建新算法[J];湖北大学学报(自然科学版);2000年02期
10 陈文庆,李勤,姚伽华;基于最大熵模型的垃圾邮件过滤技术[J];广西师范学院学报(自然科学版);2005年01期
中国重要会议论文全文数据库 前10条
1 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
3 李渝勤;孙丽华;;面向互联网舆情的热词分析技术[A];第六届全国信息检索学术会议论文集[C];2010年
4 付瑞吉;车万翔;刘挺;;一种基于分类方法的音乐命名实体识别技术[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
5 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 亢世勇;常宝宝;刘海润;徐艳华;俞士汶;;全信息标注语料库的开发与应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 王玉明;;最大熵可靠性评估方法的改进[A];中国工程物理研究院科技年报(2003)[C];2003年
8 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
9 孙萌;姚建民;吕雅娟;刘群;姜文斌;;基于最大熵短语重排序模型的特征抽取算法改进[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 宋景明;梁生正;杨高印;冉学锋;;全信息地质地球物理综合解释方法与效果[A];2001年中国地球物理学会年刊——中国地球物理学会第十七届年会论文集[C];2001年
中国重要报纸全文数据库 前10条
1 黄刚、特约通讯员崔铁良;沈阳军区某师健全信息安全防范手段[N];解放军报;2003年
2 王妙发;理想的考古报告——不厌其详的“全信息报告”[N];中国文物报;2001年
3 王斌;金鹰集团:信息化浪尖上的“弄潮儿”[N];中国工业报;2007年
4 通讯员 梁晔;多措并举推进平安建设[N];巴彦淖尔日报(汉);2008年
5 刘艳 马达;做大市场 服务全网[N];中国邮政报;2007年
6 新华;网上炒股购物谨防病毒窃密[N];大众科技报;2007年
7 刘金平;北京正在形成“从农田到餐桌”全程监管体系[N];中华新闻报;2007年
8 谢才能 陈庄梯;给特种设备装上“监控眼”[N];中国质量报;2004年
9 李建韬;美军新型信息战凸显[N];解放军报;2002年
10 记者 傅春秘 通讯员 王东琦;靠“中国创造”闯国际市场[N];秦皇岛日报;2006年
中国博士学位论文全文数据库 前10条
1 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
2 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
3 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
4 滕海文;基于最大熵的结构两相优化设计[D];北京工业大学;2002年
5 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
6 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
7 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
8 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
9 陈军;短信号分析技术及其在故障诊断中的应用[D];武汉理工大学;2003年
10 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年
2 孙静;基于组合分类器的生物命名实体识别[D];大连理工大学;2010年
3 任登君;面向机器学习方法的命名实体识别[D];东北大学;2005年
4 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
5 万鑫;基于文本分类的命名实体识别系统[D];北京邮电大学;2009年
6 江超男;面向社会网络应用的关系抽取研究[D];南京理工大学;2010年
7 陈扬;基于命名实体识别的学科智能答疑模型研究[D];东北师范大学;2010年
8 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
9 张晓艳;基于混合统计模型的汉语命名实体识别方法的研究与实现[D];国防科学技术大学;2004年
10 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026