收藏本站
《吉林大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

信息抽取算法研究

吴芬芬  
【摘要】:本文对应用于信息抽取的三种算法进行了研究。 本文首先分析了在文本信息抽取中如何建立隐马尔可夫模型(Hidden Markov Models, HMM)的结构和参数训练等问题,运用改进的HMM和数据稀疏平滑技术结合特征提取对基于分块的文本进行抽取,实验证明,召回率和精确度比基于单词和传统HMM的方法都有很大的提高,并提高了效率。 在改进HMM和Viterbi算法这种几乎是信息抽取领域标准算法的同时,本文也提出利用反向动态规划和正向A*算法进行信息抽取,并建立了一个信息抽取系统。本文对美国CMU大学CORA搜索引擎研制组提供的数据集中的100篇进行了测试,结果显示启发式算法的性能优于Viterbi算法。 在中文的命名实体识别方面,本文也做了一些研究。本文设计了一个中文姓名抽取系统,该系统采用神经网络进行汉语句子的分词处理,继而根据姓名后置特征词进行姓名的抽取,成功解决了尾字和下文成词的姓名抽取问题。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP301.6

【相似文献】
中国期刊全文数据库 前10条
1 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期
2 周陈超;段勤;王丽芳;王斌;;基于HTK的社区语音接入服务平台的实现[J];微处理机;2011年03期
3 肖文斌;陈进;周宇;王志阳;赵发刚;;小波包变换和隐马尔可夫模型在轴承性能退化评估中的应用[J];振动与冲击;2011年08期
4 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期
5 郝学良;黄景德;;HMM在潜在电子故障识别及状态评估中的应用[J];四川兵工学报;2011年06期
6 魏晶晶;于然;廖祥文;;基于分隔符的中文论坛信息抽取[J];福建电脑;2011年06期
7 徐从富;郝春亮;苏保君;楼俊杰;;马尔可夫逻辑网络研究[J];软件学报;2011年08期
8 张珍;;智能机器人语音识别技术[J];现代电子技术;2011年12期
9 刘芳;毛志忠;;基于小波隐马尔可夫模型的控制过程异常数据检测方法[J];控制与决策;2011年08期
10 商信华;赵喜玲;;隐马尔可夫模型在步态识别中的应用研究[J];计算机测量与控制;2011年08期
中国重要会议论文全文数据库 前10条
1 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 李帅;王精业;王丽娟;;基于马尔可夫模型的文本信息提取算法概述[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
4 费玉莲;凌云;王勋;;基于增强隐马尔可夫模型的视频数据挖掘研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
5 马勇;金赟;顾明亮;赵力;;基于隐马尔可夫模型的汉语方言辨识[A];2009’中国西部地区声学学术交流会论文集[C];2009年
6 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
7 徐东风;周萍;景新幸;;改进隐马尔可夫模型的非线性分段技术应用[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
8 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
10 林文永;石志国;薛为民;陈锋军;;隐马尔可夫模型实现语音和视频识别[A];第一届学生计算语言学研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
5 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
6 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
7 董振东;到用户中去[N];中国计算机报;2003年
8 张友林 甘肃省武威市凉州区中医院;开发中医专用软件很有必要[N];中国中医药报;2009年
9 任一鸣;垂直搜索:抓住细分需求[N];计算机世界;2007年
10 晓业;TTS提升基金CIC服务[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
4 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
5 刘小军;人脸识别技术研究[D];中国科学院电子学研究所;2001年
6 肖文斌;基于耦合隐马尔可夫模型的滚动轴承故障诊断与性能退化评估研究[D];上海交通大学;2011年
7 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
8 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
9 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
10 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 吴芬芬;信息抽取算法研究[D];吉林大学;2006年
2 陈枫;基于TABLE布局和隐马尔可夫模型的Web自由文本信息抽取[D];浙江大学;2007年
3 王宇宁;隐马尔可夫模型在信息抽取中的应用研究[D];大连理工大学;2007年
4 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
5 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
6 刘斌斌;基于HMM模型的Web信息抽取方法的研究与改进[D];重庆大学;2008年
7 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
8 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
9 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
10 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026