收藏本站
《昆明理工大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

基于网络语义资源的越南语新闻文本词汇链构建研究

于卫欣  
【摘要】:当前计算技术特别是因特网技术发展迅猛,信息技术正深刻地影响着人们的生活。每天所发生的新闻事件所形成的文本数据海洋,亟需为用户提供高效的文本信息处理服务。文本信息处理包括文本分类、文本聚类、文本挖掘和近似查询处理等内容,而文本关键词提取和词汇链构建在上述方面有着广泛的应用,它不仅是进行这些工作不可缺少的基础和前提,也是互联网上信息建库的一项重要工作。文本关键词的自动提取和词汇链构建是信息检索和摘要生成的基础,在Web页检索、文档聚类、文档摘要提取、文本挖掘等方面都有广泛的应用。首先,简要介绍了自然语言处理、文本信息预处理和特征项等相关知识,分析和比较了常用的关键词提取算法,讨论了用于英文关键词提取的GenEx系统、朴素贝叶斯提取算法以及处理汉语文本的PAT TREE.最大熵模型等相关工作,并进行了归类。然后,结合越南语语言特征,基于三个文本特征项,利用考虑候选词权重计算的文本关键词提取算法TFLD (Term Frequency, LocationDistance algorithm),该算法基于词频、区域位置以及分词距离次序三种特征项属性,实现越南语新闻事件关键词的抽取。同时,词汇链表现为词语间语义关系所引起的连贯性,它提供了关于新闻结构和主题的线索信息。结合网络语义知识库HowNet、WordNet与Wikipedia资源,使用语义相关度进行歧义消除并最终构成表达新闻事件线索信息的词汇链。最后,利用上述所做的各项工作,实现越语新闻文本事件关键词的抽取和词汇链构建的原型系统。
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前6条
1 张运良;张全;;基于HNC理论的语义相关度计算方法[J];计算机工程与应用;2005年34期
2 蒋效宇;;基于关键词抽取的自动文摘算法[J];计算机工程;2012年03期
3 刘铭;王晓龙;刘远超;;基于词汇链的关键短语抽取方法的研究[J];计算机学报;2010年07期
4 吕滨;雷国华;于燕飞;杨泽雪;王亚东;;基于语义分析的网络不良信息过滤系统研究[J];计算机应用与软件;2010年02期
5 索红光;刘玉树;曹淑英;;一种基于词汇链的关键词抽取方法[J];中文信息学报;2006年06期
6 赵鹏;蔡庆生;王清毅;耿焕同;;一种基于复杂网络特征的中文文档关键词抽取算法[J];模式识别与人工智能;2007年06期
中国博士学位论文全文数据库 前1条
1 张明尧;基于事件链的语篇连贯研究[D];武汉大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
2 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
3 周世斌;白敬华;刘玉树;;统计流形上基于核近邻算法的文本分类研究[J];北京理工大学学报;2010年03期
4 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
5 黄文良;李石坚;刘菊新;徐从富;;一个大规模垃圾短信实时过滤系统[J];北京邮电大学学报;2008年03期
6 董丽娟;;基于知识地图的我国公共图书馆与高校图书馆对比研究[J];图书与情报;2011年03期
7 柯丽;王明文;何世柱;黎佳;罗远胜;;基于频率共现熵的跨语言网页自动分类研究[J];江西师范大学学报(自然科学版);2011年03期
8 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
9 曾立梅;;基于文本数据挖掘的硕士论文分类技术[J];重庆邮电大学学报(自然科学版);2010年05期
10 陈可华;;文本自动分类新探究[J];赤峰学院学报(自然科学版);2011年04期
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
5 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
6 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
7 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
8 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
9 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
10 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 M.A.K.韩礼德;姜望琪;付毓玲;;篇章、语篇、信息——系统功能语言学视角[J];北京大学学报(哲学社会科学版);2011年01期
2 丁春;关键词标引的若干问题探讨[J];编辑学报;2004年02期
3 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
4 许余龙;;向心理论的参数化研究[J];当代语言学;2008年03期
5 黄昌宁;大规模真实文本处理的理论与方法——记第五届国际极大规模语料库研讨会(WVLC-5)[J];当代语言学;1998年01期
6 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
7 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
8 刘桃;刘秉权;徐志明;王晓龙;;领域术语自动抽取及其在文本分类中的应用[J];电子学报;2007年02期
9 刘远超;王晓龙;徐志明;刘秉权;;基于粗集理论的中文关键词短语构成规则挖掘[J];电子学报;2007年02期
10 刘远超;王晓龙;刘秉权;钟彬彬;;信息检索中的聚类分析技术[J];电子与信息学报;2006年04期
中国博士学位论文全文数据库 前4条
1 孙肇春;汉语事体结构[D];广东外语外贸大学;2007年
2 乐明;汉语财经评论的修辞结构标注及篇章研究[D];中国传媒大学;2006年
3 樊友新;从事件结构到句子结构[D];华东师范大学;2010年
4 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 ;《统计自然语言处理基础》[J];中文信息学报;2005年03期
2 徐继伟;;自然语言处理技术在生物信息学中的应用(英文)[J];生物信息学;2006年01期
3 王挺;麦范金;刘忠;;自然语言处理及其应用前景的研究[J];桂林航天工业高等专科学校学报;2006年04期
4 ;第二届全国少数民族青年自然语言处理学术研讨会召开[J];模式识别与人工智能;2008年05期
5 高精鍊;萧国政;姬东鸿;;手持嵌入式系统应用中的自然语言处理关键技术[J];长江学术;2009年02期
6 冯志伟;;自然语言处理中的一些宏观问题之我见[J];中国外语;2009年05期
7 曹佩;;论自然语言处理[J];信息与电脑(理论版);2010年05期
8 邵泽国;;语言科学发展的新分支——自然语言处理[J];电子科技;2013年05期
9 李霞;;面向本科阶段开设的“自然语言处理”课程教学研究[J];福建电脑;2013年07期
10 贺广明;;自然语言处理的六个级别[J];情报杂志;1988年04期
中国重要会议论文全文数据库 前10条
1 马颖华;苏贵洋;;基于概念的自然语言处理[A];第一届学生计算语言学研讨会论文集[C];2002年
2 李生;;哈工大自然语言处理研究进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 ;哈尔滨工业大学智能技术与自然语言处理研究室简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
4 冯志伟;;自然语言处理中的理性主义和经验主义[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 李文;程华良;彭耀;温明杰;肖威清;张陈斌;陈宗海;;自然语言处理云平台[A];系统仿真技术及其应用学术论文集(第15卷)[C];2014年
7 徐超;毕玉德;;面向自然语言处理的韩国语隐喻知识库构建研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 ;SWCL-2006组织机构[A];第三届学生计算语言学研讨会论文集[C];2006年
10 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 IBM大数据专家 James Kobielus 范范 编译;机器能识别出讽刺含义吗?[N];网络世界;2014年
2 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
3 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
4 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
5 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
6 ;李葆嘉:语言科技新思维的倡导者[N];大众科技报;2008年
7 易水;IT新词集锦(420)[N];计算机世界;2004年
8 实习生 刑天鸽;机器人能听懂我们说话吗?[N];科技日报;2012年
9 ;从CRM到KRM[N];上海金融报;2002年
10 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
2 鲁松;自然语言处理中词相关性知识无导获取和均衡分类器构建[D];中国科学院研究生院(计算技术研究所);2001年
3 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
4 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
5 计峰;自然语言处理中序列标注模型的研究[D];复旦大学;2012年
6 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
7 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
8 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
9 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
10 李晗静;基于自然语言处理的空间概念建模研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 于卫欣;基于网络语义资源的越南语新闻文本词汇链构建研究[D];昆明理工大学;2015年
2 张宗峰;微博热点事件跟踪与视觉总结方法研究与实现[D];西南交通大学;2015年
3 郝丹;结合NLP技术的汉语学习系统设计与实现[D];华中师范大学;2015年
4 陈波;中文统计自然语言处理隐马模型的研究[D];重庆大学;2003年
5 侯超;基于自然语言处理的策略生成系统的设计与实现[D];西安电子科技大学;2013年
6 张春燕;基于自然语言处理的文本分类分析与研究[D];江西理工大学;2011年
7 李力;利用知网进行(计算机)自然语言处理[D];电子科技大学;2004年
8 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
9 李江;自然语言编程研究[D];北京邮电大学;2008年
10 程晓静;自然语言处理在药物专利检索系统中的应用[D];大连理工大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026