收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义的汉语文本主题词提取算法研究与实现

唐培丽  
【摘要】:为了适应信息时代的迅速发展,从汉语文献中自动提取主题词,已成为自然语言处理研究领域的一个热点。由于传统的自然语言处理技术仅仅采用机械的关键词匹配来实现,缺乏知识处理和理解能力,造成了文本处理的不确定性。为此本文以中文文本为处理对象,研究并实现了基于语义理解的中文文本主题词自动提取算法,以实现规范的主题词提取和智能检索。 本文结合领域背景,构建概念语义网络作为分词词典和知识库,研究并设计了基于词典的分词算法和无词典的基于词频统计的分词算法;采用向量空间模型将非结构化的文本表示为向量形式,提出了中文文献主题词确定的数学模型;利用智能计算等技术实现中文文献集的主题词自动提取,设计一套适合该种数据集主题提取的遗传算法。


知网文化
【相似文献】
中国重要会议论文全文数据库 前2条
1 刘智颖;;时间短语的分析与识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李恒训;张华平;秦鹏;于满泉;刘金刚;;基于主题词的网络热点话题发现[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前1条
1 贺文锐;面向网络协同制造的资源优化配置技术研究[D];西北工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 唐培丽;基于语义的汉语文本主题词提取算法研究与实现[D];吉林大学;2005年
2 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
3 贾自艳;中文智能搜索引擎关键技术研究[D];北京工业大学;2001年
4 李欣;基于概念检索的智能信息检索技术研究[D];华中师范大学;2004年
5 王其冰;本体查询和推理规则在学科概念建模中的应用[D];华东师范大学;2009年
6 宋洪鑫;基于标签与内容的blog检索实验系统研究与实现[D];北京邮电大学;2011年
7 胡俊;基于本体的共词分析技术在生物医学文献研究热点中的应用研究[D];复旦大学;2011年
8 朱素媛;网络教育中的智能搜索引擎的研究[D];合肥工业大学;2004年
9 余媛芳;面向产品创新设计的知识获取研究[D];西北工业大学;2004年
10 甘健侯;基于本体的语义Web知识发现及其应用的研究[D];云南师范大学;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978