收藏本站
《华中师范大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

中文自动文摘技术若干问题的研究

马长林  
【摘要】: 在本文中,我们首先介绍了计算语言学的基础概念体系,给出了计算语言学的定义以及计算机对自然语言的研究和处理的方法和过程,我们还介绍了国内外关于自动文摘系统等方面的研究方向和发展动态,并指出了自动文摘系统研究的某些不足。然后我们介绍了文摘和自动文摘系统的基本概念体系,并针对目前几种主要的自动文摘系统形式化模型和方法:基于统计的机械文摘、基于意义的理解文摘、基于概念的文本结构分析方法和基于知识的文本摘要等模型和方法进行了比较和分析,对它们的优点和缺点进行了讨论,归纳出各自的特点,进而在总结各种不同类型的自动文摘系统的特点的基础上,将基于统计的机械文摘、基于意义的理解文摘和基于概念的文本结构分析方法等三种研究方法相结合,提出了一种综合型的自动文摘系统的设想。 在本文中,我们还给出了名词性短语的指代和省略的概念以及分类,引入了同义词集、缩略集、归类集、归类函数和差异性函数的概念,论述了同义词的回指、缩略形式的回指、省略的回指、限定性名词短语的回指以及代词的回指,在此基础上给出了同义词的回指、缩略形式的回指、省略的回指、限定性名词短语的回指以及代词的回指等的回指算法思想,并引入了这五种形式的名词性短语的回指算法。 我们随后在已经提出的五种形式的名词性短语回指算法的基础上,从篇章宏观结构分析和篇章微观结构分析的角度,介绍了有关全文结构、章节结构、段落结构和复句结构的分类和分析方法,尝试性地给出了复句结构新的分类方法,描述了文本主题句的提取算法思想,引入了文本主题句的提取算法,并对自动文摘系统进行了探索性的研究: (1)我们先对文本进行名词性短语的回指,这可由同义词的回指、缩略形式的回指、省略的回指、限定性名词短语的回指以及代词的回指等名词性短语的回指算法来完成。 (2)在名词性短语的回指已完成的前提下,我们来提取文本的段落、章节以及全文的特征词,得到文本段落、章节和全文的特征词集。 dHry 硕士学位论文 @MASTER’S THESIS 臼)我们还讨论了如何对文本进行篇章宏观结构分析和篇章微观结构分 析,在完成全文、章节、段落和复句结构分析的基础上,运用主题句的提 取算法进行段落、章节以及全文主题句的提取。 本文尝试性地给出名词性短语的回指算法和文本主题句的提取算法,为进 一步讨论一种综合基于统计的机械文摘、基于意义的理解文摘和基于概念的文 本结构分析方法等三种研究方法的中文自动文摘系统打下基础。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 刘凯;王红玲;;基于篇章修辞结构的自动文摘连贯性研究[J];中文信息学报;2019年01期
2 袁龙云;张琳;;基于主题模型与冗余控制的中文多文档自动文摘技术研究[J];现代计算机(专业版);2017年14期
3 倪维健;刘彤;曾庆田;赵华;汤建渝;;基于非平衡数据分类的单文档自动文摘方法[J];计算机工程与科学;2012年04期
4 付茜;;自动文摘综述[J];中国美容医学;2012年16期
5 杨建林;自动文摘的逻辑解释[J];情报理论与实践;2002年02期
6 汤晓鲁;李旎;;手工文摘的评价与自动文摘的产生[J];贵图学刊;1998年02期
7 刘楚达,孙海涛;一种基于统计的中文自动文摘方法[J];湖南农业大学学报(自然科学版);2001年06期
8 孙晓腾;李学明;;基于论文关键词和篇章结构的自动文摘抽取方法[J];现代计算机(专业版);2018年13期
9 王海;胡珀;;基于遗传算法的查询导向式自动文摘[J];微计算机信息;2009年28期
10 索红光;梁玉环;刘玉树;;基于时间戳的多文档自动文摘[J];计算机工程;2007年16期
中国重要会议论文全文数据库 前10条
1 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 卢冶;林鸿飞;赵晶;;中文自动文摘系统的综合评价模式[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 王小磊;张瑾;许洪波;;基于交互增强原理的多文档自动文摘算法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 胡珀;;基于图模型的多文档自动文摘(英文)[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 王萌;王晓荣;李春贵;唐培和;;基于局部与全局信息的自动文摘算法[A];广西计算机学会2007年年会论文集[C];2007年
8 张明慧;王红玲;周国栋;;LDA主题驱动的中文多文档自动文摘方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 邵伟;何婷婷;胡珀;肖华松;;一种面向查询的多文档文摘句选择策略[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前1条
1 孙菲;中小企业信息化有了“依靠”[N];中国企业报;2000年
中国博士学位论文全文数据库 前10条
1 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
2 徐永东;多文档自动文摘关键技术研究[D];哈尔滨工业大学;2007年
3 李鹏;面向主题的多文档自动文摘关键技术研究[D];上海交通大学;2013年
4 张琳;基于引用聚类的多文档自动文摘技术研究[D];大连海事大学;2013年
5 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
6 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
7 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
8 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年
9 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
10 胡珀;融合上下文信息的自动文摘研究[D];武汉大学;2013年
中国硕士学位论文全文数据库 前10条
1 马长林;中文自动文摘技术若干问题的研究[D];华中师范大学;2002年
2 万欣;基于自动文摘的辅助文档撰写系统研究与实现[D];北京邮电大学;2019年
3 刘凯;基于篇章结构理论的单文档自动文摘研究[D];苏州大学;2018年
4 任宇;基于观点挖掘主题模型的多文档自动文摘技术研究[D];吉林大学;2018年
5 王炜;基于深度学习的中文单文档自动文摘方法研究[D];华中师范大学;2018年
6 张洪荣;中文自动文摘关键技术研究与实现[D];哈尔滨工业大学;2018年
7 王帆;基于语义聚类的新闻多文档自动文摘[D];华中科技大学;2017年
8 孙晓腾;基于关键词过滤和篇章结构的中文自动文摘研究[D];重庆大学;2018年
9 董雯;基于混合神经网络的单文档自动文摘方法研究[D];浙江理工大学;2019年
10 王攀;中文多文档自动文摘的研究与实现[D];北京邮电大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026