收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

时间表达式识别与归一化研究

潘越群  
【摘要】:在自然语言中,时间是一种重要的语义载体。人们通过了解一个事件的开始、发展和结束的时间信息,把握事件发展的全过程。时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检测等领域中有着广泛应用。 本文对时间信息识别的研究现状、研究方法等作了简要的介绍与分析,并简要介绍了TIMEX2标注规范,分别采用了基于规则的方法和和基于统计的方法对中文时间表达式进行识别,并对英文时间表达式的识别和归一化进行了探索。 在基于规则方法的中文时间表达式识别中,根据时间表达式范围的句法标准,采用了基于依存句法分析的方法,然后通过将错误驱动方法融合到依存分析方法中,大大改进了实验结果,最终实验结果达到了76%以上。 在基于统计方法的中文时间表达式识别中,依次使用了SVM、CRF方法以及改进CRF方法。这是首次将CRF方法应用到中文时间表达式识别中,选用了一系列有效特征,并对特征进行了扩展。用ACE标准评测工具对系统进行了评测,最终识别结果达到90%以上。评测结果表明:基于统计的方法优于基于规则的方法;在基于统计的方法中,CRF方法优于SVM方法;改进后的CRF方法在不影响时间表达式识别效果的情况下,提高了识别的效率。 在英文时间表达式识别与归一化中,采用SVM方法对时间表达式进行识别及分类,然后使用规则对每一类时间表达式进行归一化。将统计方法引入时间表达式归一化中,其结果优于纯规则方法且减少了写规则的工作量。 总之,本文对中文时间表达式的识别以及英文时间表达式识别与归一化进行了探索,取得了较好效果和有益结论。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 贺瑞芳;秦兵;潘越群;刘挺;李生;;基于启发式错误驱动学习的中文时间表达式识别[J];高技术通讯;2008年12期
2 邬桐;周雅倩;黄萱菁;吴立德;;自动构建时间基元规则库的中文时间表达式识别[J];中文信息学报;2010年04期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 贺瑞芳;秦兵;刘挺;潘越群;李生;;基于依存分析和错误驱动的中文时间表达式识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前1条
1 潘越群;时间表达式识别与归一化研究[D];哈尔滨工业大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978