收藏本站
《新疆大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于动态权值的多策略维文本体概念自动抽取

张华楠  
【摘要】:维文本体知识库是维文语义信息处理的基础,而维吾尔文本体概念的抽取是维文本体知识库构建的重要基础性工作之一。如何根据维吾尔文的语法、句法特征,抽取出维文本体概念是值得研究的一个方向。 目前已提出了一些单一方法或静态权值的多策略融合方法,抽取正确率达到了一定程度,但面对实际应用中多种类型的语料,其抽取结果不能满足实际应用的需求。存在的主要问题如下:第一,现有方法的规则模板的覆盖率不高,因此直接导致对多字词识别的精度不高;第二,由于没有考虑方法本身所考虑的特征类型以及所处理的语料类型,因此静态权值的多策略加权方法在处理不同语料时不能真正发挥各方法优点,从而无法真实体现概念的领域归属度;另外,经过查新,尚未见到维吾尔文本体概念抽取方法的研究报导。如果将现有方法应用于维吾尔文概念抽取,需要进行相应的调整和处理。 为解决以上问题,本文提出一种基于动态权值的多策略维文本体概念自动抽取方法。该方法采用自动学习的维吾尔文规则学习模式,对经过词干提取及词性标注处理的熟语料进行匹配,筛选出候选概念,然后综合考虑改进的DRDC、TF-IDF和NC-Value三种策略的涵盖特征以及方法对语料的处理能力,将三种策略动态加权融合后量化维吾尔文候选概念的领域归属度,领域权重超过阈值的概念存入维吾尔文本体概念集合。最后,通过300篇计算机领域的维吾尔文语料(其中科技文献100篇,自由文本200篇)进行实验,其概念的抽取准确率达到了89.7%。
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 阿里甫·库尔班;吾买尔江·库尔班;吐尔根·伊布拉音;;信息处理维吾尔语词语分类体系及标记研究(Ⅰ)[J];新疆大学学报(自然科学版);2009年04期
【共引文献】
中国期刊全文数据库 前9条
1 张登科;易秀双;王兴伟;;一种基于相似度测量的新垃圾邮件发现机制[J];中国海洋大学学报(自然科学版);2008年S1期
2 祝清松;冷伏海;;自动术语识别存在的问题及发展趋势综述[J];图书情报工作;2012年18期
3 韩红旗;安小米;;C-value值和unithood指标结合的中文科技术语抽取[J];图书情报工作;2012年19期
4 康小丽;章成志;王惠临;;基于可比语料库的双语术语抽取研究述评[J];现代图书情报技术;2009年10期
5 张巍;于洋;游宏梁;;面向词汇知识库自动构建的概念术语关系识别[J];现代图书情报技术;2009年11期
6 翟笃风;刘柏嵩;;政务领域本体术语的自动抽取[J];现代图书情报技术;2010年04期
7 许德山;张智雄;王峰;邢美凤;;上下文分析与统计特征相结合的英文术语抽取研究[J];现代图书情报技术;2010年12期
8 叶春蕾;冷伏海;;基于词汇链的路线图关键词抽取方法研究[J];现代图书情报技术;2013年01期
9 塔依尔·阿不都外力;艾山·吾买尔;吐尔根·伊布拉音;张健;;基于标注词典和规则的维吾尔文动词词干提取方法[J];新疆大学学报(自然科学版);2013年01期
【二级参考文献】
中国期刊全文数据库 前7条
1 陈刚,陆汝钤,金芝;基于领域知识重用的虚拟领域本体构造[J];软件学报;2003年03期
2 杜小勇;李曼;王珊;;本体学习研究综述[J];软件学报;2006年09期
3 黄伟,金远平;形式概念分析在本体构建中的应用[J];微机发展;2005年02期
4 乔亚男;齐勇;侯迪;;一种高稳定性词汇共现模型[J];西安交通大学学报;2009年06期
5 王念滨,徐晓飞,邓胜春,王刚;KISO:一种基于本体论的集成知识系统设计[J];小型微型计算机系统;2000年01期
6 刘晓霞;概念图知识处理器的设计[J];小型微型计算机系统;2001年03期
7 袁贵仁;以规范标准建设为核心,开创语言文字应用研究新局面[J];语言文字应用;2001年03期
【相似文献】
中国期刊全文数据库 前10条
1 王亚杰;李殿起;徐心和;;基于双树复小波变换的图像融合方法[J];计算机工程;2008年15期
2 李鹏;徐德智;尹艳;;动态多策略本体映射与集成方法研究[J];计算机工程与应用;2009年30期
3 林凡,杨晨晖;一种动态网络负载平衡集群的实践方法[J];厦门大学学报(自然科学版);2003年04期
4 刘忠强;柳长安;李国栋;;多策略网络信息采集系统的设计与实现[J];中国电力教育;2007年S3期
5 徐德智;李鹏;尹艳;;基于AHP的多策略映射与集成方法[J];计算机工程;2009年12期
6 曾凡秩;尹艳;;一种改进的多策略映射与结合方式研究[J];计算机应用研究;2009年10期
7 曾凡秩;;基于可信度的多策略本体映射[J];计算机工程;2009年23期
8 胡大磊;周学海;;平台无关的访问控制框架研究与实现[J];计算机系统应用;2010年03期
9 郭庆,陈纯;一种基于能力的联合承诺机制[J];浙江大学学报(工学版);2003年04期
10 吴懿慧;;基于数据挖掘的无瘤生存率探讨[J];中国科技信息;2009年09期
中国重要会议论文全文数据库 前10条
1 黄河燕;陈肇雄;;基于多策略的交互式智能辅助翻译平台总体设计[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 邱艳霞;余正涛;张志坤;司圣涛;韩露;孟祥燕;;领域术语自动抽取方法研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
3 岳昆;李劲;石磐;刘惟一;;基于语义的Web服务主题自动抽取[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 王卫红;曹玉辉;覃征;;多策略自适应迁移决策模糊控制算法[A];2006中国控制与决策学术年会论文集[C];2006年
5 谢丽星;孙茂松;佟子健;王灿辉;;基于用户查询日志和锚文字的汉语缩略语识别[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 胡东东;孟小峰;;一种基于树结构的Web数据自动抽取方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 王海雄;郭剑毅;余正涛;毛存礼;张朝胜;雷春雅;;基于CRFs的中文领域术语自动抽取研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 周晓军;马君;肖静;;面向CBT的多策略VRML建模方法[A];立体图象技术及其应用研讨会论文集[C];2005年
9 王栋;盛玉麒;;汉语否定极项(NPI)自动抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 聂志强;李庆忠;;电子政务信息集成中本体的自动抽取及优化[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 记者 姚世新;首只多策略增长基金上市[N];中国保险报;2004年
2 罗鼎;手机业渐显新形势 波导多策略应对[N];中国高新技术产业导报;2004年
3 本报记者 徐婧婧;华宝兴业:A股市场或“涅槃”[N];上海证券报;2008年
4 张潇芮;“中西合璧”基金决胜中国股市[N];中国企业报;2004年
5 沈闻涧;顺德小家电:多策略赢得大发展[N];中国电子报;2004年
6 实习记者 刘小敏;华宝兴业多策略增长基金热销[N];证券日报;2004年
7 见习记者 郑焰本报记者 贾宝丽;10派20元 基金分红出手大方[N];上海证券报;2007年
8 记者 潘继红;华宝兴业多策略增长基金获准发行[N];国际商报;2004年
9 木鱼;首只净值不足1元开基分红[N];海峡财经导报;2008年
10 高和平;华宝兴业“震”市爆冷门[N];华夏时报;2008年
中国博士学位论文全文数据库 前10条
1 徐震;支持多策略的安全数据库系统研究[D];中国科学院研究生院(软件研究所);2005年
2 李卫;领域知识的获取[D];北京邮电大学;2008年
3 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
4 吴新勇;嵌入式操作系统安全保障技术研究[D];电子科技大学;2003年
5 李杨;高频地波雷达背景感知与目标检测技术研究[D];哈尔滨工业大学;2010年
6 叶施仁;海量数据约简与分类研究[D];中国科学院研究生院(计算技术研究所);2001年
7 林植;基于策略的访问控制关键技术研究[D];华中科技大学;2006年
8 杨迎泽;重载组合列车同步制动系统故障诊断技术与应用研究[D];中南大学;2010年
9 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
10 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 张华楠;基于动态权值的多策略维文本体概念自动抽取[D];新疆大学;2013年
2 朱鑫;词语搭配自动抽取方法对比研究[D];大连海事大学;2011年
3 李姗;面向术语自动抽取的英语词汇形态特征分析[D];大连海事大学;2012年
4 王亮;基于Web的噪声试验数据管理及聚类技术研究[D];江南大学;2011年
5 孙蝉娟;航空器及其安全领域术语定义的自动抽取[D];南京航空航天大学;2010年
6 赵雷;多策略数据挖掘平台MSMiner构建中若干问题的研究[D];山东科技大学;2003年
7 李鹏;基于可信度预测的多策略本体映射研究[D];中南大学;2009年
8 邱艳霞;领域术语自动抽取及关系分类研究[D];昆明理工大学;2009年
9 张庆军;本体映射中的推理修正与抽取算法研究[D];中南大学;2009年
10 康琪;基于Bootstrapping的领域知识自动抽取技术的研究[D];山东大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026