收藏本站
《山西大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

现代汉语词性细分类标注研究

段建勇  
【摘要】: 现代汉语词性细分类标注研究是当前基于语料库的自然语言处理研究的基础工作,这也是面向深层研究所遇到的新课题。 本文参考了国际上关于动词自动分类和标注的研究方法,分析了国内相关领域关于词性细分类标注研究的分类体系、词性标注方法,以及语料库资源等研究状况,提出了一种统计与规则相结合的词性细分类标注模型,并且把词汇向量空间模型以及模糊集的方法引入词性细分类自动标注领域。 现代汉语词性细分类标注模型是在对传统的各种标注方法进行对比分析的基础上提出的,实验分别独立采用基于词性信息以及基于词汇向量空间的细分类标注方法,最后两种方法结合起来建立标注模型。 另外还对标注模型从两方面作了优化,由于词汇特征向量的特殊作用,本文对特征词汇采用层次聚类来提高其分类精度;另一方面,引入规则来进一步丰富细分类标注信息,减少数据稀疏等问题,并且引入置信度来选择统计与规则的优先关系。
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前4条
1 苏俊峰;基于HMM的藏语语料库词性自动标注研究[D];西北民族大学;2010年
2 张一哲;汉语词类划分与词性标注方法的研究[D];南京师范大学;2011年
3 张会鹏;中文词法分析技术的研究与实现[D];哈尔滨工业大学;2006年
4 吴遥遥;名词语义和语法的多重性[D];华东师范大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 杨浩荣,王作英,陆大紟;语音识别HMM中引入帧间相关信息的一种参数化模型[J];电子学报;1998年10期
2 李晓黎,史忠植;用数据采掘方法获取汉语词性标注规则[J];计算机研究与发展;2000年12期
3 陈清才,王晓龙;一种基于词矢量的汉语语义量化模型[J];计算机研究与发展;2001年02期
4 鲁松,白硕,黄雄,张健;基于向量空间模型的有导词义消歧[J];计算机研究与发展;2001年06期
5 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
6 屈刚,陆汝占;基于特征的汉语词性标注模型[J];计算机研究与发展;2003年04期
7 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
8 李国臣,段建勇;基于语法语义信息量化模型的语素字再分类[J];计算机工程;2004年11期
9 王迎庆;利用分级模糊聚类分析自动识别语音[J];计算机学报;1989年02期
10 高新波,谢维信;模糊聚类理论发展及应用的研究进展[J];科学通报;1999年21期
【共引文献】
中国期刊全文数据库 前10条
1 胡锡衡;;垃圾邮件过滤系统模型的研究与设计[J];鞍山师范学院学报;2009年02期
2 胡锡衡;;径向基函数在文本分类中的应用[J];鞍山师范学院学报;2011年02期
3 赵红丹;王希杰;;基于隐马尔科夫模型的词性标注[J];安阳师范学院学报;2010年05期
4 程勇,吴玺宏,迟惠生;汉语韵律边界定位与选音算法研究[J];北京大学学报(自然科学版);2004年03期
5 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
6 李玉鑑;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期
7 谢宇;张仰森;肖建涛;;规则与统计相结合的汉语词义消歧模型[J];北京机械工业学院学报;2007年03期
8 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
9 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
10 罗森林;刘盈盈;冯扬;韩磊;陈功;王倩;;BFS-CTC汉语句义结构标注语料库构建方法[J];北京理工大学学报;2012年03期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 加米拉·吾守尔;瓦依提·阿布力孜;吐尔根·依布拉音;;《现代维吾尔语语法信息词典》数据库建设的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 常宝宝;肖华云;;面向语言学家和词典编纂专家的汉英双语语料库检索系统[A];2004年辞书与数字化研讨会论文集[C];2004年
5 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 隋岩;张普;;基于“动态流通语料库”进行“有效字符串”提取的初步研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
10 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
2 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年
3 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
4 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
5 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
6 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
7 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
8 覃事娅;耕地储备理论及实证分析[D];中南大学;2011年
9 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
10 刘铭;大规模文档聚类中若干关键问题的研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 王林吉;基于CIELAB均匀颜色空间和聚类算法的混纺测色研究[D];浙江理工大学;2010年
3 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
4 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
5 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
6 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
7 孙洋;基于免疫遗传算法和粒子群算法的聚类研究[D];长沙理工大学;2010年
8 刘坤朋;数据挖掘中聚类算法的研究[D];长沙理工大学;2010年
9 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
10 孙莉莉;基于FCM的图像分割算法研究[D];广西民族大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 苏宝荣;;“隐喻类比”与“近义偏移”——谈汉语多义词形成的两种主要途径[J];长江学术;2006年02期
2 符淮青;表名物词义项划分的一些问题[J];辞书研究;1993年03期
3 陈玉忠,俞士汶;藏文信息处理技术的研究现状与展望[J];中国藏学;2003年04期
4 韩忠军,董霄云;隐喻──英语词义转移的一个重要方式[J];东北大学学报(社会科学版);2000年01期
5 石毓智;《女人,火,危险事物——范畴揭示了思维的什么奥秘》评介[J];国外语言学;1995年02期
6 陈殿玺;试探词义引申的途径和方式[J];古汉语研究;1994年S1期
7 孙芳琴;跨文化交际语用中的身体隐喻词汇联想[J];贵州师范大学学报(社会科学版);2005年03期
8 袁明军,张慧晶;语义特征研究概观[J];汉语学习;1999年05期
9 史锡尧;“口”、“嘴”语义语用分析[J];汉语学习;1994年01期
10 符淮青;“词义成分—模式”分析(表性状的词)[J];汉语学习;1997年03期
中国博士学位论文全文数据库 前2条
1 李金兰;现代汉语身体动词的认知研究[D];华东师范大学;2006年
2 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前6条
1 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
2 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
3 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
4 林正军;从历时及认知的角度看“一词多义”现象[D];东北师范大学;2004年
5 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
6 于长远;应用条件随机场进行汉语分词和词性标注的研究[D];辽宁科技大学;2008年
【二级引证文献】
中国期刊全文数据库 前4条
1 高媛;刘大中;;中文文本分类方法比较研究[J];科技信息(科学教研);2008年02期
2 赵红梅;张阿红;;算法设计与分析综述[J];科技信息;2010年35期
3 褚颖娜;廖敏;宋继华;;一种基于统计的分词标注一体化方法[J];计算机系统应用;2009年12期
4 卢媛媛;何海燕;张剑;;电子商务搜索引擎中文分词算法分析[J];信息网络安全;2010年08期
中国硕士学位论文全文数据库 前10条
1 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
2 彭浩林;基于内容的敏感信息过滤系统研究[D];武汉科技大学;2011年
3 韩月阳;基于S-EK图最短路径中文分词的研究[D];云南大学;2011年
4 李春成;《水浒传》词频分析[D];广西民族大学;2010年
5 刘亚南;KNN文本分类中基于遗传算法的特征提取技术研究[D];中国石油大学;2011年
6 胡晓博;面向特定领域的专业搜索引擎的架构与实现方法[D];哈尔滨工程大学;2007年
7 倪茂树;基于语义理解的观点评论挖掘研究[D];大连理工大学;2007年
8 王岩;我国电子信息领域的技术监测研究[D];大连理工大学;2008年
9 付蕾;知识元标引系统的设计与实现[D];华中师范大学;2009年
10 魏文密;文语转换方法研究[D];长安大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 刘健庄;基于二维直方图的图象模糊聚类分割方法[J];电子学报;1992年09期
2 裴继红,范九伦,谢维信;一种新的高效软聚类方法:[J];电子学报;1998年02期
3 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
4 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
5 陈清才,王晓龙;一种基于词矢量的汉语语义量化模型[J];计算机研究与发展;2001年02期
6 鲁松,白硕,黄雄,张健;基于向量空间模型的有导词义消歧[J];计算机研究与发展;2001年06期
7 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
8 徐志明,王晓龙,张凯,关毅;联机手写体汉字识别后处理技术的研究[J];计算机研究与发展;1999年05期
9 王素格,张永奎;汉语词性标注排歧方法探讨[J];计算机工程与应用;2001年07期
10 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
中国博士学位论文全文数据库 前1条
1 裴继红;基于模糊信息处理的图像分割方法研究[D];西安电子科技大学;1998年
【相似文献】
中国期刊全文数据库 前10条
1 罗森林;马舒洁;梁静;潘丽敏;冯杨;;基于子镜头聚类方法的关键帧提取技术[J];北京理工大学学报;2011年03期
2 陈宁,陈安,周龙骧;大规模交易数据库的一种有效聚类算法(英文)[J];软件学报;2001年04期
3 董一鸿;大型数据库中基于邻域连接的层次聚类算法[J];计算机工程与应用;2003年32期
4 周晓昕;孟志青;张仕军;胡建云;;一类基于多属性特征的时态近似周期挖掘算法[J];电脑知识与技术(学术交流);2007年19期
5 林治;;聚类分析在学生成绩管理中的应用探析[J];福建电脑;2009年12期
6 周晋,路海明,卢增祥,李衍达;基于部分匹配方式的可扩展P2P搜索算法[J];清华大学学报(自然科学版);2004年10期
7 吕爽;陈高云;;数据挖掘技术在高校教学评估中的应用[J];广东广播电视大学学报;2006年03期
8 吴青;翟建设;赵旭赟;;基于层次聚类的分层可扩展性编码算法的优化[J];计算机应用与软件;2007年02期
9 汤周文;叶东毅;;基于层次聚类的差异化属性约简算法[J];计算机应用;2009年02期
10 朱牧;孟凡荣;周勇;;一种确定聚类数目的自组织特征映射网络[J];微电子学与计算机;2009年08期
中国重要会议论文全文数据库 前10条
1 杨建武;;Web检索结果的层次聚类研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 吾守尔·斯拉木;吴启南;;基于层次聚类方法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
3 彭楠赟;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 朱牧;孟凡荣;周勇;;一种确定聚类数目的自组织特征映射网络[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
5 康卫鲜;叶德谦;;基于CURE的聚类算法研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 张世华;吴凌云;金光旭;章祥荪;;一种简单的蛋白质结构分类方法(英文)[A];中国运筹学会第八届学术交流会论文集[C];2006年
7 孙浩军;刘志辉;孔令俊;;一种基于交叠率聚类的改进[A];2007'仪表,自动化及先进集成技术大会论文集(二)[C];2007年
8 朱虹;刘扬;俞士汶;;面向搭配知识库建设的汉语词义区分研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 李信利;;基于关键词聚类的论文相似性检索[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 李军;李涓子;;新闻专题内子话题划分[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 陆志城;细分类 明算帐[N];医药经济报;2002年
2 金朝力;细分类视频网站领涨行业复苏[N];北京商报;2007年
3 商报数据分析专题组执笔 张红玫;飘雪淡季全面来临 各大类别跌幅不一[N];中国图书商报;2007年
4 杜静通讯员 周辰恩;细分类 深分析 强作为[N];海峡财经导报;2008年
5 北京开卷图书市场研究所 月报分析项目组;整体市场跌至谷底 止跌复苏迹象初显[N];中国图书商报;2005年
6 北京开卷图书市场研究所;英语少儿回落 市场整体下行[N];中国图书商报;2005年
7 黄明正;用“数据”分析营销[N];国际商报;2008年
8 小船;零售淡季萧意浓 细分市场频跌声[N];中国图书商报;2007年
9 小船;市场行至低谷 回暖初显端倪[N];中国图书商报;2007年
10 小船;零售市场仍下滑 暑期高峰当可期[N];中国图书商报;2007年
中国博士学位论文全文数据库 前10条
1 李玲娟;数据挖掘技术在入侵检测系统中的应用研究[D];苏州大学;2008年
2 杨春梅;基因表达数据聚类分析算法研究和应用[D];天津大学;2006年
3 陈晓飞;基于骨架的目标表示和识别技术研究[D];国防科学技术大学;2004年
4 陈远浩;非监督的结构学习及其应用[D];中国科学技术大学;2008年
5 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
6 徐盛;基于主题模型的高空间分辨率遥感影像分类研究[D];上海交通大学;2012年
7 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
8 董一鸿;动态数据库增量式挖掘算法及其应用的研究[D];浙江大学;2007年
9 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
10 宫秀军;贝叶斯学习理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
2 张剑;复杂网络中的层次社团发现与应用[D];北京邮电大学;2011年
3 孙琼;我国房地产企业流动性指标体系研究[D];中南大学;2009年
4 瞿俊;基于重叠度的层次聚类算法研究及其应用[D];厦门大学;2007年
5 吴伟;联机手写蒙古文字识别技术的研究与实现[D];内蒙古大学;2005年
6 周晓昕;基于多属性特征的时态近似周期挖掘和应用[D];浙江工业大学;2008年
7 万里春;代理服务器的网页预取研究[D];西华大学;2006年
8 李海波;基于通信行为挖掘的犯罪网络分析技术研究与应用[D];上海交通大学;2007年
9 张鲲;一种混合无监督图像分割算法[D];江南大学;2008年
10 郑鹏;基于商务智能的物流客户市场细分方法研究[D];武汉科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026