收藏本站
《复旦大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

中文信息处理中若干关键技术的研究

王建会  
【摘要】:随着科学技术的高速发展,以及各种资源数量的不断增多,为了提高效率,信息处理已经成为当前最重要的研究内容,其中涉及到切词和属性选择、信息抽取、自然语言理解、自动聚类和分类、自动摘要、自动标引和主题识别、信息结构分析、文本生成以及信息检索等等。其中,属性选择是一项较为重要的基础性研究工作,为其它的研究提供基础和前提。而其它研究工作可以有效地、而且较为准确地抽取出有用信息、挖掘出新的知识,提高获取大量有用信息的效率和速度。 针对当前对信息处理的需求,本文对中文信息处理中的若干关键技术进行了研究。本文的主要研究内容和贡献如下: 1.改进了N-gram切词算法和基于概率统计的属性选择算法。在信息处理研究领域,迄今为止,已提出了多种属性选择算法。由于基于字典的属性选择算法,需要花费大量的时间和精力来建辞典,所以,大多数现有的算法都是基于概率统计的。研究发现,现有算法在以下几个方面尚有待改进:(1)这些算法所依据的评分策略,没有充分地考虑词语在类之间和类内文档间的分布特性,要么只是基于传统的TF/IDF,要么只是基于词语在类间的分布特性;(2)现有的N-gram切词算法的效率有待提高;(3)现有算法在选择属性时,没有考虑相互重叠的词串之间的筛选问题;(4)现有算法没有考虑词语的位置对其重要性的影响。针对这些问题,本文改进了N-gram切词算法,并充分考虑词语的分布特性和位置的重要性,准确地处理叠词,提出了新的基于统计的属性选择算法,扩展和改进了现有算法。实验结果表明,本文提出的算法可以有效地提高属性选择的精度,从而改善信息处理的性能。 2.改进了词语间依存关系的定量识别策略。本文扩展和改进了现有的基于统计的词语间依存关系定量识别算法,力图解决现有算法中存在的有待改进的不足之处,提高识别的准确率,从而提高信息处理和自然语言处理等的时空效率和性能。为此,本文作了以下贡献和创新工作:(1)充分考虑词项的概率分布的影响,不仅能够有效地识别出相邻词项之间的依存关系,还可以识别出不相邻词项之间和潜在的依存关系;(2)明确区分词项之间的搭配关系、并列关系和从属关系,针对它们不同的特点,提出不同的识别算法;(3)提出字串匹配模型,以此识别部分词项之间的从属关系;(4)充分考虑两个词项之间相互位置的离散分布和距离的 摘要 影响、以及它们的概率分布特:性,提出词项间的依存强度模型,并据此 构建词语间依存关系树;(5)提出更新策略,对已经建好的依存关系树 进行裁剪,并从己建好的依存关系树中挖掘出不相邻词项之间的依存关 系和潜在的依存关系。应用实验的结果表明,本文提出的算法可以有效 地识别出词语间的依存关系,从而改善信息处理和自然语言处理等的性 育旨。 提出了一种具有增量学习能力、高效的信息分类算法。在模式识别研究 领域,在己有的分类算法中,大多数都是基于向量空间模型的算法,其 中使用范围最广的是kNN算法;,但是,其中的大多数算法都因为计算复杂 度太高,而不适合于大规模的场合,而且,当训练样本集增大时,都需 要重新生成分类器,可扩展性差。本文提出了互依赖和等效半径的概念, 并将两者相结合,提出新的分类算法—基于互依赖和等效半径、易更 新的分类算法SECTILE,SECT工LE计算复杂度较低,而且扩展性能较好, 适用于大规模场合。将SECTILE算法应用于中文文本分类,并与kNN算法 和类中心向量法进行比较,结果表明,在保证不损失分类精度的前提下, SECTILE可以大大提高分类速度,有利于对大规模信息样本进行实时在线 的自动分类。 提出了一种基于子空间的信J息聚类算法。在信息处理研究领域,现有的 大多数聚类算法都需要人为给出一些参数,而且时空效率也有待于进一 步提高。然而,在没有先验知识的情况下,人为确定这些参数是十分困 难的。为了解决这一难题,本文提出了一种实用而且高效的聚类算法, 力图避免需要人为事先确定的参数,同时提高时空效率和信息处理的性 能。此外,本文还从多个角度分析了该算法的性能,并将该算法应用于 中文文本聚类,结果表明,该算法不需要人为确定参数,同时,还提高 了信息处理的时空效率和性能。 提出基于子空间上子主题聚类的信息摘要算法。自动摘要的算法大致可 分为两大类,一类是基于统计的算法,另一类是基于知识理解的算法。 前者与领域无关,但是精度低;后者准确度高,但是应用范围受到领域 限制。鉴于此,本文提出了一种基于主题聚类的自动摘要算法,采用统 计方法的同时,适当结合知识理解,既摆脱了领域限制,又使摘要的结 果更为准确。此外,本文还提出了一种较为客观的、基于任务的摘要性 能评估算法。 本文提出了一种自适应于不同样本的、动态确定摘要长度的策略。随着 信息技术的发展和信息量的大量增多,提出了很多自动摘要的算法。在 彭 摘要 这些众多的算法中,都有一个共同的现象—摘要的长度均需事先给定。 然而,实际的情况是,随着信息样本的不同,该信息样本所包含的信息 量也是不同的。为了能够全面地反映
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前5条
1 王圆;孙铁利;李杨;;Web文本挖掘中的特征表示和特征提取[J];电脑知识与技术;2006年14期
2 林伟;柳荣其;徐熙;;一种基于N-Gram的垃圾邮件过滤方法研究[J];计算机应用与软件;2010年02期
3 刘博;杨柳;袁方;;改进的KNN方法及其在中文文本分类中的应用[J];西华大学学报(自然科学版);2008年02期
4 罗晟;;号码百事通文本搜索引擎设计及优化对策[J];武汉理工大学学报;2009年24期
5 殷卫东;朱晓华;赵俊凯;;网络舆情技术浅析[J];信息网络安全;2012年03期
中国重要会议论文全文数据库 前1条
1 章红英;刘宁;李文刚;马赟;张宝文;陈婷;史青;王于英;;对古代医学文献评价方法的思考[A];全国第十一届中医医史文献学术研讨会论文集[C];2008年
中国博士学位论文全文数据库 前4条
1 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
3 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
4 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
2 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年
3 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
4 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
5 陈飞;聚类搜索引擎关键技术的研究[D];北京邮电大学;2011年
6 许芳芳;基于DBSCAN优化算法的Web文本聚类研究[D];华东师范大学;2011年
7 高明;基于支持向量机的Web文本分类研究[D];华中师范大学;2011年
8 许婷;面向中文信息处理的复句特征分析器的研究与实现[D];华中师范大学;2011年
9 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
10 奚婷;搜索引擎结果的聚类系统研究[D];西南交通大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报;2002年05期
2 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
3 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
4 史磊,王永成;英文文献自动摘要系统的研制与开发[J];高技术通讯;1999年11期
5 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
6 石国华;科技文献主题词的自动标引法[J];杭州大学学报(自然科学版);1998年03期
7 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
8 王建会,胡运发,李荣陆;自适应确定摘要长度[J];计算机研究与发展;2004年03期
9 麻志毅,姚天顺;基于情境的文本主题求解[J];计算机研究与发展;1998年04期
10 冯志伟;;国外主要自然语言理解系统概况[J];计算机科学;1984年02期
中国重要会议论文全文数据库 前1条
1 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
3 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
4 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
5 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
6 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
7 张红涛;胡玉霞;张恒源;顾波;;储粮害虫图像识别中的特征压缩研究[J];安徽农业科学;2008年27期
8 张昭;何东健;;基于计算机视觉的竹块颜色分类方法研究[J];安徽农业科学;2010年26期
9 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
10 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
3 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
4 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
5 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
6 贾允毅;胥布工;王世华;刘步春;;端对端网络时钟漂移补偿算法研究及其实现[A];第二十六届中国控制会议论文集[C];2007年
7 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
8 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
9 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
10 毛存礼;余正涛;线岩团;郭剑毅;雷雄丽;;基于短信的旅游景点酒店问答系统研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
4 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 冯光升;面向认知网络的自适应QoS感知与配置方法[D];哈尔滨工程大学;2009年
7 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
8 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
9 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
10 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
5 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
6 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
7 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
8 岳海鸥;基于Ajax和Soap Service的应用框架及实现方法研究[D];山东科技大学;2010年
9 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
10 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 周宏宇;张政;;中文分词技术综述[J];安阳师范学院学报;2010年02期
2 丁丰,董娜,林碧琴,袁保宗;自然语言处理系统中自动分词的研究[J];北方交通大学学报;1999年06期
3 孙凯;王颖龙;;支持向量机中Mercer核函数的构造研究[J];兵工自动化;2008年11期
4 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
5 郑德玲,梁瑞鑫,付冬梅,李晓刚,方彤;人工免疫系统及人工免疫遗传算法在优化中的应用[J];北京科技大学学报;2003年03期
6 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
7 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
8 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
9 邓擘;樊孝忠;杨立公;;基于统计分布与集合论的文本分类方法[J];北京理工大学学报;2006年07期
10 刘华富;支持向量机Mercer核的若干性质[J];北京联合大学学报(自然科学版);2005年01期
中国重要会议论文全文数据库 前1条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
2 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
3 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
4 骆祥峰;认知图理论及其在图像分析与理解中的应用[D];合肥工业大学;2003年
5 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
6 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
7 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
8 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
9 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
10 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 张睿;ID3决策树算法分析与改进[D];兰州大学;2010年
2 许婷;面向中文信息处理的复句特征分析器的研究与实现[D];华中师范大学;2011年
3 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
4 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
5 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
6 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
7 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
8 陈晓平;WWW上搜索引擎返回结果的模糊聚类研究[D];河海大学;2002年
9 赵志荣;个性化搜索引擎的研究、设计与实现[D];四川大学;2002年
10 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年
【二级引证文献】
中国期刊全文数据库 前10条
1 梁好;徐长庚;林和平;;实用高效的垃圾邮件过滤算法[J];吉林大学学报(信息科学版);2010年03期
2 孙铁利;张妍;李晓微;;文本挖掘中特征降维方法比较研究[J];电脑知识与技术;2008年02期
3 桑书娟;周晏;;一种基于词长的TFIDF特征项权值计算方法[J];电脑知识与技术;2011年32期
4 刘锋;白凡;;一种改进的K近邻算法在网页分类中的应用[J];电子技术;2010年07期
5 程显毅;潘燕;朱倩;孙萍;;面向事件的多文档文摘生成算法的研究[J];广西师范大学学报(自然科学版);2011年01期
6 林伟;;一种中文邮件过滤网关的设计与实现[J];宝鸡文理学院学报(自然科学版);2012年03期
7 张亮亮;;一种用于话务故障诊断的专家系统[J];电子世界;2013年05期
8 王涛;裘国永;何聚厚;张娇艳;;Naive Bayes邮件过滤模型的特征词选取方法研究[J];航空计算技术;2008年02期
9 陈锐;张蕾;胡艳华;;基于语义的信息检索模型[J];计算机工程与应用;2009年26期
10 沈磊;郑超雷;叶勇武;诸葛斌;;智能建站CMS系统的研究[J];计算机时代;2010年07期
中国博士学位论文全文数据库 前10条
1 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
2 吴胜;网站信息分类体系优化方法及其应用[D];南京林业大学;2009年
3 周科松;全文检索与GIS一体化及在应急管理中的应用研究[D];华东师范大学;2009年
4 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
5 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年
6 努尔布力;基于数据挖掘的异常检测和多步入侵警报关联方法研究[D];吉林大学;2010年
7 许红;基于超声波的聚合物熔体物性关键参数测量方法的研究[D];北京化工大学;2012年
8 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
9 任柯燕;基于机器视觉的室外场景图像理解方法研究[D];北京邮电大学;2012年
10 翟延冬;基于WordNet的短文本语义网挖掘算法研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前10条
1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
2 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
3 张晓艳;面向农业信息服务平台的挖掘技术研究[D];湖南工业大学;2010年
4 梁桢;基于尾字词典的逆向回溯中文分词技术研究[D];武汉工业学院;2010年
5 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
6 王冬娇;改进的语句相似度算法在问答系统中的应用研究[D];大连交通大学;2010年
7 邹圣容;基于方证的症状与证素关系的量化分析研究[D];成都中医药大学;2010年
8 史德增;聚类算法在Web文本挖掘中的应用研究[D];太原理工大学;2011年
9 陶启立;基于语义的科技文档信息资源检索系统的设计与实现[D];西北大学;2011年
10 贾增朝;用于图像检索的视觉词汇树研究[D];西北大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张琪玉;缺乏抽词词典是自动抽词标引难以普及的主要原因[J];图书与情报;1998年02期
2 徐进鸿,史九林,苏新宁;档案管理自动化研究与发展方向[J];档案与建设;1994年09期
3 林鸿飞,高天,姚天顺;中文文本的可视化表示[J];东北大学学报;2000年05期
4 冯志伟;;国外机器翻译的新进展[J];国外语言学;1980年01期
5 陆致极;;关于广义短语结构语法[J];国外语言学;1986年04期
6 马希文;;以计算语言学为背景看语法问题[J];国外语言学;1989年03期
7 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
8 姜贤塔,陈根才;利用字频统计及机器学习的自动文摘方法[J];杭州大学学报(自然科学版);1997年03期
9 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
10 王厚峰,戴大为;汉语句法结构标注的研究[J];计算机研究与发展;1997年03期
中国硕士学位论文全文数据库 前1条
1 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
【相似文献】
中国期刊全文数据库 前10条
1 史磊,王永成;英文文献自动摘要系统研究[J];情报学报;1999年06期
2 李蕾,孙春葵,杨晓兰,钟义信;一种特定领域中文自动摘要系统[J];北京邮电大学学报;2000年01期
3 张雷生,万绍俊,许鹏文;简单中文自动摘要系统研究[J];装备指挥技术学院学报;2004年03期
4 刘洋,王永成;基于Web服务自动摘要系统的安全实现方案[J];计算机工程与应用;2005年15期
5 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
6 谭种;陈跃新;;自动摘要方法综述[J];情报学报;2008年01期
7 龙华;何中市;伍星;李双庆;;基于依存内容单元的金字塔自动摘要评估[J];计算机工程;2009年13期
8 ;计算机中文文本自动摘要系统通过专家鉴定[J];预防医学文献信息;1996年03期
9 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
10 张筱丹;胡学钢;;基于向量空间模型的自动摘要冗余处理研究[J];合肥工业大学学报(自然科学版);2010年09期
中国重要会议论文全文数据库 前10条
1 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 蒙应杰;张文;吴超;;基于粗集的数据库水印属性选择优化问题[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 闫光辉;李战怀;吴海军;;基于Z-Ordering技术的分形属性选择方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 朱佳贤;;无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
8 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 王倩;何婷婷;闻彬;宋乐;张茂元;;基于依存关系的中文情感要素抽取技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 傅爱平;;广义依存关系和汉语自动分析[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者 黄彩燕 实习记者 苏静雯;中日经济依存关系显著[N];亚太经济时报;2007年
2 江瑞平;中日经济依存关系“易位”[N];人民日报;2004年
3 刘向晨;让文件捉迷藏[N];中国电脑教育报;2003年
4 路向军(作者单位:天津市委党校);高技术产业对传统产业的依存关系[N];科技日报;2000年
5 苍苍;教你两手[N];中国电脑教育报;2004年
6 马海兵;网络舆情及其分析技术[N];光明日报;2007年
7 本报记者 张霞;马振骋:生活无“译本”[N];21世纪经济报道;2007年
8 柳涛;秋季更需护理肌肤[N];中华工商时报;2002年
9 零和千;练习使用黑白网点[N];电脑报;2005年
10 ;换个角度看问题 中国人比美国人更擅长[N];中国社会报;2007年
中国博士学位论文全文数据库 前10条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年
4 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
5 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
7 张丽娟;微阵列基因表达数据分类问题中的属性选择技术研究[D];国防科学技术大学;2008年
8 王琪;软件质量预测模型中的若干关键问题研究[D];上海交通大学;2007年
9 刘光远;基于数据挖掘的移动通信用户流失研究[D];吉林大学;2007年
10 夏国恩;基于商务智能的客户流失预测模型与算法研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
2 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
3 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
4 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
5 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
6 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年
7 熊芝;中文网页自动摘要系统的设计与实现[D];华南理工大学;2011年
8 张文静;搜索引擎返回结果的自动摘要研究[D];中国石油大学;2010年
9 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
10 杨秋洁;基于IV属性选择的随机森林模型研究[D];合肥工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026