收藏本站
《清华大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

中文文本自动分类中的关键问题研究

薛德军  
【摘要】:1.建设了一个大规模中文数据集,包含55类,71674篇文本。基于多项式贝叶斯分类器中,比较了汉字Unigram和Bigram特征在文本分类中的作用。Bigram的最优F1值比Unigram高7.7%,也优于它们的组合方式。 2.提出了特征的分类能力和描述能力的概念。分类能力保证了分类器能将文本按类型分开,描述能力保证了分类是基于文本内容的。将特征分为强信息特征、弱信息特征和不相关特征三类。提出了特征选择方法 ,它在特征的分类能力和描述能力之间取得较好的平衡。同样选择70000个特征时,它的F1值比 提高3.1%,比 提高5.8%。 3.发现特征集中存在大量高度重叠特征和高度偏差特征。提出将高度重叠的Bigram特征提升到对应的Trigram特征的降维方法 。提出直接删除高度偏差特征的 方法和将高度偏差特征用重要字符替代的 方法。在 特征选择的基础上, 的降维度达到6.2%, 达到11%时不损失分类效果。组合四种降维方法,提出了多步降维策略,其中 和 合在一起的降维度达到26.7%时,保持分类效果不下降。 4.在两个相反方向上对特征权重计算进行了研究。一是往复杂方向走,将 与 结合,提出了特征权重计算方法 ;提出了统计量 ,并与 、 结合,提出了方法 。在 选择的70000特征集上, 和 的F1值比传统的 提高5.7%,在 选择的特征集上提高3%。二是往简单方向走,提出了依赖大特征集的二元权重方法 ,进一步提出BW+数值平滑权重方法BW-NWS,解决了 中的分类不确定问题。BW-NWS方法显著改善了分类效果,而且与数值平滑权重方法的复杂性无关。在 选择的70000特征集上,BW-NWS的F1达到97.7%,比 提高16.6%。 5.研究了词特征在文本分类中的作用,并与Bigram进行了比较。基于Bigram的结论也适用于词特征。Bigram特征的分类效果优于词特征。
【学位授予单位】:清华大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前9条
1 郭泗辉;樊兴华;;一种改进的贝叶斯网络短文本分类算法[J];广西师范大学学报(自然科学版);2010年03期
2 张成宝;王志玲;;基于层次分析法的中文文本分类系统评价[J];农业图书情报学刊;2007年12期
3 谭金波;;文本层次分类中特征项权重算法的比较研究[J];情报杂志;2007年09期
4 张成宝;王志玲;;基于层次分析法的中文文本分类系统评价[J];情报杂志;2007年10期
5 张艳;;基于专业搜索引擎的网页去重技术研究[J];软件导刊;2012年04期
6 李若鹏;李翔;林祥;李建华;;基于DK算法的互联网热点主动发现研究与实现[J];计算机技术与发展;2008年09期
7 张小刚;杨凯;冉天保;;中文WEB文档自动分类系统的设计与实现[J];微计算机信息;2008年30期
8 赫建营;晏海华;金茂忠;刘超;;基于SWEBOK的软件工程知识分类模型及算法[J];系统仿真学报;2008年17期
9 邱欢堂;何聚厚;何秀青;;教学反思内容自动评估模型研究[J];计算机技术与发展;2012年09期
中国博士学位论文全文数据库 前5条
1 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
2 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
3 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
4 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
5 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
2 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
3 陈雅芳;中文文本分类方法研究[D];浙江大学;2010年
4 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
5 范小丽;文本分类中特征选择的研究与实现[D];西北大学;2011年
6 邓彩凤;中文文本分类中互信息特征选择方法研究[D];西南大学;2011年
7 张博;基于SVM的中文观点句抽取[D];北京邮电大学;2011年
8 张春燕;基于自然语言处理的文本分类分析与研究[D];江西理工大学;2011年
9 赵德圣;基于关联技术的中文文本分类研究[D];南京理工大学;2011年
10 盛魁;基于SVM的中文网页自动分类技术研究[D];安徽大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
2 刁倩,王永成,张惠惠,何骥;文本自动分类中的词权重与分类算法[J];中文信息学报;2000年03期
3 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
4 李辉,史忠植,许卓群;运用文本领域的常识改善基于支撑向量机的文本分类器性能[J];中文信息学报;2002年02期
5 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
6 朱靖波,姚天顺;基于FIFA算法的文本分类[J];中文信息学报;2002年03期
7 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
8 黄科,马少平;基于统计分词的中文网页分类[J];中文信息学报;2002年06期
9 季文赟,周傲英,张亮,金文;一种基于遗传算法的优化分类器的方法[J];软件学报;2002年02期
10 卜东波,白硕,李国杰;文本聚类中权重计算的对偶性策略[J];软件学报;2002年11期
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
4 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
5 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期
6 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
7 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
8 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
9 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
10 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
3 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
4 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
5 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
6 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
7 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
8 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
9 ;Image Classification with Ant Colony Based Support Vector Machine[A];中国自动化学会控制理论专业委员会A卷[C];2011年
10 毛存礼;余正涛;线岩团;郭剑毅;雷雄丽;;基于短信的旅游景点酒店问答系统研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
5 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
6 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
7 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
8 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
9 罗彬;基于MMOI方法的电信客户流失预测与挽留研究[D];电子科技大学;2010年
10 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 马冉冉;集成学习算法研究[D];山东科技大学;2010年
5 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
6 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
7 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
8 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
9 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
10 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
2 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 贺学勤;;X-able形容词的主客观性及其语义分类[J];安徽工业大学学报(社会科学版);2006年01期
4 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
5 杨震;段立娟;赖英旭;;基于字符串相似性聚类的网络短文本舆情热点发现技术[J];北京工业大学学报;2010年05期
6 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
7 李卫东;宋威;李欣;杨炳儒;;一种多标准决策树剪枝方法及其在入侵检测中的应用[J];北京科技大学学报;2007年04期
8 徐光美;杨炳儒;秦奕青;张伟;;基于互信息的多关系朴素贝叶斯分类器[J];北京科技大学学报;2008年08期
9 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
10 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
中国重要会议论文全文数据库 前2条
1 姚天昉;彭思崴;;汉语主客观文本分类方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 黄旭;朱艳琴;罗喜召;;重复串特征提取算法在不良信息检测中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
3 谭天乐;基于粗糙集的过程建模、控制与故障诊断[D];浙江大学;2003年
4 李仁璞;分类数据挖掘中若干基本问题的研究[D];天津大学;2003年
5 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
6 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
7 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
8 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
9 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
10 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 张桂喜;基于语义的领域相关文本分类研究[D];北京工业大学;2011年
2 付玲玲;结合本体HowNet的中文文本分类研究[D];重庆大学;2011年
3 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
4 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
5 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
6 杨昂;文本分类算法研究[D];湖南大学;2002年
7 辛明海;个性化信息服务中的本体论自动分类和多Agent技术[D];华侨大学;2002年
8 胡丹;基于Rough Set的规则提取与粗—模糊神经网络研究[D];四川师范大学;2002年
9 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
10 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
【二级引证文献】
中国期刊全文数据库 前10条
1 黄美璇;;基于主题发现的舆情分析系统的设计与实现[J];北京联合大学学报(自然科学版);2012年01期
2 黄美璇;;基于聚类分析的网络舆情监控系统的设计[J];宝鸡文理学院学报(自然科学版);2011年04期
3 杜卫锋;秦克云;;不协调决策表几种约简标准及其关系分析[J];电子学报;2011年06期
4 杨武;宋静静;唐继强;;中文微博情感分析中主客观句分类方法[J];重庆理工大学学报(自然科学);2013年01期
5 陈锐;张蕾;胡艳华;;基于语义的信息检索模型[J];计算机工程与应用;2009年26期
6 万年红;谭文安;王雪蓉;;基于构件行为聚类的软件工程知识分类[J];计算机工程;2011年09期
7 沈磊;郑超雷;叶勇武;诸葛斌;;智能建站CMS系统的研究[J];计算机时代;2010年07期
8 杨更;;改进的DK算法在网络信息聚类中的应用[J];计算机应用与软件;2012年08期
9 吴正江;;动态内容完备信息表约简的更新算法[J];计算机科学与探索;2012年10期
10 杨天平;朱征宇;;使用概念描述的中文短文本分类算法[J];计算机应用;2012年12期
中国重要会议论文全文数据库 前1条
1 严春美;郭熙铜;陈晓东;;基于电子病历的智能诊断系统研究[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
中国博士学位论文全文数据库 前8条
1 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
2 张静;水库防洪分类预报调度方式研究及风险分析[D];大连理工大学;2008年
3 吴胜;网站信息分类体系优化方法及其应用[D];南京林业大学;2009年
4 周科松;全文检索与GIS一体化及在应急管理中的应用研究[D];华东师范大学;2009年
5 王振华;布尔向量数据模式分类关键问题及中医诊断量表研制[D];北京交通大学;2009年
6 陈圣兵;基于商空间理论的海量信息检索模型的研究[D];安徽大学;2010年
7 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
8 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
2 杨克强;LVQ神经网络在齿轮箱故障诊断中的研究[D];安徽农业大学;2010年
3 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
4 王思丽;藏文网页自动发现与采集技术研究[D];西北民族大学;2010年
5 孙海虹;基于模糊粗糙集的Web文本分类研究[D];哈尔滨理工大学;2010年
6 荣建文;基于RS-SVM的Web中文文本自动分类研究[D];东北财经大学;2010年
7 袁路妍;钨层文本自动分类技术的研究与应用[D];东华大学;2011年
8 张宁;基于语义的中文文本预处理研究[D];西安电子科技大学;2011年
9 吕桃霞;基于Agent技术的网络安全审计模型研究与实现[D];山东师范大学;2011年
10 陶启立;基于语义的科技文档信息资源检索系统的设计与实现[D];西北大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 丁丰,董娜,林碧琴,袁保宗;自然语言处理系统中自动分词的研究[J];北方交通大学学报;1999年06期
2 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
3 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
4 鲁松,李晓黎,白硕,王实;文档中词语权重计算方法的改进[J];中文信息学报;2000年06期
5 吴军,王作英,禹锋,王侠;汉语语料的自动分类[J];中文信息学报;1995年04期
6 邹涛,王继成,黄源,张福炎;中文文档自动分类系统的设计与实现[J];中文信息学报;1999年03期
7 李国臣;文本分类中基于对数似然比测试的特征词选择方法[J];中文信息学报;1999年04期
8 荆晓远,杨静宇;基于相关性和有效互补性分析的多分类器组合方法[J];自动化学报;2000年06期
9 肖旭红,戴汝为;一种识别手写汉字的多分类器集成方法[J];自动化学报;1997年05期
10 黄萱菁;吴立德;;基于向量空间模型的文档分类系统[J];模式识别与人工智能;1998年02期
【相似文献】
中国期刊全文数据库 前10条
1 龚静;曾建一;;文本聚类中的特征选择方法[J];吉首大学学报(自然科学版);2008年02期
2 康进峰;王国营;梁春迎;谭晓贞;;用于色情网页过滤中的KNN算法改进[J];计算机安全;2009年09期
3 毛雪岷;丁友明;;基于语义引导与支持向量机的中文文本分类[J];情报杂志;2007年11期
4 葛亮;赵建国;;一个中文网络文本过滤系统的设计[J];电脑知识与技术;2008年26期
5 张翔;周明全;耿国华;;基于粗糙集的中文文本特征选择方法研究[J];计算机应用与软件;2010年03期
6 寇苏玲;蔡庆生;;中文文本分类中的特征选择研究[J];计算机仿真;2007年03期
7 王晓微;;两种分类方法特征选择的比较[J];电子技术;2007年Z3期
8 魏晓宁;朱巧明;;基于Nave Bayes模型的垃圾邮件过滤方法[J];南通大学学报(自然科学版);2008年01期
9 符发;;中文文本分类中特征选择方法的比较[J];现代计算机(专业版);2008年06期
10 田卫新;郑胜;;一种基于特征选择的主观性文本分析方法[J];计算机系统应用;2011年08期
中国重要会议论文全文数据库 前10条
1 胡玉娴;;基于《知网》和遗传算法的中文文本聚类特征选择[A];2009全国计算机网络与通信学术会议论文集[C];2009年
2 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
3 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 王强;曾向阳;王曙光;李娜;;主元分析在水下目标特征选择中的应用[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
5 高砚军;徐华平;;基于窗口自适应灰度共生矩阵的SAR图像分类[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
6 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 郑天宏;许杭杰;董黎刚;;中文文本抄袭检查技术的研究[A];浙江省电子学会2010学术年会论文集[C];2010年
8 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 李爱新;孙铁;郭炎峰;;基于人工神经网络的脑电信号模式分类[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
10 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 中国社科院法学所研究员 刘仁文;国际公约中文文本的纠错与重译[N];法制日报;2008年
2 周晓娟;TD已过分水岭[N];通信产业报;2008年
3 吴子桐;整理英文国故,说明真实中国[N];中华读书报;2010年
4 赛迪评测计算机外围设备实验室;支持无线打印[N];中国计算机报;2003年
5 ;健康、成本兼顾[N];中国计算机报;2004年
6 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
7 通讯员 彭云 袁龙刚;袁仁国荣膺改革开放30年酒界领军人物[N];经理日报;2009年
8 赛迪评测硬件评测事业部计算机外设实验室;“精”工出“细”活[N];中国计算机报;2003年
9 记者 齐泽萍;我省科技之花含苞待放[N];山西经济日报;2002年
10 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
中国博士学位论文全文数据库 前10条
1 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
2 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
3 张颖;基于群集智能模式识别方法的研究[D];大连理工大学;2008年
4 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
5 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
6 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
7 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
8 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
9 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
10 李南希;非特定人的自然书写脱机中文文本行识别[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 龚静;中文文本聚类中特征选择算法的研究[D];湘潭大学;2006年
2 孙国欣;基于主动学习的中文文本分类[D];兰州大学;2006年
3 李淑鹏;基于神经网络的文本自动分类系统的研究[D];武汉理工大学;2008年
4 党蕾;中文文本多粒度情感分类计算的研究[D];西北大学;2010年
5 孙丽华;中文文本自动分类的研究[D];哈尔滨工程大学;2002年
6 黄文江;中文文本聚类算法分析与研究[D];上海交通大学;2010年
7 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
8 许林杰;中文文本分词研究[D];山东师范大学;2003年
9 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
10 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026