收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语文本作者识别方法的研究与实现

张剑  
【摘要】: 计算机技术的发展推动了人们在识别技术方面的研究,各种各样的识别技术不断被应用于公安工作实践中。汉语文本作者识别方法的研究成果应用于公安工作实践中,可以有效地辅助解决公安工作实践中遇到的文本作者识别问题。 本文提出了一个基于序贯最小优化算法的多层面混合的汉语文本作者识别模型(SM-CTAI),该模型从字符、词和句子三个层面提取特征对文本进行表示,并在其组成的向量空间进行文本作者识别。基于上述模型的文本作者识别系统由训练模块和识别模块组成,文本在经过预处理后,对其进行分词和词性标注,根据处理的结果在字符、词和句子三个层面对提取的特征进行统计、计算和归一化处理,从而把文本表示成三个层面混合的向量空间中的一个向量。在训练集中的文本均表示成向量空间的向量之后,利用序贯最小优化方法建立识别模型。对于将要进行识别的文本,亦按上述的方法将其表示为一个向量,并利用已建立的识别模型对其进行识别。实验表明,该模型相对于基于单一层面特征的文本作者识别方法有更好的召回率和精确率。 本文在三个方面提出了新的想法:第一,提出了在字符层面提取文本高维特征进行文本表示。这种方法基于汉语的自身特点,提取出了汉语字符层面的有用信息。第二,提出了将字符、词和句子三个层面的特征混合使用,与单一层面特征相比,这种方法能够提取出文本更多的信息。第三,将多层面混合的汉语文本作者识别方法应用于对公安工作实践中遇到的文本作者识别问题的解决,积极运用所学知识解决公安工作中遇到的实际问题。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;新款正品Kingmax Super-Ram系列内存识别方法[J];电脑迷;2004年05期
2 ;哈尔滨工业大学学报1992年总目录[J];哈尔滨工业大学学报;1992年06期
3 郭锋;刘玉利;刘鹏军;;P2P的识别[J];中小企业科技;2007年08期
4 刘玉栋,苏开娜,马丽;一种基于模型的步态识别方法[J];计算机工程与应用;2005年09期
5 闫丰亭;;基于头部透视图像的身份识别[J];电脑知识与技术;2010年20期
6 丁克北;;基于图像处理方法的轴心轨迹识别方法[J];风机技术;2006年05期
7 赵明;手写印刷体汉字识别方法综述[J];计算机研究与发展;1993年04期
8 孟庆波;;浅议计算机病毒的分类及识别方法[J];吉林省教育学院学报(学科版);2009年05期
9 王天华;;出版企业选题风险的种类、特征及其识别方法[J];辽宁行政学院学报;2011年06期
10 贺无名;;语音识别技术及其研究进展[J];中国科技信息;2006年18期
11 曾鸿;;虚假竞争情报的识别[J];情报杂志;2007年02期
12 王韬;;P2P流量识别方法的分析研究[J];科技风;2009年04期
13 陈辉;王伟;;车牌识别技术研究[J];科技传播;2009年04期
14 贾磊磊;陈锡华;熊川;;验证码的模糊识别[J];西昌学院学报(自然科学版);2010年01期
15 黄红兵;曹敦;吴志敏;;GSM网络中干扰信号的识别方法[J];信息安全与通信保密;2007年04期
16 徐鹏;;基于BP神经网络的规范手写体数字离线识别[J];木工机床;2008年04期
17 赵丽莹;;科技论文自我剽窃的识别[J];编辑学报;2010年01期
18 李臻;杨雅辉;张广兴;;大业务流识别方法研究综述[J];计算机应用研究;2011年01期
19 孙来军;李江游;候影;叶光忠;;一种规则几何图形的计算机识别方法[J];微型机与应用;2011年09期
20 俞进福;;智能监控系统中图像快速匹配识别方法[J];廊坊师范学院学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 孙国;郭杏林;;基于线性逼近的载荷识别方法[A];中国力学学会学术大会'2009论文摘要集[C];2009年
2 管天云;徐亮;蒋静坪;;基于小波变换的机器人视觉技术[A];1998中国控制与决策学术年会论文集[C];1998年
3 邓宏文;王红亮;祝永军;T.A.Cross;;重力流沉积基准面的识别方法及其在陆相盆地中应用[A];2001年全国沉积学大会摘要论文集[C];2001年
4 郑凯;;建立多维数据异常点识别方法的尝试[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
5 翟鹏程;高岳权;;结构损伤识别方法研究现状[A];土木建筑教育改革理论与实践[C];2009年
6 宋义民;陈永红;李瑞民;周春红;;浅谈气测录井双单根峰的识别[A];录井技术文集(第四辑)[C];2004年
7 郭文川;郭康权;朱新华;;介电特性在番茄和苹果品种识别中的应用[A];农业机械化与新农村建设——中国农业机械学会2006年学术年会论文集(下册)[C];2006年
8 李永胜;吕林夏;;基于脉冲编码技术的水下目标尺度识别方法研究[A];2011'中国西部声学学术交流会论文集[C];2011年
9 刘杰;秦永强;史元春;;面向交互桌面的高效触点识别方法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 于开平;李静;庞世伟;邹经湘;;基于遗传算法的结构模态参数识别方法研究[A];第八届全国振动理论及应用学术会议论文集摘要[C];2003年
中国博士学位论文全文数据库 前10条
1 陈欢;直线阵潜艇噪声源高分辨定位识别方法研究[D];哈尔滨工程大学;2011年
2 陶冬旺;基于数据驱动和物理模型的结构地震损伤识别方法研究[D];哈尔滨工业大学;2013年
3 邵强;切削加工过程中颤振的监测与识别方法研究[D];大连理工大学;2010年
4 江俊;自由表面旋涡的识别方法及连铸下渣水模实验研究[D];浙江大学;2012年
5 王丹;多维多分辨仿生识别方法研究[D];吉林大学;2011年
6 陈旭阳;主动式探测系统高质量检测、成像与识别方法研究[D];西安电子科技大学;2011年
7 吕洁华;高新技术企业核心竞争力研究[D];东北林业大学;2005年
8 时洁;基于矢量阵的水下噪声源近场高分辨定位识别方法研究[D];哈尔滨工程大学;2009年
9 赵鹏;基于切削体分解组合策略的工艺特征识别方法研究[D];武汉理工大学;2011年
10 夏慧煜;选择性剪接识别相关问题研究[D];清华大学;2006年
中国硕士学位论文全文数据库 前10条
1 唐福辉;现有液化识别方法对比分析[D];中国地震局工程力学研究所;2011年
2 胡庆安;基于双重特征的协议识别方法研究[D];西南交通大学;2010年
3 李怀鹏;运行模态分析中周期性激励识别方法研究[D];南京航空航天大学;2010年
4 李正东;典型信号调制类型识别方法研究[D];电子科技大学;2013年
5 杨哲睿;基于MMTD的网络流量应用识别方法[D];南京邮电大学;2012年
6 孙娟红;车标识别方法研究[D];辽宁师范大学;2011年
7 陈蕾;一种面向移动互联网的业务识别方法研究[D];吉林大学;2011年
8 钟以融;P2P流量识别方法研究[D];东北财经大学;2010年
9 孟磊磊;基于行为特征的P2P应用识别方法的研究[D];曲阜师范大学;2011年
10 乌英嘎;星载电子设备活动多余物识别方法研究[D];哈尔滨工业大学;2011年
中国重要报纸全文数据库 前10条
1 张侃;正品手机电池识别方法[N];通信产业报;2000年
2 本报首席记者 崔晓农;农资下乡:实惠送到家门口[N];山西经济日报;2009年
3 广西 黄绍侃;集成电路管脚识别方法[N];电子报;2001年
4 李艳;注水鸡肉的识别方法[N];中国食品质量报;2005年
5 黄建同;第五套人民币防伪技术及识别方法[N];人民公安报;2007年
6 李雨田;纸和纸板的丝缕方向及其识别方法[N];中国包装报;2005年
7 郑延平;停产鸡的识别方法[N];中国畜牧报;2002年
8 ;会计信息是真是假[N];中国证券报;2003年
9 江其勤;欠平衡钻井条件下含气层识别方法研究成功[N];中国石化报;2005年
10 ;会计信息是真是假[N];中国证券报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978