收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本载体信息隐藏研究

戴祖旭  
【摘要】: 文本文档作为一种普遍使用的信息存储与传输媒体,利用它们进行隐秘通信、利用数字水印保护文本文档版权并对文档内容进行认证等是信息安全领域的热门研究课题。由于文本文档缺乏图像、音频和视频等媒体所具有的人类视觉或听觉冗余特性,以及当前自然语言处理研究领域对文本内容的理解、变换和生成缺乏坚实的理论基础与实用的自动化技术等原因,文本载体信息隐藏的研究工作极具挑战性。 简述了信息隐藏的概念、模型、应用及国内外研究动态。考虑到自然语言语句是词的序列,处于序列中的词具有特定的词性,比如名词、动词等,因此语句可以变换为词性标记串(简称标记串)。将词性标记作为文本的一个变换域来研究,提出了若干基于变换域的文本信息隐藏新算法。 自然语言的词性通常是有限的,如果在词性标记集上定义适当的偏序关系,则标记串就具有序的特性,通过计算逆序数的奇偶性,可以将标记串映射为0或1。研究发现,随机选取标记串序列,其对应的二进制序列具有较好的自相关性和互相关性。提出了利用序列逆序数奇偶性隐藏信息的算法,并证明了逆序数奇偶性在标记串符号对换、增加和删除变换下的性质。根据隐藏信息的要求,先对标记串做适当变换,再在变换后的标记串指导下修改自然语言句子,从理论上保证了可行修改的存在性,避免直接在自然语言句子层面上做修改的盲目性。该算法能抵抗同义词替换攻击。 自然语言的句型具有稳定性,而标记串本质上就是句型,于是一篇文档对应的标记串具有统计特性。提出了一种基于信息熵的信息隐藏方案,该方案通过改变标记串的概率分布使其熵与隐藏的信息一致。由于水印函数是一类实值函数,其值域仅受计算精度限制,可以大幅度提高水印容量。算法能抵抗同义词替换、句子移位等攻击,避免了信息提取过程中的同步问题。安全性分析给出了敌手擦出水印的计算复杂度。另外,给定一个离散且有限随机变量的熵,求其对应的概率分布则需要解多元非线性方程,提出了一个将n元熵方程化为至多(n-1)个一元非线性方程求解的算法,证明了算法的正确性,给出了误差估计。 Wayner等提出的载体文本生成技术在自然语言层次上构造文法,文法的语言是自然语言的一个子集,要保证载体文本语义的一致性而不至于引起第三方怀疑,对文法有很高要求,难于实现自动化。提出了基于Huffman树和词性标记文法的两种标记串编码信息隐藏方法。以标记串集合为变换域,将秘密信息与载体文本都映射到该域,再运用字符串匹配技术计算秘密信息句子在载体文本中的位置,位置即为密钥。接收方与发送方有相同的标记串集合与映射函数,根据密钥从载体文本中提取标记串,通过解码标记串读出秘密信息。给出了信息隐藏容量公式。由于本算法将秘密信息隐藏在文本句型而不是语句本身,从而可任意选取载体文本而彻底避免了语义一致性问题。词性标记文法易于构造,语法分析可用YACC实现,容易实现自动化。 行移编码信息隐藏技术使用质心检测方法提取信息,在文本行长度较短的情况下检测误差较大。Low等指出质心检测方法对短文本行失效的原因在于短行质量小会导致质心噪声方差大,但未给出改进方法。对经典的质心检测方法作了改进,通过模拟扩展初始文本行,综合应用再生文本行轮廓和初始文本行轮廓信息构造了一个再生模拟文本行质心序列,证明了该序列依概率收敛于初始文本行质心。用MATLAB实现了行移编码与质心检测算法,实验结果表明改进后的检测方法在处理含有短行的文档水印时较之与经典方法,误检概率可减少一半。因此用行移编码嵌入水印时可不受文本行长度限制,提高了文档水印容量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 詹卫东;;自然语言的自动分析与生成简介[J];术语标准化与信息技术;2010年04期
2 邵品洪;自然语言处理在情报检索中的应用[J];现代图书情报技术;1994年03期
3 吕西安·马尔柰夫,保尔·若利昂;简论自然语言处理的连接网络法[J];中文信息学报;1997年02期
4 张琳琳,宋继平,王能忠;基于核心推导的句法分析[J];西南师范大学学报(自然科学版);1997年03期
5 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期
6 闫琪,张志伟,宁洪;用户搜索请求中限定成分的识别及提取[J];计算机工程与科学;2000年03期
7 左远清,周洞汝,王波;自然语言处理在搜索引擎信息检索中的应用[J];现代计算机;2002年07期
8 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
9 刘亚军,徐易,高莉莎;提高IQAS查询速度的一种方法[J];计算机工程与应用;2004年11期
10 王振华,孔祥龙,陆汝占,刘绍明;结合决策树方法的中文姓名识别[J];中文信息学报;2004年06期
11 杜波,田怀凤,王立,陆汝占;基于多策略的专业领域术语抽取器的设计[J];计算机工程;2005年14期
12 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
13 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
14 邹娟;周经野;邓成;;一种基于语义分析的中文特征值提取方法[J];计算机工程与应用;2005年36期
15 傅立云;刘新;;基于词典的汉语自动分词算法的改进[J];情报杂志;2006年01期
16 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
17 徐继伟;;自然语言处理技术在生物信息学中的应用(英文)[J];生物信息学;2006年01期
18 孟维娟;;自然语言处理中的歧义[J];上海电机学院学报;2006年S1期
19 张莉;李东生;肖燕峰;;基于Web的受限领域问答系统研究及应用[J];电脑开发与应用;2007年05期
20 贾君枝;邰杨芳;;FrameNet的语义类型研究[J];情报理论与实践;2007年05期
中国重要会议论文全文数据库 前10条
1 颜元;;基于信息熵的旅游地生命周期量化研究——旅游地演化实质的一种假说[A];中国地理学会2006年学术年会论文摘要集[C];2006年
2 谢平;林洪彬;王霄;刘彬;;一种用于故障诊断的多信息熵监测方法研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 闫华;;基于信息熵的粗糙集知识约简方法[A];第十届粤港机电工程技术与应用研讨会暨梁天培教授纪念会文集[C];2008年
4 张孝飞;陈肇雄;黄河燕;俞旸;;基于信息熵的候选实例模式检索算法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
6 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 苗夺谦;王珏;;知识粗糙性的信息论解释[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
8 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
9 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 陈超海;王宽全;李乃民;徐礼胜;张冬雨;耿斌;;一种基于熵分析的脉象数据压缩方法[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
中国博士学位论文全文数据库 前10条
1 戴祖旭;文本载体信息隐藏研究[D];华中科技大学;2007年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 M. Joseph Nguimbis;OFDM与信息熵技术在低压电力线载波通信中的应用研究[D];华中科技大学;2004年
5 张继国;降水时空分布的信息熵研究[D];河海大学;2004年
6 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
7 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
10 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
2 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
3 马艳;电力设计行业顾客满意度测评研究[D];清华大学;2005年
4 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
5 柳咏梅;泰安抽水蓄能电站项目经济效益评价研究[D];华北电力大学(河北);2008年
6 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
7 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
8 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
9 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
10 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 李海霞 王阶;基于信息熵的血瘀证症状规范化研究[N];中国中医药报;2006年
4 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
5 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
6 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
7 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
8 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
9 ;“熵”在中医方证研究中的运用[N];中国中医药报;2004年
10 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978