首页 理论教育 不可见的文字:文本信息隐匿技术分类

不可见的文字:文本信息隐匿技术分类

时间:2023-06-20 理论教育 版权反馈
【摘要】:信息隐匿的基本原则是不可感知性,即信息隐匿的效果不能为人类感官所感知。同样,文本信息隐匿利用的是文本所固有的特点。根据所利用对象的不同,文本信息隐匿可分为语义隐匿、格式特征隐匿、显示特性隐匿。

不可见的文字:文本信息隐匿技术分类

1.文本文档的分类

文本文档,就是文字信息的数字化,表示所形成的电子文件。文字以电子文档的形式保存并传播,是计算机和通信技术发展的结果。由于电子文档具有易于编辑、保存以及传输快等特点,同时可以和传统印刷方式进行相互转换(如打印、扫描、识别等),因而得到了广泛的应用。

对文字信息的数字化过程中,由于来源不同,对文档内容的描述方式不同,文本文档的表现形式也不相同。概括来说,文本文档分为两大类,一种是以ASCⅡ码表示内容并包含格式的文档格式文件,另一种是以像素点阵的方式描述内容的文档图像表示文件。

文档格式文件的类型很多,文件格式也多种多样,如Word文档(*.doc)、Web页(*.htm、*.htm1)、RTF格式(*.rtf)、纯文本(*.txt)等。这是因为针对不同的应用范围、不同的表述对象,具有不同的描述。如利用网页传递信息,既要具有丰富的多媒体内容和效果,又要传递较少的数据,因而产生了超文本链接标记语言,用于文字和数据的链接以及文件间的超级链接,也就形成了超文本文件(.htm1)。

在文档图像表示文件中,由于像素已经包含了文档内容和其他所有特性,所以通常不含有文档格式描述。

2.文本文档信息隐匿的特点

文本信息隐匿,就是以一定的方式对文本内容及格式等进行修改,嵌入需传输的通信信息但不易被察觉。(www.xing528.com)

文本文档是一种与文字处理工具有关的文字表述文件,它包含内容信息和版面信息。与数字图像、话音等多媒体文件相比,文本文档最显著的特点是数据与内容的高度一致性。通常的信息隐匿可以利用感觉冗余,根据要嵌入的信息对多媒体数据进行合理修改[如最低有效位(LSB)隐匿算法比特位替换、数字水印的系数修改等],对掩护信息(载体)的修改效果无法被人的感觉器官所感知。而当这种方法用于文本信息隐匿时,由于文本具有数据与内容的一致性,对数据的修改将直接体现在所表征的内容上,并产生视觉异常。如字符B的ASCⅡ码的Ox42,当采用LSB算法,将最低比特位“0”变为“1”时,ASCⅡ码为Ox43,其表征的字符为C,即显示的内容发生了变化。此外,由于语言的特点,同样的内容还存在多样化的表述方式。

信息隐匿的基本原则是不可感知性,即信息隐匿的效果不能为人类感官所感知。根据文本特点,在信息隐匿中必须满足两个条件:①信息的嵌入,不影响文本文档的可读性;②嵌入信息后,不在内容表征上产生可被视觉感知的异常。

3.文本信息隐匿的原理及分类

信息隐匿技术是以掩护信息(载体)特性为基础的,即利用的是载体本身具有的、可为信息隐匿利用的资源。如许多数字图像、话音等信息隐匿的原理是基于数据描述中量化误差的存在。同样,文本信息隐匿利用的是文本所固有的特点。

文本文档是由内容和格式构成的,而内容包含字(词)、语句、行、段落等元素。根据所利用对象的不同,文本信息隐匿可分为语义隐匿、格式特征隐匿、显示特性隐匿。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈