首页 理论教育 预测文本感知质量的方法

预测文本感知质量的方法

时间:2023-06-20 理论教育 版权反馈
【摘要】:10名观察员对西文和中文样本分别在正常观看条件下进行了感知质量测评,测评环境为光线充足的房间。对该式结果,工作小组首先认为,对文本主观感知关键属性的识别以及所建立的预测模型的简单性是非常令人鼓舞的。由此表明,不良的结构或文本缺陷对文本质量有着显著的不利影响。

预测文本感知质量的方法

如前文所述,目前尚没有相关标准定义文本的总体质量测度,ISO/TS 15311-2:2018标准也明确给出,目前的媒体系统中关于文字的易读性及清晰度质量属性没有明确定义。因此,诸如印品文字的清晰易读性等综合的视觉感知质量评价,以及其与质量属性测度间的相关性研究仍需开展工作。

这方面已有的研究工作尽管采用的质量测度有些已由新的标准完善,但其研究方法及结果仍具有一定的意义,对相关工作开展也具有一定的启发。

Ming-Kai Tse小组曾基于线条的质量属性测度预测了文本的感知质量。他们针对4pt英文字母和9pt中文繁体“竉”字使用不同输出技术的设备、不同纸张上输出制作了10个测评样本,通过主观质量测评,以及与线条属性测度相关性的探究,并建立了文字感知质量分值与线条笔画的边缘模糊度、对比度和宽度的线性相关关系。含有4pt英文字母和9pt中文文字的10个被测样本评图样,如图3-21所示。

10名观察员对西文和中文样本分别在正常观看条件下进行了感知质量测评,测评环境为光线充足的房间。质量排序和打分采用组合比对的方法,并在评测前给予文本质量分析的简要介绍和比对准则。打分之后,还要就每个图样分值的确定给出评述,以对观察员的主观评价过程有深入的了解。主观测评分值如表3-2和图3-22所示,评分标准为10分制,质量分值在0.78~8.17,其中,B3、B8和X9三个样本的分数明显低于其他样本。需要说明的是,表3-2中的测度值为当时基于ISO/IEC 13660标准定义的值。

图3-21 4pt英文字母和9pt中文文字的高分辨率影像(4680dpi)

表3-2 样本的主客评价与笔画的客观测度

有意思的结果是,尽管观测的样本与图3-21的放大图像在尺度上有很大差异,以及英文字母与该汉字笔画复杂度的较大差异,但所给出的感知质量排序是一样的。因此,工作团队认为这其中应该有一组关键的图像属性在我们的头脑中触发一致的感觉和质量判断。

通过分析测评评述发现,其依据主要分为三个类别:是否清晰、锐利和易读;是否对比强、暗度足够;是否有不连续、空洞和颗粒感。

为了表征文字笔画的图像质量属性,实验使用具有5.5μm/像素分辨力的图像分析系统,对与图样同时输出的12pt Arial字体(横、竖笔画同宽度)的“i”“l”和“t”字符中竖笔画进行了测量,即表3-2中第3列至第7列数据。

(www.xing528.com)

图3-22 主观评价与分级

经对测度数据进行分析,工作小组认为,虽然原则上表3-2中的5个质量测度都是独立变量,但发现模糊度和粗糙度之间,以及对比度和密度之间有很强的相关性,且发现主观质量分值与笔画的模糊度有很强的相关性。因此,选择了其中的笔画宽度、模糊度和对比度三个指标作为独立变量,来探究其与感知质量分值之间的关系。

使用最小二乘法进行了线性回归,建立了感知质量评分与上述单个质量测度的线性关系模型,在排除X9样本的情况下模型关系如下:

式中,C、W、B分别为笔画的对比度、宽度和边缘模糊度。

对该式结果,工作小组首先认为,对文本主观感知关键属性的识别以及所建立的预测模型的简单性是非常令人鼓舞的。通过模型揭示出:文本质量与笔画对比度和宽度正相关,而与模糊度负相关。显然与这些测度的含义及视觉感知规律相符合。

此外,也发现X9样本对该模型的不适用。通过观察,尽管X9样本对应的笔画三个测度值并不是最差的,即笔画性能还是合理的,但在打印形成的字符或文本有明显的笔画缺失,严重影响了对文本的认知,因而主观质量最差。由此表明,不良的结构或文本缺陷对文本质量有着显著的不利影响。

这里选择了12pt Arial字体字符的竖笔画测量,用来表征4pt英文字符和9pt汉字的客观质量,而不是4pt中的笔画宽度及9pt汉字中的笔画宽度。其中,12pt Arial字体 “i”“l”和“t”中竖笔画的宽度(相同)约为374μm,4pt英文字母“b”中竖笔画的宽度约为115μm,9pt宋体“竉”字中的横、竖笔画宽度分别约为76μm和152μm。质量属性测量的线条宽度(374μm)与视觉测评文字的笔画宽度大得多。

另外,ISO/IEC TS 24790:2012标准中线条边缘外边界节点的阈值定义与ISO/IEC 13660标准不同,模糊度的数据会相应减小,且也已摒弃了对比度C测度,但ISO/IEC 13660标准的C值与ISO/IEC TS 24790:2012标准的暗度具有内在的关联性。因此,若以ISO/IEC TS 24790:2012标准中的测度进行这一模型的构建,C值很可能由某种形式体现的线条暗度替代。

尽管如此,式(3-14)仍具有一定意义,其意义在于揭示了文字质量的视觉内涵:笔画清晰、锐利和高暗度、足对比,会提高对文本内容的认知;与此相反,诸如暗淡、失真、空洞、结构不良、边角侵蚀等缺陷会降低对其质量的优良感知。

基于ISO/IEC 13660标准测度,对印品文本质量影响的研究也有针对表3-2中5个测度开展,结果表明:由于线条会组成一个完整的文字,会出现靠近甚至搭接等现象,不同于这里线条宽度对文字质量的正向影响结果,而是在不同字号情况下,线宽的作用不同,在5pt以下小字号的情况下,会在某种输出情况对印品文字质量起着负面影响的作用。这也说明,感知质量的建模的确是一个复杂的系统工程,客观和定量地评估文本的质量仍然是一项挑战。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈