首页 理论教育 质量评价方法之成对比较法

质量评价方法之成对比较法

时间:2023-06-21 理论教育 版权反馈
【摘要】:质量评价最常用的方法是比较法,按照评价结果进行排序、等级排列、多维标注、大量数据分析和其他的一些不太常用的适合不同目的方法进行比较。成对比较法在成对比较的方法中,一般一次选取两个图像互相比较。基于后者的事实情况,成对比较法数据的划分等级是基于人眼评价预测,同时也适应于参考图像不可靠的情况。在成对比较法中,有这样一种可能,75%的观察者会选择另外的一种评价样品,其中50%的观察者能够选择同一个样品即可。

质量评价方法之成对比较法

质量评价最常用的方法是比较法,按照评价结果进行排序、等级排列、多维标注、大量数据分析和其他的一些不太常用的适合不同目的方法进行比较。三种方法中第一种方法用于一维标注和单个属性质量评价,后面的两种方法用到涉及空间属性描述的质量评价中。为了得到更清晰的图像评价图或者绘制空间属性图,可以将前面的两种方法结合使用。

两种方法相比较,排序和划分等级分别有不同的功能,排序是一种比较迅速和简单的方法,但是往往不能描述出图像中存在的巨大的不同点。一般情况下,仅仅是为了寻找到交替变化规律,应用排序的方法足够。另外一方面,两种方法相比较,根据测试提供的大量数据可以建立相关的关系模型。

(1)成对比较法

在成对比较的方法中,一般一次选取两个图像互相比较。这种比较评价的方法通常是要选择一个特定的任务,例如要求观察者在提供两张代表性的图片中选择质量更好的或者更模糊的等。一般情况下,每两张图片一次选择一张,每个评价员或者多个评价员就可以根据所要分析的图片质量决定选择的图片样品。有时候评价员需要给出评价图片与给定的标准图片的不同点,这些数据可以用于多维评价[10.6.3(4)中讲述]。这种成对比较的方法跟其他评价方法相比具备很多优势,对于细节的地方比较敏感,尤其是一些一维参数评价中,在传统的心理物理学研究中长期应用。基于后者的事实情况,成对比较法数据的划分等级是基于人眼评价预测,同时也适应于参考图像不可靠的情况。

成对比较法试验的一个优点是可以形成一个清楚可见的测试单元,即刚好视觉可见,能让观察者识别的最小百分比,同时让图像质量评价专业人士容易理解。基于选择不同图像样品对视觉可见的差异进行计算。一般情况下视觉可见范围的确定是依靠50%的观察者来发现的。在成对比较法中,有这样一种可能,75%的观察者会选择另外的一种评价样品,其中50%的观察者能够选择同一个样品即可。将成对的概率通过如下流程转化成测量值,下面的每一条是独立成立的:

①在每一对中每一个样品被选择的概率转换为Z值。

Z值可以通过计算得到。

③在选择样品尺度偏差范围内对Z值进行平均,将此数据乘以0.67449转换为视觉刚好可见。

④样品的选择是随机的,将最差的样品值定义了0,例如可以通过归一化处理的方法将所有样品的值都进行减少处理。

这种评价方法的工作主要牵涉到:成对比较针对所有可能的成对样品,其中样品选择数量为nn-1)/2,其中n代表所有样品的数量。另外还有一种少数人提出的观点:限制动态的范围。根据这种观点,选择适合的样品的可能性要低于100%,因此按照此思路,样品选择的数量不能太大。

还有一种基于将样品分成三组的三组合的评价方法[7],对于三组合进行排序。即对于三个样品进行三组合方法的评价,用这种方法工作量明显增大。

(2)排序

对于样品没有比率或者间隔大小信息的要求的话,观察者就可以简单的对样品进行排序。这种排序可以基于某一个属性优先进行。跟比较法评价图像相比,这样就可以更快估计很多被评价图像的属性。此时不需要参考,因为所有的被评价的图像都是互相比较。但是这种排序的评价方法往往不如比较评价法精度高,并且这种评价方法要求更高(在对某一属性的评价时需要更多的样品进行比较)。

为了比较样品的优点,平局秩常被作为样品的刻度值,但是必须还要注意,因为很难知道在这些排序样品中他们之间的真正的区别。

(3)缩放类型及图像评价定量表(www.xing528.com)

分类排序在图像质量评价中经常用到,究其原因是因为该方法看上去比较简单可行。质量评价中可以使用这样的形容词,如:非常好,好,一般,较差,很差来表达。可以用数字1~5来表达。通常,基于评级的方法来进行进一步的分析。

同理,分类排序也可以用数字1~10来表示。例如:可以用一条连续曲线的两端来定义质量的高低。后面的例子中,这种评价叫做图像评价定量表,除了全部的质量评价之外,所有的产品属性都可以通过分类评价方法来完成。

这些方法很容易实现和实验,这种方法效率高,能够自我管理适合于大量样品的质量评价。分类排序需要一定结构化的指令,因为没有任何的参考很难对一个图像评价结果为“好”还是“一般”。当使用图像评价定量表方法,评价者需要有一些说明,例如:主要的图像要提供一个参考用来表明数字1~10所代表的等级。这种结果会有一个比较大的影响范围,同时这种方法精度不太高会有一些微小的差异。

(4)多维排序

多维排序技术是基于评价者在多维感知空间上的距离对于评价物体相似和不相似描述得到的。图像评价者对图像的差异进行判断,得到差异性矩阵,将矩阵带入到MDS算法中运算。这种方法的结果可以在多维空间中完成,并且图像可以在与之相匹配的颜色空间中进行评价和描述。

这种方法存在的问题是:需要大量不同的程序来计算多维排序空间,用这种方法没有一个可以共享的标准,同样的,没有办法去检验这个结论是否是“正确”的[8]

(5)定性分析

每一种定量分析法可以通过定性分析方法[6]进行补充。定性分析方法可以得到一些相关的主观属性并且也会影响到视觉质量评价结果。传统的定量评价和定性质量的方法容易忽视一些主观经验对于评价结果的影响,因为经常这种评价方法是基于低端的视觉评价。对于印刷品的判断,印刷品质量的主观评价经验是非常重要的。例如,选择的纸张,会影响到印刷品的饱和度、沾脏、印刷品颜色的均匀性等。这类属性经常不能通过人眼视觉系统来预测。当然,尽管质量评价者根据他们个人的经验会有一些口头上的变化的评价结果,但是评价者可以一直保持一个一致的质量评价。

主观评价方法在质量评价中应用比较普遍,除了视觉外,例如在食品行业的感官评价、在音像行业和纺织行业也用到定性评价和描述分析的方法,例如品酒就如对于像杂志类高端印刷品的定性评价是一个道理。二者都需要对于内容高度敏感,正如食品是吃的、酒是喝的及杂志的风格等都是一些定性评价的例子。

在生产实际中,定性评价的方法都要求评价者给出评价背后的原因。评价者要说出为什么样品更好,或者这个样品可以在评价中得到5分。评价者可以根据经验直接自由的回答,但是出于其他情况的考虑,也必须按照前面介绍的方法进行相关实验测试质量属性。

定性分析方法的数据可以通过采访或者调查问卷的形式得到。对于评价者能直接根据经验回答所有的问题也是非常必要的。因此,他们的回答不受到预先定义的一些词汇的限制。例如:评价者不必在评价每个样品之后都需要记住原因,只要凭个人的经验和感受来表达就可以。

如图10-5所示表达了一个定性评价的典型的编码过程,这种分析理论[4]经常用到。定性分析的数据可以通过评价者描述样品的数据中收集得到。

图10-5 定性评价的流程图

在一些引证中质量评价者解释其评价质量的原因,将对样品的描述进行编码。在初始阶段,收集开放式编码、基本编码,但随着编码的进展,编码器认为他们是某一背景下的同一件事。这种情况经常基于主观的评价观点。一个跨编码器的可靠性应采用并行多个编码器编码检查,并行编码的可靠性可以通过正确的统计方法来进行检验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈