首页 理论教育 数据质量评估的方法介绍

数据质量评估的方法介绍

时间:2023-06-23 理论教育 版权反馈
【摘要】:数据质量评价方法主要分为定性方法、定量方法和综合方法。层次分析法、模糊综合评价法、云模型评估法和缺陷扣分法是综合评估中经常使用的方法。3)云模型评估法在现实世界中,许多事物的概念是不确定的,具有模糊性和随机性。4)缺陷扣分法缺陷扣分法[79]指计算单位产品的得分值,由单位产品的得分值来评价产品质量的方法。目前对缺陷严重程度的认定主要有严重缺陷、重缺陷和轻缺陷3种。

数据质量评估的方法介绍

数据质量评价方法主要分为定性方法、定量方法和综合方法。定性方法主要依靠评判者的主观判断。定量方法则为人们提供了一个系统、客观的数量分析方法,结果较为直观、具体。综合方法则将定性方法和定量方法结合起来,发挥两者的优势。

定性评价方法一般基于一定的评价准则与要求,根据评价的目的和用户对象的需求,从定性的角度来对数据资源进行描述与评价。确定相关评价准则或指标体系,建立评价准则及各赋值标准,通过对评价对象大致评定,给出各评价结果,评价结果有等级制、百分制或其他表示[74]。定性方法的实施主体需要对学科背景有较深的了解,评价标准和评价内容应由某领域专家或专业人员完成。通常,定性评估可划分为:用户反馈法、专家评议法和第三方评测法。

定量评价方法是指按照数量分析方法,从客观量化角度对基础科学数据资源进行的优选与评价。定量方法为人们提供了一个系统、客观的数量分析方法,结果更加直观、具体。目前,传统的纸质印刷品,如:报纸、图书、期刊、标准和专利等内容都已经实现数字化并存放在各种数据库中供用户检索、浏览和下载。为了评价各数据库中文献的数据质量,可以制定用户注册人数、文献下载量、文献在线访问量以及引用率等评价指标来评价各个数据库收录文献质量的优劣。

综合方法将定性和定量两种方法有机地集合起来,从两个角度对数据资源质量进行评价。层次分析法(analytic hierarchy process,AHP)、模糊综合评价法(fuzzy comprehensive evaluation)、云模型评估法和缺陷扣分法是综合评估中经常使用的方法。

1)层次分析法

AHP是由美国运筹学家托马斯·塞蒂(T.L.Saaty)在20世纪70年代中期正式提出,是一种定性和定量相结合的、系统化、层次化的分析方法[75]。由于它在处理复杂的决策问题上的实用性和有效性,很快在世界范围得到重视。它的应用已遍及经济计划和管理、能源政策和分配、行为科学军事指挥、运输、农业教育、人才、医疗环境等领域。

该方法的核心是对评价对象进行优劣排序、评价和选择,从而为评价主体提供定量形式的评价依据。AHP法首先将复杂的问题分解成若干层次,建立阶梯层次结构,然后构成判断矩阵,进行层次单排序一致性检验,最后进行层次总排序和一致性检验,得出结论。

2)模糊综合评价法

自然科学社会科学研究中,存在着许多定义不是很严格或者说具有模糊性的概念。例如,环境质量的污染等级可以描述为“轻污染,中污染,重污染”,某一生态条件对某种作物的存活或适应性的影响可以评价为“有利,比较有利,不那么有利,不利”等,这些通常都是模糊的概念。为处理这些“模糊”概念的数据,模糊集合论应运而生[76]

模糊综合评价是在考虑多种因素的影响下,运用模糊数学工具对某事物做出的综合评价。这种方法的基本思想是:在确定评价因素、因子的评价等级标准和权值的基础上,运用模糊集合变换原理,以隶属度描述各因素及因子的模糊界线,构造模糊评价矩阵,通过多层的复合运算,最终确定评价对象所属等级[77]。采用模糊综合评价法的关键在于建立评价模型,评价模型由因素集、评价集、隶属度矩阵和权重集组成,之后进行复合运算就可以得到综合评价结果。(www.xing528.com)

3)云模型评估法

在现实世界中,许多事物的概念是不确定的,具有模糊性和随机性。模糊综合评价法主要适用于评估存在模糊性的质量问题,而对于一个模糊性和随机性共存的问题,更适合采用“云模型”理论。云模型是李德毅院士于1995年所提出的,旨在实现定性概念与定量数值之间的不确定性转换模型。云模型将概率论和模糊集合理论结合起来,通过特定构造的算法,形成定性概念与其定量表示之间的转换模型,并揭示随机性和模糊性的内在关联性[78]

4)缺陷扣分法

缺陷扣分法[79]指计算单位产品(数据或信息)的得分值,由单位产品的得分值来评价产品质量的方法。以地图产品为例,将单位产品的满分设为100分,先对地图产品中的缺陷进行判定,并对各缺陷按其严重程度进行扣分,再将各缺陷扣分值累加,最后用100减去累加的扣分值作为该产品的得分值,再由得分值判定产品质量。

目前对缺陷严重程度的认定主要有严重缺陷、重缺陷和轻缺陷3种。

(1)严重缺陷指单位产品的极重要质量元素不符合规定,以致不经返修或处理不能提供用户使用。

(2)重缺陷指单位产品的重要质量元素不符合规定,或者单位产品的质量元素严重不符合规定,对用户使用有重大影响。

(3)轻缺陷指单位产品的一般质量元素不符合规定,或者单位产品的质量元素不符合规定,对用户使用有轻微影响。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈