首页 理论教育 实验数据处理方法探究

实验数据处理方法探究

时间:2023-07-02 理论教育 版权反馈
【摘要】:数据处理的方法一般可分为列表法、图示法和数学模型法等三种方法。列表法是将实验数据以表格形式表示,以反映出各变量之间的对应关系。

实验数据处理方法探究

数据处理的方法一般可分为列表法、图示法和数学模型法等三种方法。

列表法是将实验数据以表格形式表示,以反映出各变量之间的对应关系。通常,这仅是数据处理过程前期的工作,是为随后的曲线标绘或函数关系拟合作准备。

图示法是将实验数据在坐标纸上绘成曲线,不仅可以直观而清晰地表达出各变量的相互关系,而且可以根据曲线的形状,分析判断变量的变化规律,从而帮助确定适当的函数形式来表示变量间的关系,必要时,还可以借助曲线进行图解积分和微分

数学模型法是采用适当的数学方法将实验数据按一定的函数形式整理成数学方程。这种方法的优点是结果简捷,而且便于使用计算机进行计算。

3.7.1 实验数据的列表表示法

实验数据表可分为原始数据记录表、中间运算表和最终处理结果表。

原始数据记录表须在实验开始之前设计好。例如,流体流动阻力实验原始数据记录表的格式如下:

在实验过程中每完成一组实验数据的测定,须及时将有关数据记录入表中,当实验完成时,就得到一张完整的原始数据表。切忌按操作岗位分开单独记录,实验结束后再汇总成表的记录方法,这种方法既费时又容易造成差错。

中间运算表是记录数据处理过程的中间结果。使用该表有助于计算方便,不易混乱,而且可清楚地表达中间计算步骤和结果,便于检查。仍以流体阻力实验为例,中间运算表格的形式为

实验最终结果表简明扼要,只用于表达主要变量之间的关系和实验结论。例如,流体流动阻力实验中摩擦系数和局部阻力系数与雷诺数之间的关系:

在制订表格和记录实验数据时要注意以下几点:

(1)在表格的表头中要列出变量名称和计量单位。计量单位不宜混在数字之中,以免分辨不清;

(2)记录数字要注意有效位数,要与测量仪表的精度相适应;

(3)数字较大或较小时要用科学计数法表示,其中表示数量级的阶数部分,即10±n,要记在表头中。

(4)表格的标题要简明,能恰当说明实验内容,数据书写要清楚整齐,不得潦草

3.7.2 实验数据的图示法

图示法是将离散的实验数据或计算结果标绘在坐标纸上,用“圆滑”的方法将各数据点用直线或曲线联结起来,从而直观地反映出因变量自变量之间的关系。根据图中曲线的形状,可以分析和判断变量间函数关系的极值点、转折点、变化率及其他特性,还可对不同条件下的实验结果进行直接比较。

应用图示法时经常遇到的问题是怎样选择适当的坐标纸和如何合理地确定坐标分度。

1.坐标纸的选择

化工研究过程中经常使用的坐标系统有直角坐标系、对数坐标系和半对数坐标系,市场上文化用品商店中有相应的坐标纸出售。

坐标纸的选择一般是根据变量数据的关系或预测的变量函数形式来确定,其原则是尽量使变量数据的函数关系接近直线。这样,可使数据处理工作相对容易。

(1)直线关系:变量间的函数关系形如y=a+bx,选用直角坐标纸。

(2)指数函数关系:形如y=abx,选用半对数坐标纸,因为lgy与x呈直线关系。

(3)幂函数关系:形如y=axb,选用对数坐标纸,因为lgy与lgx呈直线关系。

另外,若自变量和因变量两者均在较大的数量级范围内变化,亦可采用对数坐标纸;其中任何一变量的变化范围较另一变量的变化范围大若干数量级,则宜选用半对数坐标纸。

2.对数坐标的特点

对数坐标的特点是:某点的坐标示值是该点的变量数值,但纵、横坐标至原点的距离却是该点相应坐标变量数值的对数值。例如,当x=5时,y的观测值为8,则该实验点在对数坐标中的点坐标为(5,8)。但是,该点的横坐标至原点的距离为lg5=0.7,纵坐标至原点的距离为lg8=0.9。因此,在对数坐标中,直线的斜率k应为

而(x1,y1)和(x2,y2)为直线上任意两点的坐标值。

在对数坐标上,1、10、100、1000等之间的实际距离是相同的,因为上述各数相应的对数值分别为0、1、2、3等。

3.图示法中的曲线化直

在用图示法表示两变量之间的关系时,人们总希望根据实验数据曲线得出变量间的函数关系式。如果因变量y与自变量x之间呈直线关系:

y=ax+b

则根据图示直线的截距和斜率求得b和a,即可确定y与x之间的直线函数方程。

如果y与x间不是线性关系,则可将实验变量关系曲线与典型的函数曲线相对照,选择与实验曲线相似的典型曲线函数形式,应用曲线化直方法,将实验曲线处理成直线,从而确定其函数关系。

所谓曲线化直,即曲线的直线化,就是通过变量代换,将函数y=f(x)转化为线性函数Y=A+BX,其中X=φ(x,y),Y=(x,y)。而φ和为已知的曲线函数。先由实验数据xi、yi,按Yi(xi,yi)和Xi=φ(xi,yi),求得新变量值Xi和Yi,再将诸(Xi,Yi)标绘于直角坐标纸中,倘若Xi和Yi呈线性关系,即可确定出A和B,并求得y=f(x)。如果Yi=Y(Xi)偏离直线,则应重新选定Y=(x,y),X=φ′(x,y),直至Y—X为直线关系为止。某些常见函数的典型图形与直线化方法如表3-1所示。

表3-1 可化为直线的典型曲线类型

[例5] 测得y=f(x)的实验数据见下表:

试求y=f(x)的关系式。

解:将(xi,yi)在直角坐标纸上标绘并圆滑联结成曲线,如图3-2所示,该曲线接近幂函数关系。于是将(xi,yi)再标绘于对数坐标纸上,如图3-3所示,曲线上部接近一根直线,而下部却相当弯曲,可对函数形式做一修正。

图3-2 例5附图1

图3-3 例5附图2

设Y=y-C,在图3-2上取三点:(x1=5.0,y1=2.5),(x2=30.5,y2=30.0),(x3=12.35,y3=5.5)

由此可计算出C:

将Yi=yi-2.08对xi在对数坐标纸上作图得一直线:

lgY=lga+blgx

或 lg(yi-2.08)=lga+blgx

作图求得: b=2.325

即 y-2.08=ax2.325

再将x1=5.0,y1=2.5代入上式得:

a=0.0101

最终得到: y=0.0101x2.325+2.08

所得函数关系式与实验数据之间的误差检验情况如下:

[例6] 某次实验得如下数据,试求y=f(x1,x2)的关系式。

解:将表中数据标绘于直角坐标纸上得一组曲线,如图3-4(a)所示。

图3-4 例6附图

对照标准曲线,可令:

将(Xi,Yi)在直角坐标纸上重新标绘,得到一组直线,如图3-4(b)所示。

求出每一x2相对应的直线的a、b值列于上表中,可见a、b均不为常数,而是x2的函数分别将a、b对x2标绘于直角坐标中,如图3-4(c)所示。显然,b与x2呈直线关系,并求得:

b=1.2x2

由于a与x2呈曲线关系,再将a对x2在对数坐标纸上标绘,得一直线,如图3-4(d)所示。其关系式为

最终得到:

4.坐标的分度

坐标分度是指坐标轴单位长度所代表的物理量数值的大小,亦即坐标的比例尺

如果变量x,y的测量误差分别为△x和△y,则其真值分别为x±△x和y±△y。因此,当将x,y标绘于坐标纸上时,“实验点”应为边长分别为2Δx和2Δy的“矩形点”。坐标比例尺的选择与实验误差大小有密切关系,如果坐标比例选择不当,将使曲线图形不能逼真地反映实验变量间的关系。

例如,对于如下一组实验数据:

当x、y的测量误差分别为0.05、0.2时,实验结果图形如图3-5(a)(b)所示;当Δx和△y分别为0.05、0.04时,实验结果图形如图3-5(c)(d)所示。(www.xing528.com)

图3-5 实验误差和坐标比例尺对图形的影响

由图3-5可知,由于坐标比例尺和实验误差不同,对于同一组实验数据,实验结果的图形有明显不同。当通过实验点进行“曲线圆滑”时,就有可能得出不同的结论。如从图3-5(a)和图(b)中就可能认为变量y与x呈线性关系;而从图3-5(c)和(d)中又可能得出y与x是非线性关系且y有最大值的结论。

从数学上讲,变量间的函数关系仅取决于自变量和因变量的数值,而与坐标的比例大小没有任何关系。在数据处理过程中之所以出现上述困惑,是由于坐标比例尺选择不当,使实验点图形要么太扁,要么太长,这些矩形点都不能作为光滑曲线的“点”。为了得到理想的图形,比例尺的大小应恰使实验数据的矩形“点”近似于正方形,并且

2Δx=2Δy=2mm

根据这一原则,坐标的比例尺M应为

其中Δx、Δy的单位为物理量单位。因此,M的物理意义即为用M(mm)的长度来表示一个物理量单位。图3-6表示出在恰当的坐标比例尺下的实验点和圆滑曲线图形。

图3-6 正确坐标比例尺下的图形

[例7] 在离心泵特性曲线的测定实验中,根据伯努利方程,可得到离心泵的扬程He的关系式:

H=p×102

H=p×10/735.7

式中 He——离心泵扬程,m液柱;

h0——真空表与压力表两测压孔之间的垂直距离,m;

p——压强表读数(表压),MPa;

p——真空表读数,mmHg;

qV——流量,L/s;

f——涡轮流量计频率显示仪表读数,s﹣1

ε——涡轮流量计仪表读数,L﹣1

di,do——离心泵的进、出口管径,mm。

压强表的量程为0~0.4MPa,最小分度为10kPa,精度为1.5级。真空表的量程为0 760mmHg,最小分度为20mmHg,精度为1.5级。涡轮流量计的量程为1.6~10m3/h,精度为0.5级,二次仪表采用频率显示仪,最小读数单位为1,仪表常数均为267.2,精度为0.5级。试计算扬程He与流量qV关系图形的坐标比例尺。

解:欲求He与qV的坐标比例尺,要先计算其误差。

(1)流量的误差及坐标比例尺

流量仪表的示值误差:

流量系统仪表的静态测量误差为

流量的测量误差取上述两值中较大的数值,因此,流量坐标(横坐标)的比例尺为

为了实际标绘应用方便,选取Mx为40mm/(L/s)或50mm/(L/s)

(2)扬程误差及坐标比例尺

根据函数误差的计算公式,得

ΔHe=ΔH+△H+2KqvΔqv

由于流量的测量误差很小,可忽略不计。

压强表的误差

真空表的误差

因此,扬程的误差为

扬程坐标(纵坐标)的比例尺为

实验可选取My为1mm/mH2O或2mm/mH2O。

5.曲线的标绘

标绘实验曲线需要有足够的实验数据点,绘制的曲线一般应该光滑圆润,如果存在转折点,在转折点附近要有较多的实验点。由于实验数据存在误差,标绘的曲线不一定通过每一个实验点,但实验点必须均匀地分布于曲线两侧。

为了得到较满意的曲线,在标绘时应先用肉眼观察,初步确定曲线的趋向,并用铅笔轻微勾绘粗略的曲线,最后经适当修正后,用曲线板画出最后形状的光滑曲线。

3.7.3 数学模型法

数学模型法又称为公式法或函数法,即用一个或一组函数方程式来描述过程变量之间的关系。就数学模型而言,可以是纯经验的,也可以是半经验的或理论的。选择的模型方程好与差取决于研究者的理论知识基础与经验。无论是经验模型抑或理论模型,都会包含有一个或几个待定系数,即模型参数。采用适当的数学方法,对模型函数方程中的参数估值并确定所估参数的可靠程度,是数据处理中的重要内容。

1.数学模型的形式

1)经验模型

在化工研究过程中广泛使用着大量的经验模型,这些经验模型都是通过对实验数据的统计拟合而得。以下是几种常用的方程形式。

(1)多项式

其通式为

若自变量数在2个以上,可采用下述形式:

对于流体的物性,例如比热容、密度、汽化热等与温度的关系,常采用多项式关联。

(2)幂函数

其一般形式为

在动量、热量、质量传递过程中的量纲一准数之间的关系,多以幂函数形式表示。

(3)指数函数

其一般形式为

化学反应、吸附、离子交换及其他非稳态过程中,常以此种函数形式关联变量间的关系。

2)理论模型

理论模型又称机理模型,是根据化工过程的基本物理原理推演而得的。过程变量间的关系可用物料衡算、能量衡算、过程速率和相平衡关系等四大法则来进行描述。过程中所有不确定因素的影响可归并于模型参数中,通过必要的实验和有限的数据对模型参数加以确定。

2.模型参数的估值方法

关于模型参数的估值方法可有以下几种:通过观测数据作曲线(方程),称为曲线拟合;用观测数据计算已知模型函数中的参数,称作模型参数估计;由观测数据给出模型方程参数的最小二乘估计值并进行统计检验,称为回归分析。这里对模型参数估值的具体方法不进行详细讨论,论述这方面的专著已有很多,仅对参数的估值方法选择的原则做简要介绍。

(1)模型参数估值的目标函数

模型参数估值的目标函数一般根据最小二乘法原理构造。若过程变量之间的函数关系以下式表示:

式中 x——自变量;

b——模型参数。

通常总是期望模型计算值与实验值之间的偏差最小。

则目标函数为

这样,在给定实验数据xi,yi后,F就成为与有关的函数了。剩下的问题是采用有效的数学方法求得“最优”的,使F最小。

(2)模型参数的估值方法

模型参数的估值在数学上是一个优化问题,根据模型方程的形式可以分为代数方程或微分方程参数估值;根据参数的多少可以分为单参数或多参数估值。对于线性代数方程,可用线性回归(拟合)方法求取模型参数;对于非线性代数方程,常用的方法有高斯-牛顿法(GaussNewton)、马尔夸特法(Marguardt)、单纯形法(Simplex)等。对于微分方程,可采用解析法、数值积分法或数值微分法求解。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈