首页 理论教育 基于泛在知识环境的图书馆知识发现技术及应用研究成果

基于泛在知识环境的图书馆知识发现技术及应用研究成果

时间:2023-08-08 理论教育 版权反馈
【摘要】:以2006年为例,如表3-6所示,进行拟合优度检验多元回归方程,调整R方为0.997,模型整体拟合较好。经过逐步回归,使得最后保留在模型中的解释变量既是重要的,又没有严重多重共线性。表3-8多重共线性检验本章在进行逐步回归法分析之后,有四个模型,如表3-9所示。综合拟合优度、显著性水平,选择模型2,剔除变量师生人数。表3-9逐步回归法后的分配模型比较(续表)非标准化回归方程为Y=0.004+0.558X1+0.411X2。图书馆采访人员也可以根据该模型作参照调整。

基于泛在知识环境的图书馆知识发现技术及应用研究成果

根据对采访决策的相关因子之间关系的分析,T年的采访数据与T—1年出版数据、在校师生人数、T—1年借阅数据相关。以T年采访数据作为变量,T—1年出版数据、在校师生人数、T—1年借阅数据作为自变量,将以上数据强制进入回归,设定方程为Yt=at+btX1(t—1)+ctX2(t—1)+dtX3(t—1),其中Yt为T年的采访数据,X1(t—1)为T—1年借阅数据,X2(t—1)为T—1年出版数据,X3(t—1)为T—1年师生人数,at,bt,ct,dt是参数。以2006年为例,如表3-6所示,进行拟合优度检验多元回归方程,调整R方(Adjusted R Square)为0.997,模型整体拟合较好。

表3-6 多元回归的拟合优度检验

a.预测变量:(常量),借阅2005,出版2005,师生人数。

根据表3-7的方差分析,我们判定多元回归方程式线性关系明显,各回归系数不同时为零。因为表3-7显示的Sig(显著性)值小于显著性水平0.05,拒绝回归方程显著性检验的零假设。

表3-7 方差分析

a.预测变量:(常量),借阅2005,出版2005,师生人数。

2005年借阅数据和在校师生人数的方差膨胀因子(VIF)均大于10,如表3-8所示,说明自变量之间存在严重的多重共线性问题,需要筛选变量,去除多重共线性。可利用逐步回归筛选并剔除引起多重共线性的变量,具体步骤如下:先用被解释变量对每一个所考虑的解释变量作简单回归,然后以对被解释变量贡献最大的解释变量所对应的回归方程为基础,再逐步引入其余解释变量。经过逐步回归,使得最后保留在模型中的解释变量既是重要的,又没有严重多重共线性。

表3-8 多重共线性检验

本章在进行逐步回归法分析之后,有四个模型,如表3-9所示。综合拟合优度、显著性水平,选择模型2,剔除变量师生人数。因为师生人数跟2005年借阅数据存在共线性,只取一即可。

表3-9 逐步回归法后的分配模型比较

(www.xing528.com)

(续表)

非标准化回归方程为Y=0.004+0.558X1+0.411X2

标准化回归方程为Y=0.562X1+0.515X2

2007~2012年的数据用同样的方法进入回归,得出历年采购数据与借阅数据、出版数据之间的非标准化和标准化的回归方程。加权平均得出历年综合的非标准化回归方程和标准化回归方程,分别为

Yt=0.011+0.691X1(t—1)+0.261X2(t—1)

Yt=0.723X1(t—1)+0.34X2(t—1)

预测2011年的中文理科图书的各学科经费比例时,直接将X1用2010年各学科归一化借阅数据,X2用2010年各学科归一化出版数据代入上面方程,可以得出经费预测模型方程式为

其中,Yt为T年的采访数据,X1(t—1)为T—1年借阅数据,X2(t—1)为T-1年出版数据,at、bt、ct是参数。n为年份跨度,可以根据实际情况选择3年或5年。

据此方程,可预测出2011年的比例,与实际值比对结果如表3-10所示,可以看出N自然科学总论、Q生物科学、T工业技术等学科预测值与实际值的误差较小,还有一些学科存在一定的误差。相信通过今后持续不断的历年数据收集,加入更多相关因素的判别,这个模型会越来越精确。图书馆采访人员也可以根据该模型作参照调整。

表3-10 2011年预测比例与实际比例

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈