首页 理论教育 整体趋势分析与聚合结果对比

整体趋势分析与聚合结果对比

时间:2023-07-08 理论教育 版权反馈
【摘要】:对每个聚合中的文献按照历史顺序进行分析,可以得到关于整个XML领域发展过程中的总体趋势。这种趋势表明,在XML的学科发展过程中,仍然存在许多问题,这些问题利用现有的技术似乎很难实现巨大的突破,仍旧需要在XML的基础理论方面进行不懈的研究。第三个明显的趋势是某些应用领域逐渐消失,而新的应用领域开始兴起,在关于XML跨学科领域的研究发展过程中这种趋势表现得较为明显。

整体趋势分析与聚合结果对比

(1)趋势分析

赵党志[26]等学者曾经利用作者共被引的方法对XML领域的发展结构进行过研究,他们研究的基本思路是,利用作者共被引和因子分析相结合,分两个时间段(2001年之前、2001年到2006年)对XML研究内容进行结构分析,并通过对比发现了XML的发展趋势。但是这种分析方法可能存在的问题是,时间的切片并没有什么较硬的依据,比如为什么是以2001年作为分界,这种划分大多数情况下是随意的,产生的主要问题是数据量纲不统一。而通过相对性聚合的方法,从引文网络整体的角度出发,就不存在这方面的问题。

对每个聚合中的文献按照历史顺序进行分析,可以得到关于整个XML领域发展过程中的总体趋势。

第一个趋势是,许多聚合中的文献最初主要是从XML领域的一些基础性问题出发,例如利用XML可以解决什么问题之类等;在其后的研究中,就从这种粗略的探讨转到具体利用XML解决现实中的问题上;经过一段时间的研究以后,这些研究又会转到XML的理论研究上来。这种趋势表明,在XML的学科发展过程中,仍然存在许多问题,这些问题利用现有的技术似乎很难实现巨大的突破,仍旧需要在XML的基础理论方面进行不懈的研究。然而,正如我们前文提到的,由于理论方面的研究似乎并没有太大的起色,所以导致2007年之后的XML研究逐步走向了低谷。

第二个整体趋势是,随着时间的发展,语义网技术被越来越广泛地与XML相结合,语义网技术构成了一个边界比较模糊,但是应用面非常广泛的研究内容,在XML编码的语言标注、结构化-半结构化文档检索、XML和关系数据库中的信息检索研究中,语义网技术被屡屡提及,研究的内容结合程度越来越高,也越来越深化,但有趣的是虽然目前XML是语义网七层模型语法层的主要构成,但在分析结果中并没有表现为一个独立的聚合,而是作为泛性的趋势表现出来。

第三个明显的趋势是某些应用领域逐渐消失,而新的应用领域开始兴起,在关于XML跨学科领域的研究发展过程中这种趋势表现得较为明显。从2003年开始,利用XML进行热力物理学性质或研究数据的存储、表达的研究一直持续到现在,这种持续性的发展还体现在基于XML语言的植物分类学的数据应用上。利用XML进行生物医学医疗信息存储和交互的研究在2007年之后就比较少见,事实上,在这两个领域中,与XML相关的技术已经被确定为行业信息交互标准,发展已经相对成熟,XML的相关技术已经能够满足行业应用,因此关于研究的内容就逐渐消失了。此外,在XML编码研究领域中,关于语言标注、仿真数据编码和MPEG格式的多媒体数据描述在2006年之后就基本消失,而关于逻辑程序设计的研究在2005年之后逐渐兴起。

(2)规模对于聚合结果的影响

上文提供了从文献重要性和引用关系重要性两种不同的角度进行相对值聚合的分析和结果,作为一个方面的两项内容,有必要进一步对两种分析方法本身进行对比和深入探讨。假设最终获得的文献聚合和引用关系聚合的规模都是[k,K],正如前文所提到的,如果k的值过小,那么得到的每个聚合内所包含的文献数量就会太少,进而无法满足用户的检索要求;反之,如果K的值过大,那么其中包含的文献数量就过多,聚合中许多主题相关性程度较弱的内容也会被包含进研究结果中,这样同样会增加用户选择所需信息的成本。因此,我们将最终获取聚合的规模5~50作为一个基本的范围,不断调整其中k和K的值,分析获得不同结果(见表5-15)。(www.xing528.com)

当聚合规模的下限k的值固定为50时,以5为一档,不断提升聚合规模上限K的值得到的结果如表5-15所示。举例来说,第一行可以解读为:当k=5,K=10时,从文献的重要性角度进行相对值聚合共可以得到14个聚合,其中包含了108篇文献;从引用关系的重要性角度出发共可以得到35个聚合,其中包含了258篇文献,两个结果交叉的文献共有93篇,交叉的主题为14个。相对于从文献重要性角度进行的相对值聚合而言,其结果中所有的主题和86%左右的文献都被基于引用关系重要性的相对值聚合所包括,而当K的值不断增加时,被涵盖的文献占比还在不断提升。这充分说明,从引用关系重要性进行的相对值聚合结果比从文献重要性角度进行的相对值聚合结果更加全面。

表5-15 当k=5时K变化的聚合结果

表5-16是当最终获得的聚合规模上限固定为50,不断调整聚合规模下限k时的分析结果。例如,其第一行可以解释为当聚合规模上限确定为50,聚合规模下限k等于2时,利用引用关系重要性进行的相对值聚合共可以获得389个聚合,其中包含1 139篇文献;利用文献重要性进行的相对值聚合则可以获得138个聚合,其中包含431篇文献,文献的重合情况和主题的重合情况如表所示。

表5-16 当K=50时k变化的聚合结果

对两个表进行总体上的观察表明,文献聚合的规模对最终结果的影响十分巨大,其中,聚合规模下限的影响力对结果的影响尤其明显,而聚合规模上限对结果的影响相对有限。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈