首页 理论教育 深度学习框架中的多目标特征提取和知识表达技术

深度学习框架中的多目标特征提取和知识表达技术

时间:2023-06-19 理论教育 版权反馈
【摘要】:本项目做战场知识表达的目的是对战场空间中所有的防御条例进行一致性表达,避免防御逻辑表述多样化的情况出现,从而为之后基于深度学习数据特征提取的实现构建统一的逻辑框架。由于深度学习需要好的数据特征才能真正发挥作用,因此,数据特征提取是运用深度学习方法分析战场态势首先要解决的问题。

深度学习框架中的多目标特征提取和知识表达技术

1.战场指标因素的知识表达技术

对于战场作战环境来说,战场信息量大,不同平台间信息数据异构性严重,再加上现代化战场的快速发展,知识范围扩充比较迅速,选取能够良好满足以上特点的知识表示方法非常重要。对于知识表示方法的选取应考虑四方面:其一为对战场异构数据的表达能力,考察能否兼容异构数据,是否具有一致性表达方式,便于之后数据的共享;其二为对大量数据和知识逻辑的处理能力,考察在大数量级数据情况下,所选取的知识表示方法是否能够保证数据的清晰性和计算的快速性;其三为知识表示方法的逻辑性,考察知识描述方式是否能够满足复杂战场环境下作战逻辑的表达,并且使构建的逻辑清晰易懂;其四为知识框架的可扩充性,考虑当有新知识被发掘时,在原有知识结构不发生较大变动的情况下,生成新知识规则的简洁性。

1)指标因素分析

因此,本系统选定本体作为战场趋势预测知识表示方法,本体知识表示法不仅能够满足战场预测领域对于知识表示的需求,而且可以为之后实现数据的共享提供解决方法。利用本体知识表达技术对战场威胁指标网络进行描述与处理需要考虑以下情况:

(1)战场环境影响因素的分析。为了完成精准的战场目标及行为表述,需要对能够描述战场特征的战场环境影响因素进行分析,战场环境影响因素是作战环境中重要数据类型的集合。

(2)战场环境影响因素间关系分析。实现战场环境影响因素的定义与提取后,研究战场环境影响因素之间的相互关系对于分析敌方作战规则具有重大意义。对战场环境影响因素间相互因果关系的分析,便于战场逻辑的清晰化。

2)本体的构建方法

近年来对于本体的研究逐渐扩展到各个领域,对于本体的构建也形成了诸多比较有影响力的方法,如骨架法、七步法、TOVE 法等。本项目结合态势领域的特点,确定采用战场态势领域本体的构建方法。

(1)确定领域及领域内概念。通过对战场态势领域内战场环境影响因素的分析,进行领域内概念的确定。

(2)对概念属性进行确定。查阅领域相关资料,对态势概念的组成属性进行分析和确定,包括固有属性和行为属性。

(3)对概念和属性间的关系进行确定。结合领域专家的建议和战场相关作战经验,完成概念之间交互关系、概念与属性间从属关系、属性与属性间传递关系和因果关系的确定。

(4)本体的语义模型生成。根据前三步,利用本体语言对态势领域进行描述,构造符合作战逻辑的战场本体模型。

(5)本体语义逻辑的检验。检查构建完成的态势本体,判断概念的明确性和关系的逻辑性。

(6)本体完整性测试。对完成的本体模型利用专家经验进行完整性检测,对缺陷部分进行补充和改进。

(7)本体优化。在使用过程中不断改进优化,使模型的描述性逐步增强。

综上所述,态势领域本体模型构建流程如图4-15所示。

图4-15 态势领域本体模型构建流程

本项目将得到大量信息,并提取战场环境影响因素,对这些要素之间的关系进行表述和应用,依靠数字化模式进行表达。结合态势领域中的实际需求,选定本体作为本项目的主要知识表示方式,并定义包括静态要素、动态要素、行为要素、历史要素以及推理要素在内的战场态势要素;最后依据态势要素,结合战场规则,给出了本体知识库的构建逻辑,并以模拟战场模型为例进行了作战逻辑分析,完成战场作战规则的表述。本项目做战场知识表达的目的是对战场空间中所有的防御条例进行一致性表达,避免防御逻辑表述多样化的情况出现,从而为之后基于深度学习数据特征提取的实现构建统一的逻辑框架。(www.xing528.com)

2.面向数据特征提取的深度学习模型设计

数据特征是深度学习分析处理的原材料,深度学习算法的效能直接受输入数据特征的质量影响,有效提取战场仿真数据的特征成为运用深度学习方法分析战场态势面临的首要问题。因战场仿真数据具有体量巨大、种类繁多、格式各异、结构复杂、维度极高、时刻变化等特点,传统特征提取方法难以发挥理想效果。近年来飞速发展的深度学习方法提供了新的思路,该方法在无监督的情况下,通过多层神经网络的层层学习,在保持信息不丢失的情况下可以自主抽取隐含在战场态势信息中的显著特征,并在新的特征空间实现对大数据的紧致表达,从而可以达到数据特征提取的目的,在面对战争偶然性、不确定性、时变性等复杂问题方面具有巨大的优势和潜力。随着现代战争的不断发展,防御样式将呈现出快速化、多样性、复杂化等特点,依靠人工智能的方法来分析战争、理解战争、预测战争已成为大势所趋,必将对未来战争的胜负发挥重要影响。由于深度学习需要好的数据特征才能真正发挥作用,因此,数据特征提取是运用深度学习方法分析战场态势首先要解决的问题。基于栈式稀疏降噪自编码网络的特征提取是一种强大的非线性特征提取方法,它的表达能力、泛化能力、对噪声和冗余信息的鲁棒性更强,具有更好的自主性、非线性、客观性可扩展性、规范性特性,并摆脱了海量数据标签化的要求,是一种战场态势数据特征提取的理想方法,较传统方法和浅层神经网络方法具有较大优势。

1)模型的建立

深度神经网络有多种结构,每种结构都有不同的特点和功能,适用于不同的需求和应用。自编码器能够对输入数据进行编码和解码,实现数据的压缩和重构,通过最小化重构误差来最优化压缩性能,且不依赖于数据标签,在海量数据特征提取方面具有显著优势。在自编码器的基础上增加约束条件,可以实现扩展功能。

2)网络结构设计

本项目选择栈式稀疏降噪自编码网络作为数据特征提取的深度学习模型。一般而言,更多的网络层数能够得到更抽象的特征和更本质的描述,但如果网络层数过多,会加大网络训练和计算的难度,导致网络的过拟合。有研究报告指出,一般将隐含层设为三层可取得良好效果。网络每层的节点数与数据的维度直接相关,输入层节点数应与输入数据维度相同,输出层节点数代表了输出数据的维度,隐含层每层的节点数要根据特征提取效果调整设定。第一层隐含层节点数大于输入层节点数可获得更好的特征提取效果,原因是当隐含层神经元个数大于输入层神经元个数时,可实现特征检测功能,能够提取到完备特征。第二、三层隐含层节点数可按逐层递减设置。输出层节点数要通过计算原始数据集的本征维度确定,激活函数选择常用的Sigmoid 函数,具体层数和每层神经元数将在实验中根据结果多次调试后最终确定。此时,可基本确定网络结果。面向数据特征提取的深度学习模型如图4-16所示。

图4-16 面向数据特征提取的深度学习模型

3)模型的训练

在前人研究的基础上,本项目针对数据特征提取这一应用背景对训练方法进行了调整优化,提高了模型的训练效率和性能。

(1)预训练。预训练采取逐层贪婪无监督方法,它每次只训练一层网络,而其他层参数保持不变;它不追求整体最优结果,而选择次优结果;它使用无标签数据进行无监督训练;它只是预先训练,得出权重的初始值。

预训练具体步骤如下:①输入无标签原始数据。②运用逐层贪婪无监督学习算法对网络权值进行初始化,流程如图4-17所示。

(2)调优训练。调优训练是利用少量标签数据进行有监督训练,同时对整个网络的训练误差进行优化,目的是对整个网络的权重进行微调,使网络具有更精确的特征提取能力。

战场仿真数据集来源于演习数据、仿真模拟数据、随机概率数据以及拉丁方抽样数据,贴近于现代战争的计算机推演数据。首先对分类存储于不同数据库中的数据进行集成,然后基于本体知识表达选取静态和动态战场仿真数据,分别标称训练数据集、校验数据集和测试数据集,并有针对性地构建两个实验模型,应用于训练数据集和校验数据集的模型称为深度学习和分类器级联模型,应用于测试数据集的模型称为训练后的模型。数据集特征提取处理过程如图4-18所示。

图4-17 逐层贪婪无监督预训练流程

图4-18 数据集特征提取处理过程

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈