首页 理论教育 新的AI基础理论探索:神经拓扑、隐私保护、Super AI的控制

新的AI基础理论探索:神经拓扑、隐私保护、Super AI的控制

时间:2023-06-21 理论教育 版权反馈
【摘要】:人工智能的应用已经无处不在。通过理论视角进行分析,我们可以更清晰地了解AI领域面临的问题和挑战,同时也获取一些关于解决方案的启示和线索。我希望分享三个AI基础理论的新方向:神经拓扑结构、隐私保护学习、可控的Super AI。这其实就是现在人工智能领域一个标准的机器学习的方式—数据被视为极高维度数据空间中的一个点,通过算法分析去判断这个点是否属于某个特定的集合。

新的AI基础理论探索:神经拓扑、隐私保护、Super AI的控制

发电机组启动试运过程中,需要进行各种启动试验。利用空气间隙在线监测系统自动记录的过速、甩负荷、开停机等瞬态过程发电机气隙变化数据,可深入地分析该发电机瞬态过程气隙特性(图7-31),为评价发电机转子机械特性提供实际数据依据。

人工智能的应用已经无处不在。如果我们环顾四周,就会看到很多AI领域新进展以及AI的广泛应用。但与此同时,我们也要记住,今天看到的这些耀眼的应用,得益于一些基础科学领域的发展,而基础科学的发展,是源于多年以来基础理论研究的积累和突破。所以,为了继续推动AI应用方面的创新趋势,我们必须在理论研究方面有新的突破。我想传递以下三个观点:

第一,AI理论是非常重要的。通过理论视角进行分析,我们可以更清晰地了解AI领域面临的问题和挑战,同时也获取一些关于解决方案的启示和线索。

第二,AI的发展需要跨学科的合作。我们可以看到很多在AI领域获得巨大成功的例子,都是来源于一些看似不搭界的学科之间的合作。如果没有来自其他学科科学家的成果,那么在AI领域我们不可能取得这么快的发展。

第三,AI理论方面有一些非常有意思、值得探索的新方向。

我希望分享三个AI基础理论的新方向:神经拓扑结构、隐私保护学习、可控的Super AI(超级人工智能)。

首先,神经网络研究的新视角:神经拓扑结构。深度学习和神经网络是目前很多AI应用的基础。深度学习在近年来的巨大突破,其实很多人是没有预计到的。深度学习很多年以来都没有什么进展,直到突然之间几个要素集合在一起之后,深度学习和神经网络才产生了巨大的应用和影响。

但是为什么神经网络能这么成功呢?这对很多人来说依然是一个谜—很多人都在追寻神经网络的力量到底来自哪里—如果我们能够理解神经网络为何会成功的缘由,那么也许就会知道如何来改善神经网络,进而取得下一个突破。

我们先来看看关于“神经网络能做什么”的一个简单例子。比如气候预测,如果需要设计一个算法来捕捉气候形势,用来分析气象图到底是风暴现象还是正常气候,一个比较标准的方法是把气象图看作是一个二维或者三维的表现,然后通过图形分析从中找到范式,用以识别风暴的特点。

但是在深度学习和最近的一些机器学习中,人们是从一个更高层次的角度,将整张图视作高维度空间中的一个点。比如说猫的图片,假设这张图有一百万像素,那么它可以被视为一个一百万维数据空间中的一个点。这其实就是现在人工智能领域一个标准的机器学习的方式—数据被视为极高维度数据空间中的一个点,通过算法分析去判断这个点是否属于某个特定的集合(例如例子中的猫图片的集合)。

抽象来讲,我们可以看一下所有的猫的图片,它们构成了一个一百万维度中的数据集合。我们对于低维度数据有一个直观感受,但是没有人知道在高维度中的数据集是什么样的。我们的任务就是通过设计算法来对高维度数据做出好的判断。这一工作的核心在于神经网络,其中最关键问题就是神经网络要达到多大的大小和深度,才可以区分猫与非猫的图片。

多年以来,数学家一直在关注高维度数据集。一个自然的问题是,当我们试图去理解神经网络能用来做什么,我们首先希望理解对于神经网络而言,什么样的数据集是比较容易去分析和识别的,以及什么样的数据集是我们不能够用神经网络来分析的。

在过去的十多年中,神经网络学家开始将数学中的拓扑学和神经网络相结合,并且取得了很好的计算效果。在拓扑学中与高维度数据相对应的一个重要概念是贝蒂数。贝蒂数是一个数列,最低的是B0,它相当于数据集中相互之间不相关的元素数量。而Bi是什么意思呢?你可以把它认为是子集当中i—维洞的数量(number of holes)。比如下图贝蒂数示例中左边是一个平面上的圆圈,则B0=1,代表存在一个相互连接的元素;B1=1,代表图形中有一个洞。右边是一个更复杂的例子。图中展示了一个环面,B1也就是一维洞的数量,等于2,因为有两个不同类型的圆圈,而每一个圆圈就代表着一个洞。令图形S的贝蒂数为(B0,B1,…),ΣiBi称为S的“贝蒂数”。直观上说,贝蒂数越高,形状越复杂。

图7-31 评价气隙特性

1.过速试验过程气隙特性变化分析

某700MW混流式发电机,在启动试验过程中进行了152%过速试验,最高转速为163.9%。图7-32所示为记录的转速和所有气隙传感器平均气隙快速变化趋势,图7-33所示为过速过程+X向气隙快速录波数据,图7-34所示为过速过程各通道平均气隙快速变化趋势。从图中可以看到,在机组过速过程中,随着转速开始爬升,由于离心力不断增大,转子开始膨胀,导致各传感器测量得到的气隙急剧减小;随着导叶开始关闭,转速开始减小,转子持续收缩,气隙才逐渐增大,其中最大变化量为7.0mm。(www.xing528.com)

贝蒂数示例

一个直觉观点是,对于神经网络而言,形状越复杂,识别的难度也就越高。事实上这种直觉也是正确的,我们可以通过一些经典的拓扑学的理论,再加上理论计算科学家的一些洞见来证明这一假设。这也证明了刚才的一个观点,即如果你想解决一个有趣的AI问题,需要从不同学科的角度加以思考。这个案例当中讲的就是拓扑学,通过引入拓扑学可以让我们获得在AI方面的崭新洞见,而如果只关注AI的研究是不可能达到的。

第二个例子,关于隐私的保护。首先介绍另外一个学科,就是密码学。我本人对密码学非常感兴趣,特别是“多方计算(multi-party computation,MPC)”。MPC背后基本的理念是这样的:假定有很多不同的当事方,每个当事方都有一些数据,而且需要所有各方的数据集合在一起后,才能够利用AI的技术去挖掘或者发现重要的结果。然而各个当事方所拥有的数据都是机密的数据,而且是非常有价值的,因此他们都不希望将自己的私密数据泄露给其他当事方。

在这种情况下,我们是不是可以不需要揭秘各自的数据内容就可以进行协同计算呢?答案是确实可以的,可以通过密码的设计,也就是多方安全计算可以实现这个目标。

这个多方安全的概念及技术是我在1982年提出的,在当时的价值是观念上的创新及算法上的可行性。经过多年的发展,密码学的应用成本已经大大地降低,使得多方安全技术也可以有多种实际应用,包括用在具有隐私保护的机器学习。举个例子,几家制药公司希望共同进行新药开发,但每一家制药公司都有一点自己的机密信息,现在就可以通过人工智能+MPC使多家制药公司能够在不披露其独家知识产权的情况下进行合作。

图7-32 过速过程转速与平均气隙变化趋势

图7-33 过速过程+X向气隙快速录波数据

图7-34 过速过程各通道平均气隙变化趋势

通过比较过速前后相同的稳定工况下各气隙特性参数可以发现,过速试验导致了转子磁极形貌发生了变化,定转子间气隙有明显减小。图7-35所示为过速前后定子与转子圆图叠加图,从图中可以看出磁极形貌发生了变化,转子圆度从3.5%变为2.9%。图7-36所示为过速前后转子磁极形貌比较图,图7-37所示为过速前后各磁极气隙值减去过速前气隙值后的气隙变化图,从图7-36和图7-37可以看出,过速后各磁极气隙均有所减小,59号磁极气隙变化最大,减小了2.33mm,73号磁极变化最小,减小了1.49mm,所有磁极气隙平均减小了1.99mm由于不同磁极气隙减小量有所差别,导致转子磁极形貌发生了一些变化。

图7-35 过速前后定子与转子圆图叠加图

多方安全计算在隐私保护药物发现流程中的应用

最后一点是很多人非常感兴趣的,但也是一个充满争议的话题,那就是可控的超级人工智能,就是所谓的Super AI。人们普遍关心的是AI快速的进展对于人类社会可能造成的威胁。通用的超级人工智能何时到来?这是不可预知的。加州大学伯克利分校斯图尔特·拉塞尔(Stuart Russell)教授2019年出版了《人类兼容:人工智能和控制问题》(Human Compatible: AI and the Problem of Control),介绍如何推动“确保安全”的Super AI,并力主这一理念必须贯穿AI设计过程中。他设定了三个原则:利他(人的利益高于机器利益)、谦卑(机器不能自以为是)、尽心(机器能学懂人的偏好),通过概率理论和博弈论理论等数学方法来实现这些原则。

我要告诉大家一个基本的事实是,现在的AI应用是来自过去的理论研究,我们现在做的理论研究总会在未来的某一天让我们获得巨大的进步。

图7-36 过速前后转子磁极形貌比较图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈