状态观测器：全维与最小阶观测器的讨论

时间：2023-06-27 理论教育版权反馈

【摘要】：估计或者观测状态变量的装置称为状态观测器，或简称观测器。如果状态观测器可观测到系统的所有状态变量，不管其是否能直接测量，这种状态观测器均称为全维状态观测器。本节将讨论全维状态观测器和最小阶状态观测器。此时的状态向量x由如下动态方程中的状态来近似，该式表示状态观测器。注意到状态观测器的输入为y和u，输出为。式确定了所需的状态观测器增益矩阵Ke。

状态观测器：全维与最小阶观测器的讨论

以上在介绍控制系统设计的极点配置方法时，曾假设所有的状态变量均可有效地用于反馈。然而在实际情况中，不是所有的状态变量都可用于反馈，这时需要估计不可直接物理测量的状态变量。需特别强调，应避免将一个状态变量微分产生另一个状态变量，因为噪声通常比控制信号变化更迅速，所以信号的微分总是减小信噪比。不可物理测量的状态变量的估计通常称为观测。估计或者观测状态变量的装置称为状态观测器，或简称观测器。如果状态观测器可观测到系统的所有状态变量，不管其是否能直接测量，这种状态观测器均称为全维状态观测器。有时，只需观测不可测量的状态变量，而不是可直接测量的状态变量。例如，由于输出变量是可观测的，并且它们与状态变量线性相关，所以无需观测所有的状态变量，而只观测n－m个状态变量，其中n是状态向量的维数，m是输出向量的维数。

估计小于n个状态变量（n为状态向量的维数）的观测器称为降维状态观测器，或简称为降价观测器。如果降维状态观测器的阶数是最小的，则称该观测器为最小阶状态观测器或最小阶观测器。本节将讨论全维状态观测器和最小阶状态观测器。

（1）全维状态观测器

状态观测器基于输出的测量和控制变量来估计状态变量。在9.5节中讨论的可观测性概念有重要作用。正如下面将看到的，当且仅当满足可观测性条件时，才能设计状态观测器。

在下面关于状态观测器的讨论中，用表示被观测的状态向量。在许多实际情况中，将被观测的状态向量用于状态反馈，以产生所期望的控制向量。

考虑如下线性定常系统

从理论上，可以构造一个动态方程，其形式与式（9-137）相同，用计算机实现的模拟受控系统

式中分别为模拟系统的状态向量估计值和模拟输出向量。当模拟系统与受控对象的初始状态向量相同时，在同一输入向量的作用下，有，可用作为状态反馈所需的信息。但是，受控对象的初始状态可能不相同，模拟系统中的积分器初始条件的设置只能预估，因而两个系统的初始状态总有差异，即使两个系统的A，B，C矩阵完全一样，也必然存在估计状态与受控对象实际状态的误差，难以实现所需的状态反馈。这就是说，力图采用开环形式的状态估计器是不实用的。由于估计状态的误差必然在输出误差中反映出来，根据反馈控制原理，可利用，并将其反馈至处，控制尽快趋近于零，从而使得尽快趋近于零，这时就可利用来形成状态反馈了。此时的状态向量x由如下动态方程

中的状态来近似，该式表示状态观测器。注意到状态观测器的输入为y和u，输出为。式（9-139）的右端最后一项包含实际输出与观测输出之间差的修正项。矩阵Ke起到加权矩阵的作用。修正项监控状态变量。当此模型使用的矩阵A和B与实际系统使用的矩阵A和B之间存在差异时，由于动态模型和实际系统之间的差异，该附加的修正项将减小这些影响。图9-19所示为系统和全维状态观测器的方块图。

图9-19 全维状态观测器方块图

（2）全维状态观测器的分析

由观测器动态方程式（9-139）可得到观测器的误差方程，用式（9-137）减去式（9-139），可得

定义x和之差为误差向量，即

则式（9-140）改写为

由式（9-141）可看出，误差向量的动态特性由矩阵A－KeC的特征值决定。如果矩阵A－KeC是稳定矩阵，则对任意初始误差向量e（0），误差向量都将趋近于零。也就是说，不管x（0）和值如何，都将收敛到x（t）。如果所选的矩阵A－KeC的特征值使得误差向量的动态特性渐近稳定且足够快，则任意误差向量都将以足够快的速度趋近于零（原点）。

实际上，观测器的设计就是前面介绍过的输出反馈到状态微分处的输出反馈设计问题。因此，如果系统是完全可观测的，则可以选择Ke，使得A－KeC具有任意所期望的特征值。

如前所述，对于A－KeC所期望特征值的观测器增益矩阵Ke的确定，其充要条件为：原系统的对偶系统

是状态完全可控的。该对偶系统的状态完全可控的条件是

[CT ATCT⋯（AT）n－1CT]

的秩为n。这是由式（9-137）定义的原系统的完全可观测性条件。

（3）全维状态观测器的设计

考虑由式（9-137）定义的线性定常系统，假设系统是完全可观测的。又设系统结构如图9-19所示。

在设计全维状态观测器时，如果将式（9-138）给出的系统变换为可观测标准形就很方便了。如前所述，可按下列步骤进行：定义一个变换矩阵P，使得

P＝（WR）﹣1（9-142）

式中R是可观测性矩阵

RT＝[CT ATCT⋯（AT）n－1CT]（9-143）

且对称矩阵W由下式定义，即

式中，ai是由下式给出的如下特征方程的系数

∣sI－A∣＝sn＋a1sn－1＋⋯＋an－1s＋an＝0

显然，由于假设系统是完全可观测的，所以矩阵WR的逆存在。在线性变换x＝Pξ作用下，系统可变换成可观标准形

仿照状态反馈进行极点配置方法中状态反馈矩阵K的确定，有

式中，ai，（i＝1，2，⋯，n）分别是原系统特征多项式和期望特征多项式的系数。式（9-146）确定了所需的状态观测器增益矩阵Ke。

一旦选择了所期望的特征值（或所期望的特征方程），只要系统完全可观测，就能设计全维状态观测器。所选择的特征方程的期望特征值，应使得状态观测器的响应速度至少比所考虑的闭环系统快2～5倍。

注意迄今为止，假设观测器中的矩阵A和B与实际系统中的严格相同。实际上，这做不到。因此，误差动态方程不可能由式（9-141）给出，这意味着误差不可能趋于零。因此，应尽量建立观测器的准确数学模型，以使误差小到令人满意的程度。

（4）最优Ke选择的注释

参考图9-19，应当指出，作为对装置模型修正的观测器增益矩阵Ke，通过反馈信号来考虑装置中的未知因素。如果含有显著的未知因素，那么通过矩阵Ke的反馈信号也应该比较大。然而，如果由于干扰和测量噪声使输出信号受到严重干扰，则输出y是不可靠的。因此，由矩阵Ke引起的反馈信号应该比较小。在决定矩阵Ke时，应该仔细检查包含在输出y中的干扰和噪声的影响。

应强调的是观测器增益矩阵Ke依赖于所期望的特征方程

（s－μ1）（s－μ2）⋯（s－μn）＝0

在许多情况中，μ1，μ2，⋯，μn的选取不是惟一的。有许多不同的特征方程可选作所期望的特征方程。对于每个期望的特征方程，可有不同的矩阵Ke。

在设计状态观测器时，最好是在几个不同的期望特征方程的基础上决定观测器增益矩阵Ke。这几种不同的矩阵Ke必须进行仿真，以评估作为最终系统的性能。当然，应从系统总体性能的观点来选取最好的Ke。在许多实际问题中，最好的矩阵Ke选取，归结为快速响应及对干扰和噪声灵敏性之间的一种折中。

例9-30 考虑如下的线性定常系统

式中

设计一个全维状观测器。设系统结构和图9-19所示的相同。又设观测器的期望特征值为

μ1＝﹣1.8＋j2.4，μ2＝﹣1.8－j2.4

解由于状态观测器的设计实际上归结为确定一个合适的观测器增益矩阵Ke，为此先检验可观测性矩阵，即

的秩为2。因此，该系统是完全可观测的，并且可确定期望的观测器增益矩阵。下面将用两种方法来求解该问题。

方法1 采用式（9-146）来确定观测器的增益矩阵。由于该状态矩阵A 已是可观测标准形，因此变换矩阵P＝（w R）﹣1＝I。由于给定系统的特征方程为

因此

a1＝0，a2＝﹣20.6

观测器的期望特征方程为

因此

故观测器增益矩阵Ke可由式（9-146）求得如下

方法2 设

定义

则特征方程为

由于所期望的特征方程为

s2＋3.6s＋9＝0

比较式（9-147）和以上方程，可得

ke1＝29.6， ke2＝3.6

或

当然，无论采用什么方法，所得的Ke是相同的。

全维状态观测器由下式给出为

或者

与极点配置的情况类似，如果系统阶数n≥4，则推荐方法1。这是因为在采用方法1时，所有矩阵都可由计算机实现；而方法2总是需要手工计算包含未知参数ke1，ke2，⋯， ken的特征方程。

（5）观测器的引入对闭环系统的影响——分离定理

在极点配置的设计过程中，假设真实状态x（t）可用于反馈。然而实际上，真实状态x （t）可能无法测量，所以必须设计一个观测器，并且将观测到的状态用于反馈，如图9-19所示。因此，该设计过程分为两个阶段，第一个阶段是确定反馈增益矩阵K，以产生所期望的特征方程；第二个阶段是确定观测器的增益矩阵Ke，以产生所期望的观测器特征方程。

现在不采用真实状态x（t）而采用观测状态，因此必须研究对闭环控制系统特征方程的影响。

考虑如下线性定常系统

且假定该系统状态完全可控和完全可观测。

对基于观测状态的状态反馈控制

利用该控制，状态方程为

将直实状态x（t）和观测状态的差定义为误差e（t），即

将误差向量代入式（9-148），得

注意，观测器的误差方程为（9-141），重写为

将式（9-149）和式（9-150）合并，可得

式（9-151）描述了观测-状态反馈控制系统的动态特性。该系统的特征方程为

或

注意，观测-状态反馈控制系统的闭环极点包括由极点配置单独设计产生的极点和由观测器单独设计产生的极点。这意味着，极点配置和观测器设计是相互独立的。它们可分别进行设计，并合并为观测-状态反馈控制系统。如果系统的阶次为n，则观测器也是n阶的（如果采用全维状态观测器），并且整个闭环系统的特征方程为2n阶的。

定理9-3 分离定理若受控系统（A，B，C）可控可观测，用状态观测器估值形成状态反馈时，其系统的极点配置和观测器设计可分别独立进行。即K与Ke的设计可分别独立进行。

由状态反馈（极点配置）选择所产生的期望闭环极点，应使系统能满足性能要求。观测器极点的选取通常使得观测器响应比系统的响应快得多。一个经验法则是选择观测器的响应至少比系统的响应快2～5倍。因为观测器通常不是硬件结构，而是计算软件，所以它可以加快响应速度，使观测状态迅速收敛到真实状态，观测器的最大响应速度通常只受到控制系统中的噪声和灵敏性的限制。注意，由于在极点配置中，观测器极点位于所期望的闭环极点的左边，所以后者在响应中起主导作用。

例9-31 考虑一个控制器系统的设计。给定线性定常系统为

式中

且闭环极点为s＝μi（i＝1，2），其中

μ1＝﹣1.8＋j2.4，μ2＝﹣1.8－j2.4

期望用观测-状态反馈控制，而不是用真实的状态反馈控制。观测器的期望特征值为

μ1＝μ2＝﹣8

试采用手算法和Matlab确定出相应的状态反馈增益矩阵K和观测器增益矩阵Ke。

解 ①手算法。假设采用极点配置方法来设计该系统，并使其闭环极点为s＝μi（i＝1， 2），其中μ1＝﹣1.8＋j2.4，μ2＝﹣1.8－j2.4。在此情况下，可得状态反馈增益矩阵K 为

K ＝[29.6 3.6]

采用该状态反馈增益矩阵K，可得控制输入u为

假设采用观测-状态反馈控制替代真实状态反馈控制，即

式中，观测器增益矩阵的特征值选择为

μ1＝μ2＝﹣8

现求观测器增益矩阵Ke。并画出观测-状态反馈控制系统的方块图。再求该控制-观测器的传递函数U（s）/[﹣Y（s）]，并画出系统的方块图。

对于由式（9-152）定义的系统，其特征多项式为

因此

a1＝0，a2＝﹣20.6

该观测器的期望特征方程为

因此

为了确定观测器增益矩阵，利用式（9-146），则有

式中

因此

式（9-153）给出了观测器增益矩阵Ke。观测器的方程由式（9-154）定义，即

由于

所以，式（9-154）为

或

控制器-观测器的传递函数为

该系统的方块图如图9-20所示。

图9-20 观测-状态反馈的系统方块图

设计的观测-状态反馈控制系统的动态特性由下列方程描述。对于系统

对于观测器

作为整体而言，该系统是四阶的，其系统特征方程为

∣sI－A＋BK∣∣sI－A＋KeC∣＝（s2＋3.6s＋9）（s2＋16s＋64）＝s4＋19.6s3＋130.6s2＋374.4s＋576＝0

该特征方程也可由图9-20所示的系统的方块图得到。由于闭环传递函数为

则特征方程为

（s2＋19.6s＋151.2）（s2－20.6）＋778.16s＋3690.72＝s4＋19.6s3＋130.6s2＋374.4s＋576＝0

事实上，该系统的特征方程对于状态空间表达式和传递函数表达式是相同的。

求出的状态反馈增益矩阵K为

K＝[29.6 3.6]

观测器增益矩阵Ke为

该系统是四阶的，其特征方程为

∣sI－A＋BK sI－A＋KeC∣＝0

通过将期望的闭环极点和期望的观测器极点代入上式，可得(www.xing528.com)

∣sI－A＋BK sI－A＋KeC∣＝（s＋1.8－j2.4）（s＋1.8＋j2.4）（s＋8）2＝s4＋19.6s3＋130.6s2＋374.4s＋576

②Matlab方法。如Matlab Program 9-6、9-7所示。

（6）最小阶观测器

迄今为止所讨论的观测器设计都是重构所有的状态变量，实际上，有一些状态变量可以准确测量，对这些可准确测量的状态变量就不必估计了。

图9-21 具有最小阶观测器的观测-状态反馈控制系统

假设状态向量x为n维向量，输出向量y为可量测的m维向量。由于m个输出变量是状态变量的线性组合，所以m个状态变量就不必进行估计，只需估计n－m个状态变量即可，因此，该降维观测器为n－m阶观测器。这样的n－m阶观测器就是最小阶观测器。图9-21所示为具有最小阶观测器系统的方块图。

如果输出变量的测量中含有严重的噪声，且相对而言较不准确，那么利用全维观测器可以得到更好的系统性能。

为了介绍最小阶观测器的基本概念，又不涉及过于复杂的数学推导，我们将介绍输出为标量（即m＝1）的情况，并推导最小阶观测器的状态方程。考虑系统

式中，状态向量x可划分为xa（纯量）和xb（n－1维向量）两部分。这里，状态变量xa等于输出y，因而可直接量测，而xb是状态向量的不可量测部分。于是，经过划分的状态方程和输出方程为

式中，Aaa∈R1×1，Aab∈R1×（n－1），Aba∈R（n－1）×1，Abb∈R（n－1）×（n－1），Ba∈R1×1，Bb∈R（n－1）×1。

由式（9-155），状态可测部分的状态方程为

或

式（9-157）可看做输出方程，其左端各项是可量测的。在设计最小阶观测器时，可认为式（9-157）左端是已知量。因此，式（9-157）可将状态的可量测和不可量测部分联系起来。

由式（9-155），对于状态的不能量测部分

注意，Abaxa和Bbu这两项是已知量，式（9-158）为状态的不可量测部分的状态方程。

下面将介绍设计最小阶观测器的一种方法。如果采用全维状态观测器的设计方法，则最小阶观测器的设计步骤可以简化。

现比较全维观测器的状态空间表达式和最小阶观测器的状态空间表达式。

全维观测器的状态方程为

最小阶观测器的状态方程为

全维观测器的输出方程为

y＝Cx

最小阶观测器的输出方程为

因此，最小阶观测器的设计步骤如下。

首先，注意到全维观测器由式（9-149）给出，将其重写为

表9-1 给出式（9-160）的最小阶状态观测器方程所做的替换

然后，将表9-1所做的替换代入式（9-159），可得

式中，状态观测器增益矩阵Ke是（n－1）×1维矩阵。在式（9-160）中，注意到为估计，需对xa微分，这是不希望的，因此有必要修改式（9-160）。

注意到xa＝y，将式（9-160）重写如下，可得

定义

及

则式（9-161）成为

从而式（9-163）和式（9-162）一起确定了实际的最小阶观测器。

下面推导观测器的误差方程。利用式（9-158），将式（9-160）改写为

用式（9-164）减去式（9-158），可得

定义

于是，式（9-165）为

这就是最小阶观测器的误差方程。注意，e是（n－1）维向量。

由式（9-166）得到的最小阶观测器的期望特征方程为

式中，μ1，μ2，μn－1是最小阶观测器的期望特征值。观测器的增益矩阵Ke确定如下：首先选择最小阶观测的期望特征值[即将特征方程（9-167）的根置于所期望的位置]；然后采用在全维观测器设计中提出并经过适当修改的方法。例如，若采用由式（9-146）给出的确定矩阵Ke的公式，则应将其修改为

式中的Ke是（n－1）×1维矩阵，并且

这里，R，W均为（n－1）×（n－1）维矩阵。注意，是如下特征方程的系数

例9-32 考虑系统

式中

假设输出y可准确量测，因此状态变量x1（等于y）不需要估计。试设计一个最小阶观测器（显然该最小阶观测器是二阶的）。此外，假设最小阶观测器的期望特征值为

解

可得

参照式（9-167），该最小阶观测器的特征方程为

由式（9-168）有

参照式（9-162）和式（9-163），最小阶观测器的方程为

式中

注意到

因此，式（9-169）的最小阶观测器为

或

式中

如果采用观测-状态反馈，则控制输入为

式中的K为状态反馈增益矩阵（矩阵K不是在本例中确定的）。

下面介绍该问题的Matlab程序Matlab Program 9-8。

（7）利用极点配置法设计控制器型系统

图9-22 倒立摆系统

考虑如图9-22所示的倒立摆系统。图中，倒立摆安装在一个小车上。这里仅考虑倒立摆在平面内运动的二维问题。

希望在有干扰（如作用于质量m上的阵风施加于小车的这类外力）时，保持摆垂直。当以合适的控制力施加于小车时，可将该倾斜的摆返回到垂直位置，且在每一控制过程结束时，小车都将返回到参考位置x＝0。

设计一个控制系统，使得当给定任意初始条件（由干扰引起）时，用合理的阻尼（如对主导闭环极点有ζ＝0.5），可快速地（如调整时间约为2s）使摆返回至垂直位置，并使小车返回至参考位置（x＝0）。假设M，m和l的值为

M＝2kg，m＝0.1kg，l＝0.5m

进一步设摆的质量集中在杆的顶端，且杆是无质量的。

对于给定的角度θ和角速度的初始条件，设计一个使倒立摆保持在垂直位置的控制系统。此外，还要求控制系统在每一控制过程结束时，小车返回到参考位置。该系统对初始条件的干扰有效地做出响应（所期望的角θd总为零，并且所期望的小车的位置总在参考位置上。因此，该系统是一个控制器系统）。

这里采用极点配置的状态反馈控制方法来设计控制器。如前所述，对任意极点配置的充要条件为系统状态完全可控。

设计的第一步是推导倒立摆系统的数学模型。

当角度θ不大时，描述系统动态特性的方程为

式中，I是摆杆围绕其重心的转动惯量。由于该系统的质量集中在杆的顶端，所以重心就是摆的中心。在分析中，假设摆围绕其重心的转动惯量为零，即I＝0。那么，其数学模型为

式（9-170）和式（9-171）定义了如图9-22所示的倒立摆系统的数学模型。只要θ不大，线性化方程就是有效的。式（9-170）消去，式（9-171）消去，整理可得

从式（9-172）可得系统的传递函数为

代入给定的数值，且注意到g＝9.81m/s2，可得

显然，该倒立摆系统在负实轴上有一个极点（s＝﹣4.539），另一个极点在正实轴上（s＝4.539），因此，该系统是开环不稳定的。

定义状态变量为

式中，θ表示摆杆围绕点P的旋转角，x表示小车的位置，将θ和x作为系统的输出，即

又由于θ和x均是易于量测的量。由状态变量的定义和式（9-172）和式（9-173），可得

写成状态空间表达式有

式（9-174）和式（9-175）给出了该倒立摆系统的状态空间表达式。

代入给定的M，m和l的值，可得

于是，式（9-174）和式（9-175）可重写为

式中

采用下列线性状态反馈控制方案，因为给定υ＝0，此处忽略了。

u＝﹣Kx

为此首先检验该系统是否状态完全可控。由于

的秩为4，所以系统是状态完全可控的。

系统的特征方程为

因此 a1＝0，a2＝﹣20.601，a3＝0，a4＝0

其次，选择期望的闭环极点位置。由于要求系统具有相当短的调整时间（约2s）和合适的阻尼（在标准的二阶系统中等价于ζ＝0.5），所以我们选择期望的闭环极点为s＝μi （i＝1，2，3，4），其中

在这种情况下，μ1和μ2是一对具有ζ＝0.5和ωn＝4的主导闭环极点。剩余的两个极点μ3和μ4位于远离主导闭环极点对的左边。因此，μ3和μ4响应的影响很小。所以，可满足快速性和阻尼的要求。期望的特征方程为

因此

现采用式（9-131）来确定增益矩阵K，即

式中P由式（9-124）得到，即

P＝QW

这里Q和W由式（9-125）给出，于是

变换矩阵P成为

故状态反馈增益矩阵K为

反馈控制输入为

u＝﹣Kx＝298.1504x1＋60.6972x2＋163.0989x3＋73.3945x4

注意，这是一个控制器系统。期望的角θd总为零，且期望的小车的位置也总为零。因此，参考输入为零。图9-23为倒立摆系统的状态反馈控制结构图。

（8）利用Matlab确定状态反馈增益矩阵K

图9-23 具有线性状态反馈控制的倒立摆系统

Matlab Program 9-9是一种能求出所需状态反馈增益矩阵K 的Matlab程序。

（9）所得系统对初始条件的响应

当状态反馈增益矩阵确定后，系统的性能就可由计算机仿真来检验。为了求得对任意初始条件的响应，可按下列步骤进行。

系统的基本方程为状态方程

和线性反馈控制律

u＝﹣Kx

将上述控制输入代入状态方程，可得

将有关数据代入上式，即

下面用Matlab来求所设计的系统对初始条件的响应。

系统的状态方程为式（9-176）。假设初始条件为

将式（9-176）重写为

式中

将初始条件向量定义为B，即

则系统对初始条件的响应可通过求解下列方程得到，即

式中

Matlab Program 9-10将求出由式（9-176）定义的系统对由式（9-177）指定的初始条件的响应。注意，在给出的Matlab程序中，使用了下列符号

图9-24给出了用Matlab Program 9-10求得的响应曲线。这些曲线表明，当给定倒立摆系统的初始条件θ（0）＝0.1rad，，x（0）＝0和时，它是如何返回到参考位置（θ＝0，x＝0）的。不难看出，这些响应曲线是令人满意的（这里用subplot命令同时画出几个独立的曲线，并将它们画在同一张纸上）。

图9-24 倒立摆系统在初始条件作用下的响应

注意，该响应曲线依赖于所期望的特征方程（即所期望的闭环极点），这一点非常重要。对不同的期望特征方程，响应曲线（对相同的初始条件）是不同的。

较快的响应通常要求较大的控制信号。在设计这样的控制系统时，最好检验几组不同的期望闭环极点，并确定相应的矩阵K。在完成系统的计算机仿真并检验了响应曲线后，选择系统总体性能最好的矩阵K。系统总体性能最好的标准取决于具体情况，包括应考虑的经济因素。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

研究成果

注意事项

解决方案

计算方法

发展趋势

中国古代

社会主义

心理健康

控制系统

建筑工程

经济发展

传统文化

民事诉讼

中国传统

程序设计

轨道交通

解决方法

工程施工

研究结果

建设工程

文史资料

持续发展

计算机网

使用方法

状态观测器：全维与最小阶观测器的讨论

相关推荐

状态观测器：全维与最小阶观测器的讨论

有关自动控制原理的文章

相关推荐