用于最优控制的简单软件

寒冰屋发布时间：2019-04-01 09:23:33 ，浏览量：8

介绍

问题陈述

线性动态系统

离散时间

线性案例的解决方案

线性案例解决方案的探讨

非线性系统

方法限制

不断反馈

软件的使用

数字示例

线性系统

范德波尔(Van der Pol)振荡器

具有标量控制的Rayleigh方程

具有常数反馈的非线性系统

双连杆机器人操纵器

结论

附录

下载源代码 - 35.2 KB

介绍

在本文中，我想介绍一种紧凑且易于使用的软件工具，以实现对动态系统的最佳控制。最佳控制是一个非常广泛的主题。其基础是由Richard Bellman，Lev Pontryagin，Rudolf Kalman等人在20世纪50年代末至60年代奠定的。最佳控制具有许多实际应用。在这里，我们将重点关注以下经典的最优控制问题。我们的目标是通过外部控制输入将给定的动态系统从初始状态转移到某个最终状态。我们希望在此过渡期间系统参数尽可能接近其规定的轨迹。这是具有许多实际应用的最佳控制的非常基本的任务。例如，启动电动机将电流的初始跳跃限制在可接受的值。

处理这个问题甚至它的陈述需要大量的数学。我将仅限于描述问题所需的最低要求，并了解如何使用软件。附录中给出了一些额外的递归公式，没有证明。

问题陈述

让我们正式化我们的问题。动态系统用以下微分方程组描述：

Image 1 for Simple Software for Optimal Control

（1）

其中t是时间，x是状态向量，由表征系统行为的参数组成，ẋ是x的一阶导数的向量，m是控制向量。通常，控制矢量的维度不超过状态矢量的维度。在该语句中，向量m独立于向量x，并且可以被认为是开环系统的控制。具有输入控制向量m和状态向量x的开环控制系统如下所示：

Image 2 for Simple Software for Optimal Control

开环控制系统

我们希望在0到t f的最终时间之间的时间间隔内获得控制策略m（t），这最小化了成本函数。

Image 3 for Simple Software for Optimal Control

（2）

其中上标T表示矢量或矩阵的转置，r是期望的状态向量，u是期望的控制向量，Q和Z分别是用于状态和控制向量的期望参数和实际参数之间的偏差的权重矩阵。在大多数情况下Q和Z.是对角矩阵（但不一定！）。它们的每个对角线元素定义在给定时刻参数的期望值和实际值之间的差的平方的相对权重。矩阵可以是时间依赖的，例如，通常的做法是在最后时间增加差异的相对权重以确保期望的最终状态。这里提出的问题通常被称为“跟踪问题”。

线性动态系统

在我们找到解决方案之前，让我们讨论动态系统的一个特例。研究最充分的系统类是线性动态系统，即用一组线性微分方程描述动力学的系统。对于这样的系统，等式（1）可以重写如下：

（3）

其中A(t) 和B(t) 是矩阵。首先，我们将为这类系统提供解决方案，然后将其扩展到非线性动态系统。

离散时间

由于我们将提供数字解决方案，我们将在离散的时刻处理系统。因此，我们将重新设计离散时间t = k·Δt的问题，其中Δt构成一个小的时间间隔（采样间隔），k是给定的时间步长，0 mu * x[1] * (1 - x[0] * x[0]) - x[0] + m[0] }; // Exact formulas for gradients calculation var gradientsA = new CalcDelegate[dimensionX, dimensionX]; gradientsA[0, 0] = (k, deltaT, m, x) => 0; gradientsA[0, 1] = (k, deltaT, m, x) => 1; gradientsA[1, 0] = (k, deltaT, m, x) => -1 - 2 * x[0] * x[1]; gradientsA[1, 1] = (k, deltaT, m, x) => 1 - x[0] * x[0]; var gradientsB = new CalcDelegate[dimensionX, dimensionM]; gradientsB[0, 0] = (k, deltaT, m, x) => 0; gradientsB[1, 0] = (k, deltaT, m, x) => 1; var dynamicSystem1 = SQ.Create(functions, gradientsA, gradientsB, Q, Z, r, u, xInit, dt, N, (currCost, prevCost, iteration) => iteration > 20); dynamicSystem1.RunOptimization(); dynamicSystem1.Output2Csv("VanDerPol_ExactGrads", lstFormatting); dynamicSystem1.OutputExecutionDetails(isExactGradient: true); // Numeric gradients calculation double delta = 0.1; var dynamicSystem2 = SQ.Create(functions, new Vector(dimensionM, delta), new Vector(dimensionX, delta), Q, Z, r, u, xInit, dt, N, (currCost, prevCost, iteration) => iteration > 20); dynamicSystem2.RunOptimization(); dynamicSystem2.Output2Csv("VanDerPol_NumGrads", lstFormatting); dynamicSystem2.OutputExecutionDetails(isExactGradient: false); Console.WriteLine($"End \"{TITLE}\"{Environment.NewLine}{Environment.NewLine}"); } 数字示例线性系统

有一个机械系统：质量M通过力移动。根据牛顿第二定律，力等于质量和加速度的乘积的结果，这是位移的二阶导数。让我们将差异表示为x 0，将速度表示为x 1，将力表示为m 0。系统采用以下二阶矩阵微分方程进行描述：

ẋ= Ax + Bm，其中