Publication text
(PDF):
Read
Download
Введение
Современный подход к решению задач оценивания неизмеряемых переменных состояния сложных динамических объектов, в том числе судов, базируется на использовании цифровых технологий и инструментов построения интеллектуальных систем. Искусственные нейронные сети и аппарат нечеткой логики позволяют на качественно новом уровне решать проблемы управления динамическими объектами высокой размерности с плохо формализуемыми моделями. Однако их применение в задачах синтеза оптимальных систем ограничивается наличием существенного недостатка, связанного со сложностью процесса обучения, требующего большого объема экспериментальных данных об объекте управления [1–3].
В концепции интегрированных систем управления флотом актуальное значение имеет решение проблемы стабилизации судов на курсе с использованием цифровых технологий. В частности,
в работах [4, 5] предложено применение цифровых технологий, реализуемых на основе модального метода синтеза, к динамической модели судовой системы стабилизации курса, что позволит путем вариации осуществлять выбор требуемых параметров авторулевых комплексов, обеспечивающих устойчивость судна на курсе. С целью преодоления этих сложностей предлагается использовать наряду с инструментальными математические датчики информации, которые строятся на динамических наблюдателях и оценивателях. В системах реаль-ного времени наиболее распространены оценки типа «фильтрация», которые характерны для оце-нивателей полного порядка, предложенных
Р. Калманом. Основу этих оценивателей составляет подсистема в виде идентификатора состояния, включающего модель объекта управления, входными сигналами которой являются то же управляющее воздействие и сигнал невязки между выходами объекта и модели, служащий сигналом обратной связи по ошибке восстановления вектора состояния. За счет его влияния динамика модели приобретает качественно новые свойства, когда свободные движения объекта и модели различаются, но вынужденные − асимптотически сходятся. Это позволяет заменить переменные состояния объекта переменными состояния модели, т. е. их оценками. Построенные на этой основе оцениватели обладают свойствами динамической системы
и называются динамическими компенсаторами. Необходимыми условиями реализации алгоритма оценивания вектора состояния объекта и возмущений, а также восстановления неизмеряемых переменных состояния, согласно [6–10], служат текущие измерения его входов и выходов и использование параметрической информации о модели объекта. Актуальность проблемы синтеза оценивателей состояния широко освещена в российской
[11, 12] и зарубежной [13, 14] литературе. Однако на практике, при разработке алгоритма синтеза оценивателей, необходимо учитывать специфику динамических свойств конкретных объектов [15].
Методы и материалы
Рассмотрим в общем случае алгоритм синтеза оценивателя и покажем его реализацию на конкретном объекте. С этой целью выбираем модель управляемого объекта в виде системы матричных уравнений, заданных в форме пространства состояний:
(1)
для начальных условий: X(t0) = X0, t ≥ t0. Здесь X(t)Rn, U(t)Rm и Y(t)Rl – векторы состояния, управления и выхода соответственно; A, B, C, D – матрицы состояния, управления, выхода и связи вход – выход линейной стационарной системы соответственно.
Процесс синтеза алгоритма оценивания переменных состояния этого объекта заключается в формировании такой структуры наблюдателя, переменные состояния которого могли бы служить оценками переменных состояния объекта управления.
Предположим, что D = 0. Тогда алгоритм оценки переменных состояния X(t) по измеряемым переменным управления U(t) и выходным переменным Y(t), описываемый уравнениями
(2)
где N = [n1, n2, …, nn] – вектор коэффициентов усиления наблюдателя, будет отображать работу наблюдателя в составе обобщенной системы управления, представленной на рис. 1.
Рис. 1. Структура системы управления объектом с наблюдателем:
− вектор переменных состояния наблюдателя, служащий оценкой состояния объекта; N – (n ∙ l) − вектор коэффициентов усиления (настройки) наблюдателя, подлежащих определению; − вектор
выхода наблюдателя, служащий оценкой вектора выхода объекта; матрица D = 0; К = [k1, k2, …, kn]
Fig. 1. Structure of the object control system with an observer: – a vector of the observer's state variables,
which serves as an estimate of the state of an object; N – (n ∙ l) – vector of gains (setting) of the observer under determination; – the observer's output vector, which serves as an estimate of the object's output vector; matrix D = 0;
К = [k1, k2, …, kn]
Представленный моделью (2) регулятор является уже динамической системой, порядок которой совпадает с порядком объекта управления. Такой регулятор называют динамическим компенсатором.
Объединив уравнения (2), получим:
Если в уравнении (2) заменить выход
Y(t) = CX(t), то динамическую модель наблюдателя можно записать в следующем виде:
(3)
где H = (A − NC) – матрица динамических свойств наблюдателя, D = 0.
Поскольку наблюдатель (оцениватель) строят, как правило, в системе модального управления объектом (см. рис. 1), то вектор управления U(t) принимает вид
(4)
где K – вектор коэффициентов усиления цепи об-ратной связи в системе модального управления.
Для расчета численных значений коэффициентов k1, k2, …, kn находят характеристический многочлен модального регулятора с собственными числами матрицы и приравнивают его коэффициенты при степенях оператора s к коэффициентам при тех же степенях s стандартного полинома того же порядка, но с желаемым распределением корней.
Выбором элементов матрицы N наблюдателю также можно придать любое желаемое распределение корней (собственных чисел матрицы H) характеристического уравнения
D(s) = det [sI – H], (5)
где – единичная матрица, при котором процесс оценивания (3) асимптотически устойчив и , т. е. при t → ∞ оценочные переменные состояния наблюдателя стремятся к переменным состояния объекта при любых начальных значениях , .
Для выбора распределения корней характеристического уравнения наблюдателя обычно пользуются одной из стандартных форм, например
sn + n-1sn-1 + … + 0 = 0, (6)
где i, i = 0, 1, …, n – 1 – коэффициенты стандартного полинома, выбранного в качестве желаемой формы характеристического полинома D(s) замкнутой системы.
При этом так же, как и при расчете модального регулятора, приравнивают коэффициенты при одинаковых степенях оператора s в уравнениях (5) и (6) и находят выражения для определения элементов матрицы N наблюдателя через параметр
ω стандартных форм.
Параметры наблюдателя и параметры регулятора могут рассчитываться независимо. Понятно, что процессы в наблюдателе должны протекать более быстро, чем переходный процесс в системе. Эмпирически установлено [5], что наблюдатель должен обладать быстродействием, в 2–4 раза превышающим быстродействие системы.
С учетом полученных оценок формируется расширенная (композитная) модель динамической системы (объект, наблюдатель) управления. Полученный с ее помощью вектор состояния системы содержит численные значения как самих переменных состояния, так и их оценок.
При объединении двух независимых систем (объекта и наблюдателя), описываемых уравнениями состояния (1) и (3) с учетом (4), матрицы обобщенной (композитной) системы имеют блочную структуру (см. [3]):
. (7)
Для восстановления вектора состояния в расширенной системе (7) размерности предложен наблюдатель следующей структуры:
где , – векторы, служащие оценками соответственно состояния и выхода расширенной системы «объект – наблюдатель».
Покажем реализацию представленного выше алгоритма синтеза на примере упрощенной модели стабилизации судна для оценивания его переменных состояния.
Пусть упрощенная модель объекта управления (судна) задана в пространстве состояний матрицами
D = 0.
Для анализа устойчивости заданной модели судна получим с применением инструментария среды MATLAB собственные числа матрицы A:
<< eig(A)
ans =
1
2
Поскольку собственные числа матрицы А положительны, объект управления будет неустойчивым. Поэтому синтез оценивателя для неустойчивого объекта можно осуществить только решив задачу модального управления объектом, т. е. обеспечения заданного расположения корней характеристического многочлена. Отсюда следует, что все компоненты вектора состояния X могут быть измерены.
Матрица свободного движения замкнутой системы находится в виде
С учетом размерности объекта управления n = 2 характеристический многочлен модального регулятора с собственными числами матрицы будет иметь вид
(8)
где s – операторная переменная; k1, k2 – коэффициенты усиления цепи обратной связи по переменным x1 и x2 соответственно.
Для выбора желаемого распределения корней характеристического уравнения модального регулятора воспользуемся одной из стандартных форм, например квадратным двучленом вида
D(s) = (Ts + 1)n, (9)
где n = 2, T = tp.жел / 3n.
Задавшись заданным быстродействием системы, например tp.жел = 0,3 с, рассчитываем параметр T = 0,3 / (3 · 2) = 0,05 c. После приведения стандартной формы к каноническому виду получим
D(s) = s2 + 40s + 400.
Для расчета коэффициентов усиления k1, k2 модального регулятора приравнивают коэффициенты при одинаковых степенях оператора s в уравнениях (8) и (9) и находят выражения для их численной оценки:
(k2 − 3) = 40; (k1 + 2) = 400,
отсюда
k1 = 398; k2 = 43.
При известных значениях вектора коэффициентов K найдем, используя инструментарий MATLAB, собственные числа матрицы замкнутой системы управления заданным объектом
<< eig(A_)
ans =
-20
-20
Получили отрицательные значения собственных чисел, что свидетельствует об устойчивости замкнутой модальным регулятором системы управления заданным объектом. Следовательно, можно приступить к синтезу наблюдателя (оценивателя) вектора неизмеряемых переменных состояния.
Для расчета наблюдателя нужно найти матрицу H = (A − NC) динамических свойств наблюдателя:
С учетом размерности объекта управления n = 2 характеристический многочлен динамического наблюдателя с собственными числами матрицы
H будет иметь вид
(10)
Для выбора желаемого распределения корней характеристического уравнения наблюдателя воспользуемся одной из стандартных форм, например тем же квадратным двучленом вида
D(s) = (Ts + 1)n,
где n = 2; T = tp.жел / 3n.
Поскольку наблюдатель должен обладать быстродействием, в 2–4 раза превышающим быстродействие системы, задаемся для него желаемым значением tp.жел = 0,15 с. Тогда параметр Tn = 0,15 / (3 · 2) = 0,025 c. После приведения стандартной формы к каноническому виду получим
Dn(s) = s2 + 80s + 1 600. (11)
При этом так же, как и при расчете модального регулятора, приравнивают коэффициенты при одинаковых степенях оператора s в уравнениях (10) и (11) и находят выражения для определения элементов матрицы N наблюдателя:
(n1 − 3) = 80; (n2 − 3n1 + 2) = 1 600,
отсюда n1 = 83; n2 = 3n1 – 2 + 1 600 = 1 847.
На основании известного вектора коэффициентов наблюдателя N = [83; 1 847] найдем матрицу
H динамического наблюдателя (оценивателя):
Сформируем на основании (7) композитные (составные) матрицы расширенной системы как совокупности двух подсистем − объекта с модальным регулятором и динамического наблюдателя (оценивателя):
(12)
Найдем собственные числа матрицы Ae и покажем, что обобщенная модель системы модального управления объектом с наблюдателем будет устойчивой. С этой целью, используя набор команд MATLAB
Ae = [0 1 0 0; –2 3 –398 –43; 83 0 –83 1;
1847 0 –2 247 –40];
eig(Ae)
можно получить следующие результаты их численных оценок:
ans =
-40.0000 + 0.0000i
-40.0000 – 0.0000i
-20.0000 + 0.0000i
-20.0000 – 0.0000i
По отрицательным значениям вещественных
и нулевым значениям мнимых частей собственных чисел можно судить о том, что синтезированная система модального управления объектом с наблюдателем (оценивателем) будет обладать высокой астатической устойчивостью.
Зададимся начальными условиями X(0) для переменных x1(t) и x2(t), определяющими заданную траекторию свободного движения (в отсутствие входного воздействия g(t)) наблюдаемого объекта
X(0) = [0.05, 0.2]',
а также начальными условиями для оценок переменных и , определяющими траекторию свободного движения расширенной (с наблюдателем) системы
.
Для получения численных значений вектора неизмеряемых переменных состояния при измеряемом векторе выхода Y и известном входе G системы и моделирования реакции динамической системы на произвольные входы воспользуемся функцией lsim из инструментария MATLAB, полный синтаксис которой имеет вид
[Y, X] = lsim (SYS, G, T, X0).
Данная функция, наряду с вектором выхода
Y возвращает матрицу X, число строк в которой определяется размерностью массива временных отсчетов T, а число столбцов – числом переменных состояния, описывающих траекторию движения системы.
Результаты
Фрагмент программы, которая составлена в кодах среды MATLAB, позволяющей выполнить расчет
и моделирование системы (12), выполнено с применением инструментария матричной лаборатории:
%Файл "cheest4722.m"
A = [0 1;-2 3]; B = [0; 1]; C = [1 0]; D = 0;
k1 = 398; k2 = 43; % Коэффициенты усиления модального регулятора
K = [k1 k2];
Ap = A-B*K_
% Dn=s^2+80*s+1600
n1 = 83; n2 = 1847; % Коэффициенты усиления наблюдателя (оценивателя)
N = [n1;n2]
H = A-N*C % Матрица динамического наблюдателя (оценивателя)
eig(H_)
t = 0:0.01:1;
g = zeros(size(t)); % Входное воздействие системы
% Составные матрицы расширенной системы (объект – наблюдатель)
Ae = [A,-B*K;N*C,H-B*K]
eig(Ae)
Be = [B;B]; Ce = [C -C];
% Начальные условия для переменных состояния
x0_= [0,0]'; x0 = [0.05,0.2]';
xe0 = [x0; x0_];
% Моделирование временной реакции на произвольные входы
[y,xe] = lsim(Ae, Be, Ce, 0, u, t, xe0)
% График кривой реакции выхода системы на произвольные входы
plot(t, y, 'b'),grid
figure
% Графики кривых реакции системы по каждой переменной состояния и ее оценки
plot(t,xe (:,1),'-.b', t, xe(:,3),'b'),grid
figure
plot(t,xe(:, 2), '-.m', t, xe(:,4),'m'),grid
Согласно синтаксису приведенной выше функции lsim, ниже выведены численные оценки вектора выхода Ye, а также вектора Xe, элементы которого в виде четырех столбцов отражают численные значения переменных состояния x1(t) и x2(t) в порядке их нумерации, а затем в том же порядке значения их оценок.
>> estvar1
y =
0.0500
0.0204
0.0049
-0.0026
-0.0057
-0.0064
-0.0061
-0.0053
-0.0043
-0.0034
-0.0027
-0.0020
..........
-0.0011
-0.0008
-0.0006
-0.0004
-0.0003
-0.0002
-0.0002
-0.0001
-0.0001
-0.0001
-0.0000
-0.0000
-0.0000
xe =
0.0500 0.2000 0 0
0.0513 0.0106 0.0309 0.4386
0.0497 -0.3275 0.0448 0.3361
0.0449 -0.6200 0.0475 0.0774
0.0377 -0.8036 0.0434 -0.1668
0.0292 -0.8766 0.0357 -0.3362
0.0205 -0.8613 0.0266 -0.4230
0.0122 -0.7859 0.0175 -0.4412
0.0049 -0.6762 0.0092 -0.4109
-0.0013 -0.5522 0.0022 -0.3514
-0.0062 -0.4280 -0.0035 -0.2781
-0.0099 -0.3127 -0.0078 -0.2019
-0.0125 -0.2114 -0.0110 -0.1302
-0.0141 -0.1260 -0.0130 -0.0670
-0.0150 -0.0569 -0.0142 -0.0142
-0.0153 -0.0029 -0.0147 0.0278
-0.0152 0.0376 -0.0147 0.0595
........................................
-0.0001 0.0012 -0.0001 0.0012
-0.0001 0.0010 -0.0001 0.0010
-0.0000 0.0009 -0.0000 0.0009
-0.0000 0.0007 -0.0000 0.0007
-0.0000 0.0006 -0.0000 0.0006
-0.0000 0.0005 -0.0000 0.0005
-0.0000 0.0004 -0.0000 0.0004
-0.0000 0.0004 -0.0000 0.0004
-0.0000 0.0003 -0.0000 0.0003
-0.0000 0.0003 -0.0000 0.0003
-0.0000 0.0002 -0.0000 0.0002
-0.0000 0.0002 -0.0000 0.0002
-0.0000 0.0001 -0.0000 0.0001
-0.0000 0.0001 -0.0000 0.0001
На рис. 2 приведены графики траекторий свободного движения (динамики) системы стабилизации судна, определяемые различными начальными условиями для переменной состояния x1(t) (пунктирная кривая) и ее оценки (сплошная кривая), а на рис. 3 аналогичные графики, но по переменной состояния x2(t); на рис. 4 приведен график реакции выхода Ye(t) расширенной на изме-нившиеся начальные условия.
Рис. 2. Заданная (пунктирная) и фактическая (непрерывная) кривые динамики системы
по первой переменной состояния
Fig. 2. Target (dashed) and actual (continuous) curves of system dynamics in terms of the first state variable
Рис. 3. Заданная (пунктирная) и фактическая (непрерывная) кривые динамики системы
по второй переменной состояния
Fig. 3. Target (dashed) and actual (continuous) curves of system dynamics in terms of the second state variable
Рис. 4. Реакция выхода Ye системы управления с оценивателем на произвольные входы
Fig. 4. Response of the output Ye of a control system with an estimator to arbitrary inputs
Обсуждение
Как видно из представленных выше результатов расчета, получены численные значения неизмеряемых переменных x1(t) и x2(t) состояния объекта управления и их оценок . Таким образом, поставленная цель успешно достигнута.
Кроме того, результаты моделирования реакции (динамики) судовой системы стабилизации с оценивателем переменных ее состояния (см. рис. 2 и 3) на различные начальные условия для каждой переменной и ее оценки указывают на асимптотическую сходимость траекторий, описываемых этими переменными и их оценками по завершении переходных процессов.
Как следует также из графика динамики обобщенной системы стабилизации судна (см. рис. 4), время переходного процесса в ней не превышает 0,3 с, что соответствует заданному значению tp.жел = 0,3 с. Полученные графики отражают специфику объекта, из которой следует, что время переходного процесса зависит не только от численных значений параметров модели, но и от правильного выбора собственных чисел матриц модального регулятора и динамического наблюдателя (оценивателя) значений переменных состояния.
Заключение
В работе приводятся результаты исследований авторов, связанные с построением алгоритма наблюдателя (оценивателя) полной размерности
с использованием модели расширенной системы «объект – наблюдатель», что позволяет получить оценки векторов неизмеряемых переменных состояния по доступному измерениям вектору выхода,
в качестве которого может быть принята, например, угловая скорости крена. Корректность предлагаемых технических решений демонстрируется на примерах расчета оптимальных траекторий системы стабилизации судна с динамическим наблюдателем.
Модальный метод синтеза наблюдателя и алгоритм его реализации в приложении к модели судна с заданной структурой позволяют получить простые решения для управления свободными составляющими движения, однозначно определяемыми по совокупности собственных значений матрицы замкнутой системы. Для линейной модели наблюдателя устойчивость гарантируется обоснованным выбором характеристического многочлена второго порядка, корни которого обеспечивают наблюдателю быстродействие в два раза выше быстродействия системы. Метод и алгоритм позволяют синтезировать наблюдатели с требуемым спектром для полного восстановления вектора состояния при любых способах перекладки руля.
Выбор структуры расширенной системы наблюдателя путем введения векторов и позволяет предложить способ мониторинга датчиков угловой скорости и угла дрейфа, являющихся переменными состояния объекта. Наблюдатели фактически являются математическими датчиками информации и могут использоваться как для восстановления неизмеряемых переменных состояния, так и других переменных, измерение которых в судо-вых условиях затруднено.
Предложенный алгоритм численной оценки вектора состояний средствами математического программирования может эффективно применяться на судах для управления технологическими процессами, плохо формализуемыми в математической форме. Алгоритмы оптимизации судовых объектов и систем средствами математического программирования содержат модели динамических объектов в форме уравнений в пространстве состояний, которые образуют систему ограничений на каждом шаге итерационного процесса.