Наблюдатель (динамические системы)
Наблюдатель состояния -- это модель, подключенная параллельно к объекту управления и получающая непрерывную информацию об изменениях регулирующего воздействия и регулирующей величины.
При использовании наблюдателя в систему не добавляются новые информационные каналы, только в регуляторе вводится корректирующие устройство, в результате чего образуется новый регулятор, работающий в обычной одноконтурной системе.
Классификация наблюдателей
- Измеряющие:
- Непрямые измерители положения;
- Измерители ошибки ориентирования (адаптивные);
- На основе моделей процессов:
- Неадаптивные
- Адаптивные
- На основе фильтра Кальмана.[1]
Непрямые измерители положения
Эти наблюдатели применяются в бездатчиковых приводах. Для измерения положения ротора они используют магнитную неоднородность свойств двигателя. Например, несимметричность обмоток или неоднородность магнитной проницаемости.
Измерители ошибки ориентирования
Эти наблюдатели применяются в бездатчиковых приводах. Они определяют положение вращающейся системы координат, используя внутренние сигналы системы управления, зависящие от ошибки ее ориентирования. Их можно назвать адаптивными, так как они сводят ошибку ориентирования к нулю. По положению вращающейся системы координат оценивается скорость ротора.
Наблюдатели на основе фильтра Кальмана
Этот наблюдатель представляет собой некоторый цифровой фильтр, алгоритм которого строится с учетом законов математической статистики. Он позволяет восстанавливать неизвестный параметр, минимизирует при этом влияние помех измерения известных величин.
Наблюдатель на основе фильтра Кальмана характеризуется сложностью вычислительного алгоритма и теоретически должен позволять получать высокую точность наблюдения. На практике параметры системы точно не известны и, более того, еще могут и изменяются в процессе работы. Это ограничивает точность и область использования, казалось бы, идеального наблюдателя.[1]
Система
- [math]\displaystyle{ \dot q(t)=Fq(t)+Gy(t)+Hu(t) }[/math] (1)
- [math]\displaystyle{ z(t)=Kq(t)+Ly(t)+Mu(t) }[/math] (2)
является наблюдателем для системы
- [math]\displaystyle{ \dot x(t)=Ax(t)+Bu(t) }[/math] (3),
- [math]\displaystyle{ y(t)=Cx(t) }[/math] (4),
если для каждого начального состояния [math]\displaystyle{ x(t_0) }[/math] системы (3)-(4) существует начальное состояние [math]\displaystyle{ q_0 }[/math] для системы (1)-(2), такое, что равенство [math]\displaystyle{ q(t_0)=q_0 }[/math] приводит к [math]\displaystyle{ z(t)=x(t), t \ge t_0 }[/math] при всех управлениях [math]\displaystyle{ u(t), t \ge t_0 }[/math].
Здесь [math]\displaystyle{ A, B, C, F, G, H, K, L, M }[/math] — матрицы соответствующей размерности.
Если размерность [math]\displaystyle{ q(t) }[/math] равна размерности [math]\displaystyle{ x(t) }[/math] и выполнение условия [math]\displaystyle{ q(t_0)=x(t_0) }[/math] дает [math]\displaystyle{ q(t)=x(t), t \ge t_0 }[/math] при всех управлениях [math]\displaystyle{ u(t), t \ge t_0 }[/math], то система (1) называется наблюдателем полного порядка для системы (3)-(4).
Набор дифференциальных уравнений (3) описывает изменение во времени состояния некоторой системы. [math]\displaystyle{ n }[/math]-мерный вектор [math]\displaystyle{ x(t) }[/math], называемый вектором состояния, описывает состояние этой системы в момент времени [math]\displaystyle{ t }[/math]. [math]\displaystyle{ r }[/math]-мерный вектор [math]\displaystyle{ u(t) }[/math] описывает управляющие воздействия на систему и называется вектором управления или просто управлением.
[math]\displaystyle{ l }[/math]-мерный вектор [math]\displaystyle{ y(t) }[/math] представляет собой линейную комбинацию переменных состояния системы (3), которую мы можем измерить. Обычно [math]\displaystyle{ l\lt n }[/math]. [math]\displaystyle{ y(t) }[/math] называют наблюдаемой переменной.
Теорема 1. Система (1) является наблюдателем полного порядка для системы (3)-(4) тогда и только тогда, когда [math]\displaystyle{ F(t)=A(t)-K(t)C(t) }[/math], [math]\displaystyle{ G(t)=K(t) }[/math], [math]\displaystyle{ H(t)=B(t) }[/math], где [math]\displaystyle{ K(t) }[/math] является произвольной переменной во времени матрицей соответствующей размерности. В результате наблюдатели полного порядка имеют следующую структуру:
- [math]\displaystyle{ \dot q(t)=A(t)q(t)+B(t)u(t)+K(t)[y(t)-C(t)q(t)] }[/math] (5).
Матрица [math]\displaystyle{ K(t) }[/math] называется матрицей коэффициентов усиления наблюдателя. Наблюдатель полного порядка можно также представить в виде
- [math]\displaystyle{ \dot q(t)=[A(t)-K(t)C(t)]q(t)+B(t)u(t)+K(t)y(t) }[/math],
откуда следует, что устойчивость наблюдателя определяется поведением матрицы
- [math]\displaystyle{ A(t)-K(t)C(t) }[/math].
В случае системы с постоянными параметрами, когда все матрицы в постановке задачи являются постоянными, включая матрицу коэффициентов усиления [math]\displaystyle{ K }[/math], устойчивость наблюдателя следует из расположения характеристических чисел матрицы [math]\displaystyle{ A-KC }[/math], называемых полюсами наблюдателя. Наблюдатель будет устойчив, если все его полюса расположены в левой половине комплексной плоскости.
Теорема 2. Рассмотрим наблюдатель полного порядка (5) для системы (3)-(4). Ошибка восстановления
- [math]\displaystyle{ e(t)=x(t)-q(t) }[/math]
удовлетворяет дифференциальному уравнению
- [math]\displaystyle{ \dot e(t)=\left[A(t)-K(t)C(t)\right]e(t) }[/math].
Ошибка восстановления обладает тем свойством, что
- [math]\displaystyle{ e(t) \to 0 }[/math] при [math]\displaystyle{ t \to \infty }[/math]
для всех [math]\displaystyle{ e(t_0) }[/math] тогда и только тогда, когда наблюдатель является асимптотически устойчивым.
Чем дальше в левой половине комплексной полуплоскости удалены полюса наблюдателя, тем быстрее сходится ошибка восстановления к нулю. Это достигается увеличением матрицы коэффициентов усиления [math]\displaystyle{ K }[/math], однако это повышает чувствительность наблюдателя к шумам измерений, которые, возможно, присутствуют в наблюдаемой переменной [math]\displaystyle{ y(t) }[/math].