![]() |
||
Главная Рефераты по рекламе Рефераты по физике Рефераты по философии Рефераты по финансам Рефераты по химии Рефераты по хозяйственному праву Рефераты по цифровым устройствам Рефераты по экологическому праву Рефераты по экономико-математическому моделированию Рефераты по экономической географии Рефераты по экономической теории Рефераты по этике Рефераты по юриспруденции Рефераты по языковедению Рефераты по юридическим наукам Рефераты по истории Рефераты по компьютерным наукам Рефераты по медицинским наукам Рефераты по финансовым наукам Рефераты по управленческим наукам Психология и педагогика Промышленность производство Биология и химия Языкознание филология Издательское дело и полиграфия Рефераты по краеведению и этнографии Рефераты по религии и мифологии Рефераты по медицине Рефераты по сексологии Рефераты по информатике программированию Краткое содержание произведений |
Реферат: Теории управленияРеферат: Теории управленияУправление - относится к математической движением технической системы. Необходимо написать алгоритм, по которому некоторая система управляется с помощью энергетического воздействия, например : летательный аппарат управляется с помощью рулевой машины. Оказывается создать управление это не очень сложно и это можно сделать интуитивно. Однако создать оптимальное управление чрезвычайно сложно. Теория оптимизации - это наука о наилучших алгоритмах (управления) созданных по некоторому критерию качества Критерий качества - создание (абстрактное) некоторой функции риска, которая должна быть в процессе оптимизации минимизированна (экстремальная задача). Управление бывает оптимальным и квазиоптимальным. Оптимальное - на бумаге, Квазиоптимальное - реальное, стремится к идеальному. Управление бывает : 1) Программное
Программное управление – требуется создать программу, которая дает оптимальную траекторию (заложена в ЭВМ) движения некоторой системы. Пример 1 : Перевод летательного аппарата из точки А в точку В. Критерий - минимизировать расход горючего. Для реализации такой задачи создано две системы - Novstar (США) и Глонасс (Россия), стоимость их очень высока. Пример 2 : Надо создать такую траекторию, чтобы шарик скатился из точки ‘А’ в точку ‘В’ за минимальное время.
В В траектория Управление с помощью отрицательной обратной связи Отрицательной обратной связью - называется передача энергии с выхода на вход некоторой управляемой системой
обратная связь Бывает два вида обратной связи : Положительная ОС и отрицательная ОС. Отрицательная ОС уменьшает входное воздействие на систему пропорционально выходному отклику (демпфирует систему в целом). Автоматика - наука изучающая теорию анализа и синтеза систем управления (корректировка движения, оптимизация переходных процессов) и создание оптимального управления. Радиоавтоматика - наука, изучающая вопросы управления движением радиотехнических систем. Структурная схема системы радиоуправления :
Радиоприемное устройство - устройство выделения сигнала по некоторому радиоканалу. Особенность выделения сигнала состоит в том, что сигнал выделяется на фоне внутренних шумов и помех. Внутренние шумы - тепловые шумы, которые всегда имеют место в радиоприемном устройстве. Таким образом в радиоавтоматике случайные процессы изучаются особо (шум, помеха, сама траектория движения) Устройство управления - как правило - вычислительная сис- тема с приводом и энергетической установкой. Привод - преобразователь механических колебаний в элек- трические. Объект управления - некоторая динамическая система. Динамическая система - система, которая описывается ли- нейными и нелинейными дифферен- циальными уравнениями высокого порядка. Датчик - устройство, которое измеряет положение летатель- ного аппарата в пространстве. Глава 1 Стохастическое управление В случае стохастического управления, управляемые процессы являются случайными (стохастическими). Начальная точка управления А и конечная В не известны. В этом случае сам управляемый процесс описывается стохастическими уравнени- ями, которые, как правило, апроксимируются марковскими процессами. Примеры систем автоматического управления Системы автоматического управления можно описать прибли- женно используя линейные или нелинейные дифференциальные уравнения (детерминированный подход без учета шумов).Это было до 60х годов: все подходы были стохастические линейные и нелинейные дифференциальные уравнения. Пример 1 (детерминированный) Управление движением космического аппарата в грави- тационном поле земли (задача двух тел). В геоцентрической системе координат
З - центр земли (вся ее масса)
r К.А. - космический аппарат
З притяжение :
F3 - сопротивление среды
Третий закон Ньютона :
Если это уравнение спроектировать на оси ко- ординат, то получим следующие три уравнения : (1)
(1)- система линейных дифференциальных уравнений 2-го по- рядка, которая описывает движение космического аппа- рата. Силы U1,U2,U3 - силы управления.
{x(t),y(t),z(t)} Оказывается, что в зависимости от начальных условий и па- раметров K1,K2,K3 траектория r(t) может быть круговая, эллипсоидная, параболическая. Пример 2 : Нелинейная система. Описывается нелинейным дифференциальным уравнением. Генератор колебаний : Можно показать, что процесс
(автоколебания) Если
чивается с течением времени. Если
ется с течением времени до нуля. Глава 2 Математическое описание систем (детерминированная терия) (идеальный случай) Линейные системы, которые описываются дифференциальными уравнениями называются динамическими системами. Если система описывается алгебраическими уравнениями - - это описание состояния равновесия (статические системы) По
определению
(1)- линейное дифференциальное уравнение n-го порядка. Правая часть - это дифференциальное уравнение воз- действия. Если Ly=0 (2) ,то Ly=Px. (2)- однородное дифференциальное уравнение - описывает линейные динамические системы без воздействия на них. Например колебательный контур. Правая часть уравнения (1) описывает воздействие на ли- нейную систему или называется управлением. Ly=x - управление. Если есть часть Px - то это сложное управление, учитыва- ющее скорость, ускорение. Передаточная функция линейной системы От дифференциального уравнения (1) можно перейти к линей- ной системе, т.е. к некоторому четырехполюснику.
Этот четырехполюсник можно создать на элементной базе или смоделировать на ЭВМ. От дифференциального уравнения (1) к W(p) можно перейти двумя путями - используя символический метод и 2-е прео- бразование Лапласа.
Применив символический метод к (1) получим :
Формула (3) представляет собой отношение двух полиномов - описание передаточной функции. Использование преобразования Лапласа
Если мы применим преобразование Лапласа к левой части (1) и
учитывая, что
Если правая часть передаточной функции простейшая -
ная функция будет иметь вид : (5)
тель дроби есть характеристическое уравне- ние. Пример : Дифференциальное уравнение 2-го порядка описы- вается передаточной функцией :
Для нахождения решения дифференциального уравнения снача- ла необходимо решить следующее уравнение :
Известно, что дифференциальное уравнение 2-го порядка имеет решение в виде комплексной экспоненты или действий над ней. (Это зависит от корней характеристического урав- нения). Если корни комплексные, тогда решение будет : (7)
Если
корни ±a
+
jw
решение
будет
(7) и (7)’ - решение в виде нарастающей или затухающей синусоиды, либо обычной синусоиды, если a=0. Устойчивость линейных систем Линейная система полностью описывается передаточной функ- цией, которая представляет собой :
p=s+jw . Эти полиномы получены из дифференциальных урав- нений путем преобразования Лапласа. Ставится проблема: как исследовать систему с помощью W(p) Оказывается, что это проще сделать чем исследовать диффе- ренциальные уравнения. Исследование по W(p) производится с помощью анализа полюсов и нулей. Полюсом называется то значение корня уравнения в знаменателе, при котором Q(p)=0. Количество корней определяется степенью полинома. Если корни
комплексно-сопряженные,
то в точке, где
Q( W(p)=Ґ - полюс. Нулями W(p) называются точки на комплексной плоскости, где полином P(p)=0. Количество нулей определяется порядком поли- нома.
s > 0 полюсы
сопряж.
пара ®
нения). Если корни комплексные, то они сопряженные. Выводы : 1. Если корни характеристического уравнения Q(p) находятся в левой полуплоскости , то система ус-
тойчива.
корней. 2.
Если s
>0
, то решение
будет
Система неустойчива. Расположение нулей определяет корректирующие свойства системы, т.е. оказывают воздействие на переходной процесс Если нули в левой полуплоскости, то такая система называется минимально фазовой. Если нули в правой полуплоскости - нелинейно фазовая система. Если полюсы на мнимой оси, т.е. s=0, то система нахо- дится в колебательном режиме (Система без потерь). Передаточная функция линейной системы на мнимой оси В этом случае после преобразований получим: W(jw)=A(w)+jB(w) - Передаточная функция есть комплексное число. Замечание: Не путать с корнями на мнимой оси. Оказывается очень удобно исследовать W(jw)на мнимой оси не с помощью нулей и полюсов, а с использованием комплек- сной передаточной функции. Комплексная функция : АЧХ
- четная функция:
ФЧХ
- нечетная функция:
АЧХ ФЧХ АЧХ показывает селективность системы по амплитудному спектру. ФЧХ показывает - какой сдвиг фаз получает на выходе фильтра каждая гармоника. Замечание: Известно, что спектр сигнала (по Фурье) удобно представлять в ком- плексной виде, т.е. у спектра есть АЧХ (рас- пределение гармоник по амплитуде от частоты), и ФЧХ (рас- пределение фаз). Выводы: Комплексное представление спектра или передаточ- ной функции W(p) очень удобно радиотехнике. Это позволяет компактно записать АЧХ и ФЧХ. Передаточная функция систем радиоавтоматики
Передаточная функция последовательно соединенных звень- ев
:
лельно соединенных звеньев:
: : : :
Типовые звенья радиоавтоматики 1) Инерционное звено Передаточная функция :
0 w
2) Интегрирующее звено Передаточная функция :
3) Дифференцирующее звено
R L
W(p)=Kp АЧХ: W(w)=Kw
0 w 4) Форсирующее звено
Передаточная функция:
K
АЧХ :
0
0 w 5) Запаздывающее звено АЧХ:
ФЧХ:
j(w)=wt
АЧХ
Запаздывающее звено называется линией задержки, где t=T
-
время запаздывания
ЛЗ. j(w)=wT;
5) Колебательное звено
система ФЧХ 6) Неминимально фазовое звено Передаточная функция: АЧХ
при a=b :
ФЧХ Цифровые системы автоматического управления Задан процесс: Будем рассматривать про-
менты времени. Такой процесс называется с
Существуют два типа процесса с дискретным временем : 1)Процесс с дискретным временем и непрерывным множеством
состояний.
Это означает,
что функция
рывной
( если это случайный
процесс, то
среднем квадратическом). ПЗС
ПЗС - прибор с зарядовой связью
времени) Для таких процессов составляются разностные уравнения :
2) Процесс с дискретным временем и дискретным множеством состояний.
Процесс
2 отличается
от процесса
1 тем, что
вается в цифровом виде - дискретная функция, вся база исследований другая. Квантование идет и во времени и по уровню. Очень часто делается бинарное квантование 0;1. В этом случае аппаратура сильно упрощается. Замечание : 1)
В первом случае
(ПЗС) если y(t)~ ной
процесс
ный. 2)
Оказывается, если число уровней квантования і 8,то их можно отождествить с непрерывными системами. Представление дифференциальных уравнений, описывающих системы автоматического управления конечных разностей (1)
вой производной n - непрерывное время, непрерывное множество состо- яний.
производной .......................................
Если это подставить в непрерывное дифференциальное урав- нение то получим следующее : (2)
Если подставить в (2) разности, то получим : (3)
- разностное уравнение с дискрентным временем. Z -преобразования Аналогичны преобразованию Лапласа. Это очень удобный аппарат для исследования систем с дискретным временем в частотной области. Для этого вместо экспоненты (для упро- щения)
вводится
того, чтобы ввести Z-преобразование используется сле- дующий прием связи непрерывного процесса X(t)и дискретно-
Рассмотрим преобразование Лапласа :
Формально введем новую переменную :
Используя (2) и (3) получим
(4) - называется Z-преобразования, показывает как перейти от функции с дискретным временем (X(n)) к спектру на Z-плоскости.(Оно проще преобразования Лапласа, но имеет те же свойства и для разных дискретных функций имеются специальные таблицы. Устойчивость систем с дискретным временем Системы с непрерывным временем характеризуются передаточ- ной функцией (отношения 2х полиномов), тоже самое в Z-пре образовании,
только переменная
не p
= s
±
jw,
a
устойчива)
плоскость легче преобразуется во внутренность круга Если полюсы передаточной функции находятся во внутреннос- ти круга, то система устойчива, если полюсы находятся на самом круге, то будет колебательный процесс, если вне круга - система неустойчивая.
- устойчивая система - колебательная
- неустойчивая система
n Глава 3 Нелинейные динамические системы Нелинейные динамические системы описываются дифференци- альными уравнениями : (1)
Если линейные дифференциальные уравнения имеют решения (экспоненциальные), то для нелинейных дифференциальных уравнений нет общих решений (за редким исключением), но все реальные динамические системы нелинейны, некоторые из них нельзя линеаризировать, как быть ? Выход : 1) Там,где возможно, делается линеаризация правой части уравнения (1). Линеаризация - замена нелинейной функции на линейную. (2) f(x,t)=A(t)x + B(t) + S(x,t) S(x,t) - мало, им можно принебречь. Если правая часть (1) не зависит от времени, то система называется
автономной
Линеаризация используется,как правило, для проверки устойчивости системы. Для исследования свойств нелиней- ных динамических систем, обычно используются качественные и численные методы решения нелинейных дифференциальных уравнений. Теория нелинейных уравнений часто называется теорией нелинейных колебаний. Пример : Нелинейной динамической системы уравнений Вандер Поля.
Дифференциальное уравнение называется нелинейным, если оно нелинейно относительно разыскиваемой переменной (са- мой переменной или ее производной) (нелинейность из-за квадрата) Требуется найти решение x(t) . Существуют численные методы решения таких дифференциаль- ных уравнений ( численные методы рассматриваются на сет- ке
с шагом
дискретное.
исчисление’. U
Численный метод Эйлера ( численный метод)
Численный метод предназначен для решения не- линейных дифференциальных уравнений. Берется
из апприорных
(начальных
условий) подставляется в правую часть уравнения (5) и т.д. Это называется реккурентностью. Качественная теория решения нелинейных диффе- ренциальных уравнений (в приложении к нелинейным систе- мам) В отличие от численного метода (Метод Эйлера), который дает решение в 1й точке ( не дает траекторию (нужно де- лать 1000 точек, чтобы получить траекторию)). Пуан Каре в 19 веке дал качественную теорию решения диф- ференциальных уравнений, она используется для решения не- линейных дифференциальных уравнений в виде некоторого фа- зового портрета (некоторый графический материал, по ко- торому можно анализировать траекторию движения динамичес- кой системы, т.е. фактически получить решение (1-го из решений). На примере X и Y :
функция
Найти решение означает - найти y=j(x) (2), которая удовлетворяет (1). Пуан Каре развил метод , как найти (2) прямо на плоскости. Метод изоклин Если
f(x,y)=const,
то
f(x,y)=const все производные имеют одно и тоже значение, такая кривая называется изоклиной. (tga=const, a=const) Можно вычислить множество изоклин, это множество дает по- ле направлений. Касательная к этому полю и есть решение, т.о. это есть траектория, которую мы разыскиваем.
уравнения
x
Пример
2:
Величина радиуса - значение производной, любая окружность - изоклина. Решение (касательная к полю направления) - -есть касательная к векторам, расположенная на изоклинах.
- изоклина ¬ решение
x(t) - напряжение на контуре автогенератора, фазовая пе- ременная
Учитывая это имеем : (1)’
(1)’’
(при
Если на входы X и Y осцилографа подать две синусоиды, то получим окружность (фигура Лиссажу), следовательно окруж- ность дает решения синусоидального колебания.
Пусть
Выводы : 1) Динамические системы радиоавтоматики описыва- ются дифференциальными уравнениями 1, 2 и бо- лее высокого порядка ( например: колебатель- ная система(солнечная система, автогенератор, полет космического аппарата в поле притяже- ния земли) описывается диф. уравнением 2-го порядка и выше. 2) Линейные динамические системы описываются ли- нейными диф. уравнениями. Линейная динамичес- кая система составленная из R,L,C - цепочек и активных элементов (транзисторов и т.д.). Любая линейная система путем преобразования Лапласа может быть представлена в виде пере- даточной функции.(Диф. уравнение преобразует- ся по Лапласу). Передаточная функция записы- вается для удобства в комплексном виде, на мнимой оси p=jw можно найти АЧХ и ФЧХ линей- ной системы. Передаточная функция дает инфор- мацию об устойчивости системы. 3) Нелинейные динамические системы описываются нелинейными диф. уравнениями, в этих системах
обязательно
есть нелинейность
вида ( и др.), общих решений и анализа через переда- точную функцию как правило не существует, по- этому есть два метода : а) численный метод (Эйлера и др.) (восстановле- ние по точкам) б) решение диф. уравнений методом фазового порт- рета (качественная теория). (Это наглядный путь выяснения поведения нелинейной системы) Стохастические системы Стохастика - случайность. Определение: Динамическая система называется стохастичес- кой , если она описывается дифференциальным или разностным уравнением, в правую часть которого входит случайный процесс. Такую систему можно представить в виде линейного или не- линейного четырехполюсника, на вход которого подается шум
Стохастическая
x(t)- шум X(t)- выходной процесс Составление модели любой динамической системы должно в реальных условиях(например движение самолета или раке- ты) составляться с помощью предварительных экспериментов над движением реальной системы. (Как правило это диффе- ренциальные или разностные уравнения) и в эти уравнения вставляется некоторый шум, который является случайным процессом. Для дальнейшего составления модели используется иден- тификация модели на основании эксперимента или экспери- ментальных данных. Идентификацией называется оценка коэффициентов разност- ного уравнения и оценка параметров шума: дисперсии, мат. ожидания, ковариации и др. Идентификация служит для того, чтобы реальный процесс и модель были близки.Получив модель мы имеем возможность, используя эту модель, получить близкую к реальной карти- не ситуацию движения системы и создать управление ситуа- цией по нашей модели. Вывод: Модель нужна, чтобы на ЭВМ научиться проектировать управляемые динамические системы для любых такти- ческих ситуаций, известных из практики. Правильно созданная модель - это максимум успеха в проек- тировании эффективной систе- мы. После создания и отработки модели стохастической ди- намической системы создается аппаратура по этой модели, которая проверяется на динамическом стенде. Динамический стенд - 2й этап моделирования реальной ситу- ации уже с аппаратурой. 3й этап состоит в проверке аппаратуры на полигоне.( На борту транспортного или военного средства). Моделирование случайных процессов с дискретным временем (1)
временем.
трудно анализировать, этот про-
процесс обычно аппроксимируется другим процессом, который поз-
му процессу. Такое создание моделей называется - аппроксимацией. Сам аппроксимирующий процесс называется агрегат. Марковская аппроксимация случайных процессов Марковским процессом называется такой процесс, у которого многомерная плотность вероятности факторизуется
в следующем
виде :
значения фазовых переменных в n-мерном пространстве - это многомерная плотность вероятности Двумерная плотность Многомерная ФПВ несет всю ин- вероятности формацию о случчайном процес-
гомерную ФПВ чрезвычайно сло- жно на практике, поэтому час-
проксимациям процесса :
X Аппроксимировать - выбрать такие отсчеты процесса
в моменты времени
независимы, тогда многомерная ФПВ факторизуется следую- щим
образом:
Однако при такой факторизации может потеряться информа- ция о случайном процессе. Есть потеря информации для произвольных отсчетов (кореллированность процесса). Существует 2й способ аппроксимации - марковский способ аппроксимации. Для марковских процессов многомерная ФПВ факторизуется так : (2)
ловная плотность вероятности. Факторизация (2) позволяет сильно упростить математичес- кие выкладки в задачах фильтрации и управления. Определение : Процесс называется марковским, если выпол- няется условие (2) Оказывается, существует очень много генераторов марковс- ких процессов. Мы переходим к их рассмотрению. Процессы авторегрессии Процесс авторегрессии - простой генератор марковского процесса. 1. Односвязная регрессия (3)
1 2 3 4 5 n t а=1
- модель взрыва.
Если
цесс, то легко доказать, что многомерная ФПВ факторизует- ся. а - коэффициент регрессии. Если 0 корреляций
между
Если процесс изменяется очень медленно, то он сильно кор- релирован. Коррелированными процессами очень легко управ- лять и они очень легко анализируются и прогнозируются. Генератор марковского процесса, реализующий авторегрессию 1-го порядка
(1)
i = 0,1,2...n Утверждение (1) : процесс (1) является марковским. Доказательство:
Пусть
ной.
(2)
Пусть
В формуле (2) разность имеет гауссовкий процесс распре- деления
(3)
(4)
(3)
получено из
(4) и (2) заменив
Утверждение доказано. Процесс (1) является марковским. Структурная схема генератора марковского процесса
T
Это структурная схема 4х полюсника, которая реализует генерацию
марковского
случайного
процесса
тор с внешним возбуждением, который возбуждается с по- мощью
независимого
гауссовского
процесса
Сетка дискретного времени: |ѕѕ|ѕѕ|ѕѕ|ѕѕ® t T Утверждение (2) На
выходе 4х полюсника
процесс
ван, с коэффициентом корреляции ‘a’. Доказательство:
Из
(1) имеем
ожидание,
Утверждение доказано. Вывод: На вход схемы рис.1 идет некоррелированный слу-
чайный
процесс
(если процесс гауссовский и некоррелированный, то он независимый, для других процессов это неверно) В природе наиболее часто встречается гауссовский случайный процесс. На выходе схемы - зависимый коррелированный марковский процесс, у которого плотность факторизуется по условным плотностям.
Процесс (1) называется односвязный марковский процесс. Замечание: Процесс (1) получен при дискретизации непре- рывного линейного диф. уравнения 1-го порядка.
ти
На сетке дискретного времени имеем :
стохастическую) авторегрессию. Tc+1=a Авторегрессия 2-го порядка - двухсвязный процесс (1)
Коэффициенты
сии. Уравнение (1) без стохастической правой части легко получается из диф. уравнения 2-го порядка. Уравнение (1) реализует генератор марковского процесса, который называ- ется
двухсвязным
в зависимости
от входного
процесса
двухсвязного процесса На вход генератора действует белый шум. На выходе - двух связный марковский процесс.
В
зависимости
от коэффициентов
личные процессы. Процесс (1) получается из линейного диф. уравнения 2-го порядка, если это диф. уравнение рассмат- ривать на временной сетке (дискретна во времени). Известно, что диф. уравнение 2-го порядка имеет реше- ние в виде комплексной экспоненты, если корни характерис- тического уравнения комплексные, аналогично для некоторых значений
коэффициентов
иметь вид стохастической синусоиды. Генератор двухсвязного марковского процесса
Изменение по синусоиде называется синусоидальный тренд. Марковский процесс 2-го порядка более богатый, чем 1-го, с помощью него можно моделировать более сложные процессы. Авторегрессия m-го порядка (2)
Процесс (2) получен из диф. уравнения m-го порядка путем дискретизации. Это марковский процесс с дискретным време- нем. Этот процесс значительно более информативен, чем ра- нее рассмотренные, ибо он может моделировать сложномоду- лированные случайные процессы. Он может модулировать АМ, ЧМ,
ФМ путем подбора
но идентифицировать очень многие случайные процессы ре- ально существующие на практике, например : хорошо моду- лируется движение летательнвх аппаратов при маневре (рег- рессия m=6ё16), речь, полет космического корабля, посадка на планету.Стохастическая модель удобна потому, что она адекватна реальным ситуациям. Генератор m-связного марковского процесса
Разностные модели на примере модели 2-го порядка (3)
процесса
Разностные модели 3-го порядка (4)
1-я разность характеризует скорость изменения случайного процесса. 2-я разность характеризует ускорение. Модель (3) и (4) очень широко иcпользуется на практи- ке, т.к. здесь почти нет коэффициентов, которые нужно идентифицировать
( а и
по методу наименьших квадратов. Для этого надо иметь ре- альный процесс отсчетов , модель (4) и нужно воспользо- ваться следующей формулой МНК/метод наименьших квадратов/
Суть МНК состоит в следующем : Есть
m-отсчетов
реального
процесса, есть
m-отсчетов
модели, составляется сумма квадратов и подбираются пара- метры
(а, ся это на ЭВМ)(метод перебора) но в авторегрессии m-го порядка. Сделать это очень сложно. Модели скользящего среднего Пусть
М Тогда процесс (1)
называется процессом скользящего среднего. Этот процесс
сформирован
полностью из
шума
путем сдвига и весового суммирования. ( процесс
процесс.
Генератор скользящего среднего для формулы (1)
:
Модель авторегрессии и скользящего среднего
авторегрессия скользящее среднее
случайного сигнала авторегресии Здесь
Между генераторами процесс коррелирован. Многомерная марковская модель (1)
Это самая распространенная модель (2)
В модели (1) шумы характеризуются матрицей ковариации в отличие от авторегрессии, под которой понимается следую- щее:
Элементы
матрицы
шума. Столбики между собой коррелированы. Модель нелинейной регрессии (3)
(4)
В формулах (3)(матричная форма записи),и (4)(скалярная форма записи) индексы при ‘Х’ это не степени, а номера в формуле столбика. (3) и (4) - самая информативная модель , все предыдущие модели получаются как частный случай из этой модели. Нап- ример модель речи линейная и нелинейная, но нелинейная более точная. Глава 4 Динамические системы наблюдаемые на фоне шумов Одномерные динамические системы и фильтр Калмана (1)
Шумы
мех). Задачу фильтрации будем решать методом наименьших квадратов.
Задача фильрации
требует уменьшить
Вводим эмпирический риск : (2)
- Это есть классическая запись метода наименьших квадра- тов . Эмпирический риск назван так потому, что в риск
минимизировать риск, а следовательно уменьшить влияние шумов. Если бы не была придумана модель уравнения (1), тогда невозможно
было бы записать
риск
так
выбрать
Эти
Она
получается
путем дифференцирования
Проделав математические операции получаем одномерный фильтр Калмана. (3)
n=1,2... Комментарий к формуле (3) : Фильтр Калмана сглаживает шумы и оказывается, если шу- мы
(4)
n
®
Ґ
Т.е. среднеквадратическая ошибка будет минимизирована. Если
шумы
няется когда n ® Ґ . Формула (4) является критерием минимума среднеквадрати- ческой ошибки. Фильтр
Калмана дает
оценку процесса
т.е. по критерию минимума среднеквадратической ошибки. Замечание 1 : Оптимальность означает, что не существует другого фильтра, который мог бы дать такие же результаты по среднеквадратической ошибке.(Остальные фильтры дают большую ошибку) Замечание 2 : Фильтр Калмана, в отличие от согласованного фильтра, выделяет форму сигнала наилучшим образом. (Согласованный фильтр обнаруживает сигнал и дает максимум отношения сигнал/шум на выходе и сильно искажает сигнал) Для согласованного фильтра все равно какая форма сигнала на выходе, а фильтр Калмана выдает тот же сигнал, что и на входе. Т.е. согласованный фильтр - для обнаруже- ния сигнала, а фильтр Калмана - для фильтрации от шумов. Замечание 3 : Фильтр Калмана записывается во временной области, а не в частотной, как фильтр Вин- нера. Фильтр Виннера - реализован в частотной области. (5)
K(w) - оптимальная функция передачи, которая мини- мизирует среднеквадратическую ошибку.
случайного процесса).
однако фильтр Калмана проще ре- ализуется на ЭВМ. Поэтому его и
Анализ фильтра Калмана
x(t)- ненаблюдаемый случайный процесс y(t)- наблюдаемый случайный процесс
на использует наблюде- ния и начальные усло-
процесс x(t).
Фильтрация медленных процессов
При а=0.999,
(3).В
этом случае
прошлая и текущая оценки поч- ти одинаковы. В таком фильтре Калмана почти полностью иг- норируются наблюдения. При оценке ситуации фильтр Калмана не доверяет наблюдениям, а доверяет лишь прошлой оценке. Это годится для процессов, которые можно легко предска- зать. Фильтрация быстрых процессов
Тогда
дениям. Это значит, что фильтр Калмана не доверяет прош- лым оценкам. Вывод : Фильтр Калмана минимизирует и флуктуационную и динамическую ошибку. Динамической
ошибкой
называется
разница между
оценкой
истинным
значением
Флуктуационная ошибка - тоже, но за счет шума. При быстром процессе шумы фактически не фильтруются. Невязка
корректирующего члена, который в формуле (3) учитывает ситуацию, которую дают наблюдения. Оценка на шаге ‘n’ равна экстраполированной оценке плюс некоторый корректирующий член, который есть невязка, которая
взята с весом
наблюдения
на шаге ‘n’)
Вес
мику системы (модели). Вывод (по одномерному фильтру Калмана): 1) Фильтр Калмана можно построить в виде реккурентного алгоритма только в том случае, если имеется модель случайного процесса, который он фильтрует. 2) Фильтр Калмана оптимален для реального процесса только в том случае, если реальный процесс близок к модели, которую мы используем. Многомерный фильтр Калмана (1)
- вектор (столбики) A - матрица kґk, H - матрица mґk.
Запишем (1) в скалярной форме. covx=Q, covh=P. Многомерный фильтр Калмана для модели (1) :
где
Г рованная матрица (сопряженная). Траекторные изменения Часто требуется получить оценку траектории летательного аппарата. Летательный аппарат может быть зафиксирован с помощью радиолокатора, либо некоторой навигационной сис- темой. Летательный аппарат рассматривается в некоторой сис- теме координат :
Z динат (см.ниже), то можно точ-
ния всех координат существуют
строятся на базе фильтра Калмана. Y Траекторный фильтр 2-го порядка (1)
Первые две строки (1) - это модель, последняя строка - - наблюдение. Составим многомерный фильтр Калмана , для этого по мо- дели (1) составим многомерную модель.
(2)
Из формулы (2) имеем :
Траекторный фильтр 3-го порядка (4)
последняя строка - наблюдения
H = [1,0,0] ;
Теория нелинейной фильтрации Здесь нелинейные модели записываются в виде : (1)
ная регрессия, нижняя - уравнение наблюдений.
Функция
торый
случайный
процесс
торого случайного процесса, более богатая, чем все преды- дущие модели.
Уравнение
наблюдений
: наблюдается
не сама
которая
функция j(
1)
Требуется найти
оценку
(2)
Формула (2) - критерий минимума среднеквадратической ошибки. 2) Требуется получить реккурентную оценку, такую же как в фильтре Калмана. В чистом виде получить оптимальную оценку нельзя, есть лишь приближенные решения, когда функции f(x) и j(x) - - линеаризуются.
Тейлоровская линеаризация - используется ряд Тейлора, линейная часть (1-я, 2-го члена). ( j(x) и f(x) - имеют непрерывные первые про- изводные).
Разложение
в ряд Тейлора
в точке
где
ся находить. Эти линеаризованные функции подставим в (1) и получим линейную систему : (2)
Коэффициенты a,b,c,d находятся после подстановки.
Будем использовать метод наименьших квадратов для на- хождения
оценок
Выпишем эмпирический риск :
r - функционал. После линеаризации :
производная из r берется легко Продифференцировав и воспользовавшись методом индукции получаем : (3)
Выводы : 1. В связи с тем, что начальная точка разложения в ряд Тейлора функции j(x) была выбрана в точ-
ке
нение (3) получилось как нелинейное и оно по- хоже на уравнение (1) модели. 2.
В отличие от
фильтра Калмана,
в
курентном
его вычислении
входит
‘x’ на первом шаге. Коэффициент усиления можно вычислить заранее за ‘n’ шагов (в фильтре Кал- мана). Но здесь этого сделать нельзя. Сущест- вует так называемая обратная связь. Пример нелинейной фильтрации :
T - период колебания t - период дискретизации t - текущее время
Т Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы, такую, чтобы разница в квадрате
(5)
Перемножим и пренебрежем 2й гармоникой :
(6)
(5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз- ностное уравнение) Структурная схема ФАП
На вход поступает аддитивная смесь. Принцип работы ФАП Измеритель фазы является следящей системой с отрицатель- ной
обратной связью.
Опорное колебание
зой
экстраполяция,
т.е. чем меньше
нее будет оценка. Глава 5 Оптимальное управление дискретными динами- ческими системами Существует два типа детерминированных управляемых процес- сов (детерминированных систем) (1)
времени, которая входит в разностное уравнение динамической системы) Стохастическая управляемая система (2)
а может быть и небелым, например, описываться сколь- зящим
средним ( Критерий оптимального управления Пусть модель (1) или (2) генерирует случайный процесс :
временем, т.е. процесс должен развиваться таким образом, чтобы минимизировать некоторую функцию риска, тогда уп- равление называется оптимальным. Математически это выглядит так :
где f(Ч) - выпуклая функция При движении ракеты по некоторой траектории из точки А в точку В траектория должна быть такой, чтобы минимизиро- вать энергетические затраты на управление. Пример 2 : Существует некоторая эталонная траектория.
цесса к эталону за минимальное время. Это называется оптимизация
x(t) вления.
Метод динамического программирования Имеется детерминированная система : (1)
Принцип Бэлмана - состоит в том, что оптимальное управ- ление ищется с конца в начало (из будущего в прошлое). Задача решается в обратном направлении. (2)
Аналитическое решение задачи по Бэлману Предположим,
что мы отправились
из
брали. Принцип динамического программирования основывает- ся на том, что любой кусок траектории оптимального управ- ления является оптимальным. (3)
Траектория от (k+1) до ‘n’ называется хвостом.
N - последняя точка в управлении
(4)
Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4) оптимальное управление уже выбрано. (5)
k=N,N-1,...,1
Формула (6) называется уравнением Бэлмана (уравне- ние динамического программирования) Выводы: (из уравнения (6)) Уравнение (6) позволяет в реккурентной форме вы- вычислить управление, шаг за шагом, от точки N до 1 (из будущего в прошлое) получить минимиза-
цию
(6) на каждом шаге.
Получить
ния управления фактически получаются методом пе-
ребора.
Оптимальная
траектория
вестна до самого последнего шага. Если задача имеет большую размерность, то сложность при вычислении очень большая. Если вводить динамические системы (т.е. модели), то можно значительно упростить метод нахождения оп- тимального управления. Т.е. получить управление в замкнутом виде (в виде некоторой формулы). Синтез оптимального управления для марковских динамичес- ких систем. (1)
Управление
должно менять
причем управляется динамическая система не по всем коор- динатам.
Динамическая система, сама как таковая, не наблюдается, а наблюдается
j( менная) с шумом. В этом случае говорят, что динамическая система ненаблюдаема напрямую. Для того, чтобы сделать ее наблюдаемой необходимо использовать теорию нелинейной фильтрации (см. предыдущие лекции). В этом случае получаем оценку нелинейной динамической системы в условиях линеаризации по Тейлору : (2)
Синтез оптимального управления используя (2) проведем применив квадратичный критерий качества, причем управле- ние динамической системой будем вести к некоторому этало- ну,
т.е. задано :
Критерий оптимизации (3)
где
||
- норма,
Риск складывается из двух слагаемых : 1-е слагаемое : Это есть квадрат отклонения траектории от эталона. Оно должно быть минимизировано с учетом формулы (2). 2-е слагаемое : Это есть сумма с квадратом самого управ- ления (некоторая сила) должны быть мини- мизированны (так должно быть всегда) Минимизация (3) - это достаточно сложная задача вариаци- онного исчисления (просто взять здесь производную по ‘u’ не удается). Для минимизации (3) используем уравнение Бэлмана :
В формуле (4) минимизируя шаг за шагом получим : (5)
Выводы : (к формуле (5)) Оптимальное управление (5) реализуется с ис- пользованием линейной оценки динамической сис- темы, и это управление вставляется в формулу :
Если упростить критерий и привести его к виду (3’):
то минимизация дает оптимальное управление эталона: (6)
Оптимальное управление пропорционально разности меж- ду экстраполированной оценкой и эталоном, т.о. полу- чим : (7)
Оценка (7) подставляется в (6). Со временем, при ми-
нимизации
в этом случае
сама оценка
эталону. Пример синтеза динамической системы управления частотой генератора Общая постановка : Пусть
имеется некоторая
эталонная
траектория
(1)
Если эталон защищен, то его фильтруют. Имеется управляемая динамическая система :
Управляемая динамическая система - фаза генератора или траектория, которая должна подстроиться под эталон. (2)
им пренебрегают. Пусть (3)
Рассмотрим более сложную модель фазы рассматриваемого ге- нератора. (4)
Считаем, что в (1),(3) уход фазы очень медленный,т.е.
(4’)
В
(4) решение уравнения
относительно
(5)
Выше было доказано, используя уравнение Бэлмана, что : (6)
Структурная схема реализации оптимального управления под- стройки частоты к эталону (4’) (5’)
На выходе - частота подстраиваемого генератора. Подстраиваемый генератор имеет следующий вид:
действует /вырабатывающаяся на прошлом шаге (i-1)/ она должна подстраивать генератор так, чтобы она стремилась к эталону. Для этого : имеется устройство управления, которое воз- действует на контур подстраиваемого генератора так, чтобы (путем
воздействия
на варикап)
Управляемая система с обратной связью: если есть откло- нение
фазы на
тогда
решающее усторойство
дает оценку
тому,
что
ство управления, которое ликвидирует приращение. (правое кольцо называется - кольцо ФАПЧ). Глава 6 Управление нелинейными динамическими систе- мами с помощью отрицательной обратной связи Постановка задачи Определение : Следящим измерителем называется система, осуществляющая оценку некоторого параметра (который является случайным процессом) в следящем режиме. Параметр может иметь следующий физический смысл : а) Угловые координаты некоторого летательного аппарата, которые изменяются во времени. б) Изменение во времени доплеровской частоты. в) Дальность до объекта. Пример : летательный аппарат D(t) - дальность
Y y - угол места
Доплеровская частота : Любая движущаяся система, облучае- мая электромагнитной энергией, из- лучает эту энергию.
Структурная схема следящего измерителя y(t)=S(t,q(t))+h(t))
-
рис.1
D(t) - невязка.
Эта схема была построена в 30х годах инженерами-учеными. Однако сначала 60х годов оказалось, что ее можно синтези- ровать, используя теорию нелинейной фильтрации. На рис.1 представлена схема следящего измерителя, где управление осуществляется с использованием ООС. Эта структура состоит из 3х блоков. 1й блок: - дискриминатор. На вход его подается смесь сиг- нала S(t,q(t))+h(t) (аддитивная смесь), где q(t)
- меняющийся
парметр. Нужно
получить его
оценку
На другой вход дискриминатора подается копия сигнала S(t,q(t)), которая должна повторять сигнал, спрятанный в шумах. Это достигается путем экстраполяции (предсказание) случайного процесса. На входе дискриминатора образуется невязка
:
фильтрации. 2й блок: - фильтр экстраполятор (блок фильтрации). На его вход поступает невязка. 2й блок формирует те- кущую оценку случайного процесса q(t). Это окончательный нелинейный фильтр - расширенный фильтр Калмана. В этом же блоке формируется оценка экстраполяции (см. далее) и эта оценка подается на синтезатор опоры. 3й блок: - формирует копию сигнала. Оценка q(t) формиру-
ется
по следующему
критерию :
- критерий среднеквадратической ошибки. Оптимальная оценка по критерию минимума среднеквадрати- ческой ошибки получается с помощью только лишь нелиней- ной фильтрации. Замечание : Фильтрация нелинейна потому, что невязка фор- мируется нелинейно ( оцениваемый параметр q(t) входит в сигнал нелинейно), S(t,q(t)) - нелинейно. Принцип экстраполяции для задач синтеза следящих измери- телей управляемых с помощью ООС Следящий измеритель отслеживает некоторый (многомерный) параметр
(1)
функция В радиоавтоматике,в непрерывном времени это выглядит так:
А -амплитуда гармонического колебания, которая, например, несет информацию об угловом положении цели. Т - время наблюдения t - время запаздывания, несет информацию о временном по-
y(t)- модуляция сигнала (известна заранее) j(t)- некоторая начальная фаза сигнала, которая несет ин- формацию об угловом положении цели. Либо j(t)- ме- шающий параметр.
Система слежения за q(t) - следящий измеритель. Общий вид записи см. (1). Решение проблемы синтеза следящего измерителя : Пусть
q(t) где
(2)
(3)
Используя (3) модель (2) преобразуется : (4)
h=|1
0 0|
- вектор
3ґ3
,
А - матрица 3ґ3, такая, что получается модель (2). Используя модель (4) видим, что верхнее уравнение линей- ное, а нижнее уравнение нелинейное. Используя теорию не- линеной фильтрации получим оценку :
(5)
(5) - уравнение нелинейной фильтрации. Структурная схема, которая реализует алгоритм следящего измерителя
(
дискриминатор фильтр экстраполятор
опоры
Экстраполяция.a,b,g - фильтры Реализация нелинейного фильтра по формуле (5) несмотря на ее реккурентный характер достаточно сложна для реализации на сигнальных процессорах, поэтому часто используют еще одно упрощение - переходят от векторно-матричной записи нелинейной фильтрации по формуле (5) к скалярной записи. (заметим, что формула (5) реализует следящий измеритель некоторого параметра) a,b,g - фильтры значительно упрощают синтез следящих измерителей. Идея состоит в том, что вместо матричного коэффициента
личины. Проектирование a,b,g - фильтра Модель :
Был введен параметр :
Поскольку мы ввели этот параметр, фильтр получился 3х мерный. Далее вместо фильтра (5) запишем эвристический фильтр: (Эвристика - полуинтуитивное мышление) (6)
abg (7)
Комментарии к (6) и (7) : Справа - невязки, взяты из тео- рии нелинейной фильтрации. Од- нако в (6) экстраполированное значение получается из фор- мулы (7). (7) - это кусок ряда Тейлора. В нелинейной фильтрации экстраполяция получается ав- томатически. А здесь мы ее искусственно создали в формуле (7) , но она очень сильно близка к формуле (5). | Фильтрация | Первое слагаемое в (6) (верхняя строка) есть координаты
|
| Фильтрация | Первое слагаемое во второй строке (6) - есть приращения
|
экстраполяция
полного приращения( | | 3-я формула в (6) - фильтрация второго при- | ращения координаты. | Коэффициенты a,b,g получаются экспериментально.
(8) - метод наименьших квадратов, подбор a,b,g на ЭВМ.
Структурная
схема следящего
измерителя
за параметром
по формулам (6), (7).
Синтез следящего измерителя доплеровской частоты
с
частотой
для повышения помехоустойчивости РАС и для наведения ра- кет. Поскольку цель движется, то меняется a и следова- тельно
и
но следить. Проблема : синтезировать следящий измеритель доплеровской частоты. Приходящий сигнал :
j(t) будем записывать в дискретные моменты времени.
Дискретная модель фаз : (1)
g что
за Dt
не меняется
Синтез цифрового оптимального следящего измерителя доп- леровской частоты. y(t)=Acos(wt+j(t))+h(t) j(t) - фаза, которая содержит доплеровскую частоту
j(t)=
Обычно для реализации цифрового измерителя используется квадратичный канал :
Оптималный рис. 1 нелинейный
синхронизация
После такого преобразования снимается несущая, остается только доплеровская частота. e(t) - низкочастотный шум. Acosj(t),Asinj(t) - НЧ компоненты. На
большей
После цифровой обработки (АЦП) модель записывается : (2)
h
= |1
0|
;
Вектор динамической системы двумерный и динамическая сис- темы тоже двумерная. (3)
Фильтр
(3) дает оцнеку
логично как в a,b,g - фильтрах. Синтез аналого-цифрового следящего измерителя.
Калмана
Синтезатор
Ф-3 - узкополосный фильтр Ф-1,Ф-2 - расстроенная пара фильтров
Ф-1 Дискриминационная
f
Дискриминационная характеристика - это разность фильтров Ф-1
и Ф-2. Она формирует
невязку
(1)
Эта система используется для оценки доплеровской частоты, меняющейся во времени. Это следует из уравнения (1), где нижнее уравнение дает поправку доплеровской частоты за один шаг.Невязка формируется также как в a,b,g - фильтрах. Глава 7 Устойчивость стохастических систем В радиоавтоматике все без исключения системы являются стохастическими, т.е. сама динамическая система описыва- ется стохастическими разностными уравнениями. Наблюдения тоже записываются с учетом шумов. 1) Линейные стохастические системы (1)
с - матрица перехода Устойчивость определяется нормой матрицы ‘c’. Достаточным условием устойчивости (1) является :
(2)
с =| Если условие (2) выполняется, то система всегда бу- дет устойчива. Замечание: В некоторых случаях система может быть устой-
чивой
, если
ляется достаточным, но не необходимым. Пример стохастической системы 1-го порядка: (1)’
Оценка
чива при 0
c>1 мым и достаточным условием устойчивости системы.
Устойчивость нелинейных систем Нелинейная стохастическая система : (3)
Устойчивость нелинейных динамических систем опре- деляется функцией Ляпунова. Определение устойчивости по Ляпунову для детерминирован- ной системы.
Вводится специальная функция, называемая функцией Ляпуно- ва.
Обозначается
:
условиям : 1.
Если x=0,
то
2.
Приращение
функции Ляпунова
во времени
D т.е.
функция должна
быть убывающей:
рают
так:
устойчивости для системы (3) будет следующим:
1)
2)
Анализ качества работы стохастических систем радиоавтома- тики Качество линейных и нелинейных стохастических систем оп- ределяется реальным качеством фильтра. (см. выше) Синтез предполагает, что модель соответствует реальному случайному процессу, который мы фильтруем. В этом случае качество определяется следующим образом : Пример: Одномерный фильтр Калмана.
Фильтр
:
фильтра Калмана
Качество фильтрации определяется адекватностью модели и реального процесса. Как проверить адекватность модели реальному процессу ? Сделать это
где
i Теорема : Процесс тогда и только тогда адекватен модели, когда невязка является белым шумом. Замечание:
Это может случиться
только тогда,
когда
Проблема качества определяется проблемой экстраполяции. |
|
|