'

Яковлев Андрей Россия, Москва, профессор МГТУ им. Н. Э. Баумана, академик Международной и Российской инженерных академий К вопросу анализа и оптимизации адаптивно – игровых систем (АИС)

Понравилась презентация – покажи это...





Слайд 0

Яковлев Андрей Россия, Москва, профессор МГТУ им. Н. Э. Баумана, академик Международной и Российской инженерных академий К вопросу анализа и оптимизации адаптивно – игровых систем (АИС)


Слайд 1

Неопределенности сотрудничества и конфликта Неопределенность – недостаточность априорной информации (неполная определенность цели, внешней среды, характеристик стратегии, параметров и структуры объекта управления). Конфликт-явления и ситуации, в которых участвуют две (или более) сторон, имеющие различные интересы и обладающие возможностями применять для достижения целей разнообразные средства и действия. Сотрудничество- деятельность, в которой происходит объединение участников (коалиций) операции для достижения их целей Случайные Неслучайные С неизвестными распределениями С неизвестными параметрами распределения С неизвестным законом распределения Природная неопределенность Поведенческая неопределенность Целевая неопределенность


Слайд 2

Раскрытие неопределенности методами адаптации Адаптивные (обучающиеся) системы –класс систем, который способен с течением времени улучшать свое функционирование. (Цыпкин Яков Залманович) Традиционный адаптивный подход (дискретный алгоритм) опознания: a[n]= a[n-1] + Г[n]F’[n-1]{y[n ] – a[n-1]f(x[n])}f(x[n]), где а[n]- вектор определяемых параметров, Г[n]-квадратная дискретная матрица, элементы которой постоянны или зависят от n, F’{.} – градиент случайного функционала, f(x[n]) – линейные независимые функции, формирующие разделяющую функцию y[n]=aтf[n], известную с точностью до параметра а. Адаптивные системы управления: *Самонастраивающиеся, в тои числе и экстремальные (с адаптацией параметров); *Самоорганизующиеся (с адаптацией структуры); * Самообучающиеся (с адаптацией алгоритмов).


Слайд 3

Игровая модель конфликта Ф ЛПР ( P, I) n n Абстрактная модель n n D = < S, R> = < А, S, Ф, Н, G, Y, F,W, K, P,R R,I>, где n n А - множество целей, n n S - множество стратегий, n n - множество факторов внешней среды, n n Н- - множество операций n n G -множество исходов операции, n n Y- вектор характеристик операций, n n F- множество операторов соответствия «результат -показатель» n n W - множество показателей эффективности решений, n n K- множество критериев эффективности решений, n n Р- множество отношений предпочтения ЛПР, n n I- множество информированности ЛПР. Ф Игра: 1.Кто и как в конфликте участвует? 2. Каковы его исходы? Кто в этих исходах заинтересован и каковы его результаты? Стратегические игры: более одной коалиции Ri, i.>1,2,… Бескоалиционные игры: Rи = Rд. Антагонистические игры: W = - W. Неатагонистические игры: W = - W. R- коалиции интересов и действий,


Слайд 4

Классификация АИС Технические АИС: СУ управления подвижными объектами (морскими, воздушными, космическими); системы управления энергосистемами (атомными и электрическими станциями), телекоммуникациями и т.п. Человеко-машинные АИС: ручного и полуавтоматического управления, автоматизированные и др. Интеллектуальные АИС: управление социально-экономическими системами (формирование концепций, стратегий, системных программ и проектов), управление инвестиционно-инновационной и научной деятельностью (введение в хозяйственный оборот РНТД и интеллектуальной собственности и т.п.), решение международных конфликтов и образование региональных содружеств. Глобальные АИС: мониторинг окружающей среды, анализ глобальных изменений в мире, обеспечение безопасности человека на море и в космосе, прогноз природных и техногенных катастроф, управление межпланетными полетами,


Слайд 5

Концепция адаптивно-игровых систем (АИС) Игровые системы (ИС) Адаптивные системы (АС) Адаптивно-игровые системы (АИС) ИС (теория игр): необходима дополнительная информация о игроках, их коалициях и интересах; новое понимание оптимальности на основе принципа Парето, равновесия Нэша, переговорных процессов (Д. Харшаньи, Р. Зельтон, Р. Ауманн и Т. Шиллинг.) АС (теория адаптации): параметрическая, структурная, алгоритмическая априорная неопределенность; идентификации неопределенностей осуществляется путем использования рабочей информации; достижения целей в процессе функционирования системы (Фельдбаум Алекс. Арон., Цыпкин Я. З., Андреев Н. И., Петров Б. Н.) АИС (инженерная интеграция теорий игр и адаптации): наличие различных типов неопределенностей, частичное раскрытие неопределенностей на основе алгоритмов адаптации (обучения и идентификации), обеспечения получения гарантированных результатов в результате решения игровых задач.


Слайд 6

Блок идентификации Алгоритмы управления, в том числе и адаптивные Органы управления Объект управления Внешняя среда, включающая метасистему Игровые решающие устройства Априорная информация ЭВМ Функциональная схема АИСУ


Слайд 7

Структурная схема АИСУ Данные системы: X0 (q, g) – начальные условия, возмущения-(WС, VС), неопределенные параметры (q, g), игроки и их интересы Внешняя среда X(t) = F(t; x, q, g) + P VС P C(t; q, g) Y(t; q, g) = B (t; q, g)X(t; q, g) + C (t; q, g) WС(t; q, g) X0 (q, g) VС (t; q, g) WС(t; q, g) Основная система управления Z(t) = Ф{t; аи1,…, аиn; аа1,…, аик} Игровые алгоритмы Адаптивные алгоритмы АИС Z(t)


Слайд 8

Системная модель АИСУ S = (F, D) –система, состоящая из регулятора D и объекта управления F, где заданы отображения F = {f: M x V Y}, D = ( d: Y x V M}, и алгоритмы оценивания и управления задаются в традиционной форме: H= {h: T x Y x M Z}, K = {k: T x Z x V M}, где Т – множество моментов времени, М-множество управлений, Н- множество алгоритмов оценивания, К – множество алгоритмов управления, Z- множество оценок состояния системы. V Регулятор с игровым решающим устройством:


Слайд 9

Статистически оптимальная система с ИРУ G(t;gj) G-полезный сигнал; Z- помеха. Все вероятностные характеристики полезного сигнала и помехи известны за исключением дисперсии Dgi полезного сигнала (неизвестны априорные вероятности). Возникает конфликт. Игрок А имеет своими стратегиями параметры аi, сторона В управляет выбором дисперсии gj. Сформулируем матричную антагонистическую игру, характеризуемую матрицей для вероятности невыхода ошибки из заданных допусков при нормальном законе распределения ошибки Рij = Pij(С1<E<C2) = Ф[(С2-me)/De] - Ф [(С2-me)/De] De – среднее квадратическое отклонение ошибки системы. А\В В1 В2 В3 В4 min max А1 0,5 0,5 0,3 0,2 0,2 | Рij| = А2 0,7 0,6 0,4 0,5 0,4 0,4 А3 0,8 0,3 0,3 0,6 0,3 А4 0,7 0,2 0,2 0, 7 0,2 max 0,8 0,6 0,4 0,7 Седловая точка в чистых стратегиях: min 0,4 max min Pij = min max Pij = 0,4-цена игры H(t) + + E(t) W(t1, t2) + Z(t) X(t;gj) Y(t)


Слайд 10

Кооперативные и бескоалиционные ИРУ А В Раij = -Рвij Ра11 Ра12 Ра21 Ра22 Рв11 Рв12 Рв21 Рв22 Дж. Нэш: Любая конечная бескоалиционная игра n лиц имеет хотя бы одну ситуацию равновесия в смешанных стратегиях Кооперативная игра сталкиваемся с коалицией. Кооперативная игра может рассматриваться как бескоалиционная игра. Дж. Харшаньи, Рейнхард Зельдан. Общая теория выбора равновесных ситуаций. – СПб, ЭШ, 2001. Борьба за рынки фирм А и B -10 2 1 -1 -2 -1 1 А1- выбор фирмой А первого рынка; А2-второго рынка. В1- выбор фирмой В второго рынка; В2- второго рынка. Компания В более крупная. Выигрыш А только на разных рянках. A B -2 -1 1


Слайд 11

Системная модель с адаптивным управлением Адаптация- процесс изменения параметров, структуры и алгоритмов системы на основе текущей информации с целью достижения определенного, обычно оптимального состояния Регулятор с адаптивным управлением: Z Т k: Aа x T x Z x V M V h: Aа x T x Y x M Z, аа: Y x N x Z x M Aаk х Aаh M Формирование параметров на основе алгоритмов адаптации


Слайд 12

Системная модель регулятора АИС k: Aаиx T x Z x V M} Z Т h: Aаи x T x Y x M Z}, аи: Y x Т x Z x M Aиk х Aиh M V аа: Y x Т x Z x M Aаk х Aаh ааи: Aиk х Aиh Aаk х Aаh хY x Т x Z x M Aаиk х Aаиh


Слайд 13

АИС на основе фильтра Калмана - Бьюси Вычисление апостериорных вероятностей Pi = Р(qi/t,0), где i=1, 2,…,n (адаптивная часть) Алгоритмы решения игры на основе априорной информации Измеритель У(t)= B X(t) + C W Оценка измеренного сигнала Z(t) Фильтр КБ для qn Фильтр КБ для q2 Фильтр КБ для q1 Сумматор ………… P1 P2 …. Pn X(t)


Слайд 14

Системы полуавтоматического управления (СПУ) СПУ находят эффективное применение в управлении полетом самолетами, вертолетами, космическими кораблями (КК) и орбитальными станциями (ОС). Моделирование систем полуавтоматического управления КК / Авторы: Г. Т. Береговой, А. И. Яковлев, Туманов А. В. и др. // Под редакцией д.т.н. А. И. Яковлева. – М.: Машиностроение, 1986. A. I. Yakovlev. Hybrid complex of the aircraft intellectualized systems simulation at the stage of their research projecting. AIAA-93-3559-CP. Полеты летчиков (космонавтов) показали: Летчик во время полета может решать интеллектуальные задачи. Деятельность летчиков протекает в весьма специфических условиях, что требует специальной системы отбора, обучения, подготовки и тренировки. Конструирование летательных аппаратов и их систем управления требует учета факторов полета. Определяющим фактором повышения эффективности СПУ летательных аппаратов является проведение эффективного моделирования и тренировок летчиков. Важнейшую роль в подготовке к полету космонавтов играет возможность человека адаптироваться и интеллектуально обрабатывать большие объемы информации.


Слайд 15

АИС полуавтоматического управления Внешняя среда (факторы полета, центр управления полетом) Летательный аппарат Интеллектуальная система полуавтоматического управления Датчики и информационные системы Пилот (экипаж) Бортовой вычислительный комплекс Исполнительные органы


Слайд 16

Пример самолетной АИС полуавтоматического управления Датчики состояния летчика Датчики перегрузок Бортовой компьютер Перегрузочный костюм Летчик самолета Информационная система Система регулирования давления перегрузочного костюма, воздействий на летчика Самолет Система управления Внешняя среда


Слайд 17

АИС полуавтоматического управления спуском КК Информационная система, средства наблюдения Пилот-космонавт Бортовой вычислительный комплекс, обеспечивающий реализацию алгоритмов адаптации и игровых решающих устройств Датчики Исполнительные органы Космический корабль Внешняя среда


Слайд 18

Показатели эффективности систем полуавтоматического управления КК Основные группы показателей эффективности АИС ПУ КК Системные Финансовые Медико -биологические Социально-экономические Эргономические Субъективные Информационные Технические Интеллектуальные При выборе лучшей АИС полуавтоматического управления КК возникает необходимость определять не только эффективность достижения целей системой, но и обязательно оценивать эффективность работы летчика-космонавта, его состояние, профессиональную подготовку, интеллектуальные способности и воздействие на него факторов космического полета


Слайд 19

Пример космического тренажера АИС полуавтоматического управления Исходные данные Воздействия на человека -оператора Инфокоммуникационная система моделирования внешней среды, движения КК, операций человека Кабина Дисплей Оператор Управление Информационная система регистрации результатов эксперимента Конструктора-разработчики АИС Медики Специалисты по проведению эксперимента Руководитель


Слайд 20

Схема создания и функционирования Российско – Словенской комиссии по инновациям Российско – Словенской центр по инновациям Российская группа по коммерциализации РНТД МОН РФ МО РС Программа партнерства в инновационной сфере Международный центр сотрудничества Предложения и запросы на РНТД HI -TEC МГТУ им. Н, Э, Баумана Университет Любляны Научные, консалтинговые, образовательные инновационные организации, создающие и реализующие проекты и программы проекты проекты


×

HTML:





Ссылка: