Содержание

След.стр.

От "Эры Трапезникова" к новым временам

Адаптивные и обучающиеся системы

Уже более 50 лет назад теоретики управления понимали, что, как правило, точное описание системы управления недоступно, и неизбежные неопределённости параметров и характера динамики системы приводят к необходимости синтеза управлений в условиях неопределённости. В рассматриваемой ситуации наиболее естественно воспользоваться стратегией адаптивного управления, когда одновременно происходит и уточнение описания системы, и управление ею. Наиболее глубоко идея подобного подхода была воплощена в концепции дуального управления А.А. Фельдбаума. По логике Фельдбаума, управление имеет двойственную природу: с одной стороны, оно является пробным воздействием, предназначенным для изучения управляемой системы, а с другой – решает некоторую задачу оптимизации. Влияние, которое оказала теория дуального управления на современную теорию управления, трудно переоценить. Недаром цикл статей А.А. Фельдбаума, вышедший в 1960–1961 гг., был признан специальной комиссией ИФАК одной из “вех” науки об управлении в XX веке. Однако непосредственное формирование оптимального дуального управления возможно лишь в очень редких случаях, вот почему внимание исследователей сконцентрировалось на применении более простых стратегий – стратегий адаптивного управления. Например, в работах В.Ю. Рутковского и его сотрудников применялся удобный метод эталонной модели, о котором рассказывается в следующем разделе данной главы.

Другая волна исследований по адаптивным и обучающимся системам была связана с тем, что ещё в конце 50-х годов появились (в рамках науки, которая тогда называлась “кибернетика”) работы по распознаванию образов и обучению автоматических систем. В Институте эти работы развивались по двум направлениям. С одной стороны, М.А. Айзерман и его сотрудники Л.И. Розоноэр и Э.М. Браверман разработали модель распознавания, связанную с разделением компактных множеств точек в пространстве образов, и предложили для решения задачи метод потенциальных функций. Эти исследования были позже подытожены в их монографии “Метод потенциальных функций в теории обучения машин”, вышедшей в 1970 г. С другой стороны, А.Я. Лернером и В.Н. Вапником для решения той же задачи распознавания был разработан метод “обобщённого портрета”. Впоследствии этот результат лёг в основу очень глубоких исследований В.Н. Вапника и А.Я. Червоненкиса, связанных с решением проблемы восстановления зависимостей по экспериментальным данным.

Родство задач распознавания и обучения с общими проблемами теории адаптации было подмечено Я.З. Цыпкиным в середине 60-х годов. Он первым понял, что общим математическим аппаратом для их исследования могут служить рекуррентные стохастические алгоритмы (в частности, уже известный в статистике метод стохастической аппроксимации). Оказалось, что в этих рамках могут быть рассмотрены столь разнообразные задачи, как оценивание параметров, идентификация, распознавание образов, стохастическая оптимизация и ряд других базовых задач теории управления. Первоначально эти идеи вызвали острую дискуссию; не сразу было осмыслено их соотношение с классическими статистическими методами и методом потенциальных функций. Позднее, после выхода из печати книг Я.З. Цып`кина “Адаптация и обучение в автоматических системах” (1968) и “Основы теории обучающихся систем” (1970) метод стохастической аппроксимации стал общепризнанным инструментом описания и исследования рекуррентных адаптивных процедур. В работах Я.З. Цыпкина и Б.Т. Поляка 70–80-х годов была строго исследована сходимость и скорость сходимости адаптивных алгоритмов и предложены оптимальные (по скорости сходимости) версии алгоритмов. Те же авторы предложили робастные варианты алгоритмов, сохраняющие работоспособность при недостаточной информации о вероятностных свойствах помех.

 

Дальше

Используются технологии uCoz