Стохастическая аппроксимация и рекуррентное оценивание

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

Книга посвящена последовательным методам решения класса задач, к которым относится, например, задача нахождения точки максимума функции, если каждое измеренное значение этой функции содержит случайную ошибку. Некоторые основные процедуры стохастической аппроксимации исследованы с единой точки зрения - с точки зрения теории марковских процессов и мартингалов. Рассмотрены примеры приложения доказанных теорем к некоторым задачам теории оценивания, теории обучения и теории управления, а также к некоторым задачам передачи информации при наличии обратной связи. Книга рассчитана на студентов, аспирантов, инженеров и научных сотрудников, специализирующихся в области математической статистики, теории случайных процессов и их приложений.

Author(s): М. Б. Невельсон, Р. З. Хасьминский
Publisher: М.
Year: 1972

Language: Russian
Pages: 307
Tags: Математика;Теория вероятностей и математическая статистика;Математическая статистика;

О ГЛАВЛЕН И Е
Предисловие . . . . . . . . . . . . . . 5
В в ед е н и е ................................................................................... 9
Г л а в а 1. Вероятностные основы и мартингалы . . . . . 18
§ 1. В е р о я т н о с т ь .................................................................. 18
§ 2. Случайные в е л и ч и н ы ................................................. 21
§ 3. Условные вероятности и условные математические
о ж и д а н и я ...................................................................... 26
§ 4. Независимость. Произведение м е р ........................ 31
§ 5. Мартингалы и суп ер м а р ти н га лы ............................ 34
Г л а в а 2. Марковские процессы с дискретным временем 40
§ 1. Марковские п р о ц е с с ы ................................................. 40
§ 2. Марковские процессы и супермартиигалы . . . . 44
§ 3. Процесс, определенный р ек ур р ен тн о.................... 46
§ 4. Дискретная модель диф ф узии ................................. 50
§ 5. Выход траекторий из о б л а с т и ................................ 52
§ 6. Ряды из независимых случайных величин . . . . 55
§ 7. Сходимость т р а е к т о р и й ............................................ 58
§ 8. Обучение распознаванию о б р а з о в ........................ 65
Г л а в а 3. Марковские процессы и стохастические уравнения 70
§ 1. Марковские процессы с непрерывным временем 70
§ 2. Стохастическое дифференциальное уравнение. I 75
§ 3. Стохастический и н т е г р а л ........................................ 78
§ 4. Стохастическое дифференциальное уравнение. II 82
§ 5. Ф ормула Ито ............................................................. 85
§ 6. С упермартингалы .......................... ............................ 92
§ 7. Существование решений в ц е л о м ............................ 94
§ 8. Выход из области. Сходимость траекторий . . . 97
Г л а в а 4. Сходимость процедур стохастической аппроксимации. I ...................................................................... 105
§ 1. Процедура Роббинса — М о н р о ................................. 105
§ 2. Процедура Кифера — В ольф ов и ц а........................ 111
§ 3. Непрерывные п р о ц е д у р ы ......................................... 114
§ 4. Сходимость процедуры Роббинса — Монро . . . 118
§ 5. Сходимость процедуры Кифера — Вольфовица 125
Г л а в а 5. Сходимость процедур стохастической аппроксимации. И ...................................................................... 134
§ 1. Предварительные замечания ................................. 134
§ 2. Общие теоремы . . . .................... 136
§ 3. Вспомогательные результаты (непрерывное время) 140
§ 4. Вспомогательные результаты (дискретное время) 149
§ 5. Одномерные п роц ед уры ............................................. 156
Г л а в а 6. Асимптотическая нормальность процедуры Роббинса — Монро . . ............................................. 160
§ 1. Предварительные замечания ................................ 160
§ 2. Асимптотическое поведение р еш ен и й ................... 168
§ 3. Исследование процесса I\ ( t ) .................................... 171
§ 4. Исследование процесса I 2 ( t ) ................................ 178
§ 5. Асимптотическая нормальность (непрерывное
в р е м я ).............................................................................. 183
§ 6. Асимптотическая нормальность (дискретное время) 191
§ 7. Сходимость м о м е н т о в ................................................ 201
Г л а в а 7. Некоторые модификации процедур стохастической ап п рокси м ац и и ................................................. 208
§ 1. Постановка з а д а ч и ........................... 208
§ 2. Общая теорема ........................................................ 210
§ 3. Вспомогательные р е з у л ь т а т ы ................................ 214
§ 4. Теоремы о сходимости и асимптотической нормальности .............................................................................. 216
§ 5. Адаптивные процедуры Роббинса — Монро . . . 219
§ 6. Асимптотическая оптимальность ........................ 225
Г л а в а 8. Рекуррентное оценивание (дискретное время) 231
§ 1. Неравенство Крамера — Рао. Эффективность
оценок . ................................................................. 231
§ 2. Неравенство Крамера — Рао в многомерном случае .................................................................................. 237
§ 3. Оценивание одномерного параметра ................ 241
§ 4. Асимптотически эффективная рекуррентная процедура .......................................................................... 248
§ 5. Оценивание многомерного п а р ам етр а.................... 251
§ 6. Задача оценивания при зависимых наблюдениях 257
Г л а в а 9. Рекуррентное оценивание (непрерывное время) 262
§ 1. Неравенство Крамера — Р а о ................................ 262
§ 2. Применение процедуры Роббинса — М онро. . . 266
§ 3. Наблюдения, зависящие от в р е м е н и .................... 268
§ 4. Некоторые п р и л о ж е н и я ............................................. 270
§ 5. Одна м од и ф и к а ц и я ..................................................... 278
Г л а в а 10. Рекуррентное оценивание при наличии управляющего параметра ............................................. 280
§ 1. Постановка задачи .................................................... 280
§ 2. Асимптотически оптимальный рекуррентный план 283
§ 3. Два примера ............................................................. 287
§ 4. Случай непрерывного в р е м ен и ................................ 291
Примечания .......................................................................... 294
Литература ....................................................................................... 298
Предметный указатель ................................................................... 303
Основные обозначения , .................................................. 304