Книга посвящена последовательным методам решения класса задач, к которым относится, например, задача нахождения точки максимума функции, если каждое измеренное значение этой функции содержит случайную ошибку. Некоторые основные процедуры стохастической аппроксимации исследованы с единой точки зрения - с точки зрения теории марковских процессов и мартингалов. Рассмотрены примеры приложения доказанных теорем к некоторым задачам теории оценивания, теории обучения и теории управления, а также к некоторым задачам передачи информации при наличии обратной связи.
Книга рассчитана на студентов, аспирантов, инженеров и научных сотрудников, специализирующихся в области математической статистики, теории случайных процессов и их приложений.
Author(s): М. Б. Невельсон, Р. З. Хасьминский
Publisher: М.
Year: 1972
Language: Russian
Pages: 307
Tags: Математика;Теория вероятностей и математическая статистика;Математическая статистика;
О ГЛАВЛЕН И Е
Предисловие . . . . . . . . . . . . . . 5
В в ед е н и е ................................................................................... 9
Г л а в а 1. Вероятностные основы и мартингалы . . . . . 18
§ 1. В е р о я т н о с т ь .................................................................. 18
§ 2. Случайные в е л и ч и н ы ................................................. 21
§ 3. Условные вероятности и условные математические
о ж и д а н и я ...................................................................... 26
§ 4. Независимость. Произведение м е р ........................ 31
§ 5. Мартингалы и суп ер м а р ти н га лы ............................ 34
Г л а в а 2. Марковские процессы с дискретным временем 40
§ 1. Марковские п р о ц е с с ы ................................................. 40
§ 2. Марковские процессы и супермартиигалы . . . . 44
§ 3. Процесс, определенный р ек ур р ен тн о.................... 46
§ 4. Дискретная модель диф ф узии ................................. 50
§ 5. Выход траекторий из о б л а с т и ................................ 52
§ 6. Ряды из независимых случайных величин . . . . 55
§ 7. Сходимость т р а е к т о р и й ............................................ 58
§ 8. Обучение распознаванию о б р а з о в ........................ 65
Г л а в а 3. Марковские процессы и стохастические уравнения 70
§ 1. Марковские процессы с непрерывным временем 70
§ 2. Стохастическое дифференциальное уравнение. I 75
§ 3. Стохастический и н т е г р а л ........................................ 78
§ 4. Стохастическое дифференциальное уравнение. II 82
§ 5. Ф ормула Ито ............................................................. 85
§ 6. С упермартингалы .......................... ............................ 92
§ 7. Существование решений в ц е л о м ............................ 94
§ 8. Выход из области. Сходимость траекторий . . . 97
Г л а в а 4. Сходимость процедур стохастической аппроксимации. I ...................................................................... 105
§ 1. Процедура Роббинса — М о н р о ................................. 105
§ 2. Процедура Кифера — В ольф ов и ц а........................ 111
§ 3. Непрерывные п р о ц е д у р ы ......................................... 114
§ 4. Сходимость процедуры Роббинса — Монро . . . 118
§ 5. Сходимость процедуры Кифера — Вольфовица 125
Г л а в а 5. Сходимость процедур стохастической аппроксимации. И ...................................................................... 134
§ 1. Предварительные замечания ................................. 134
§ 2. Общие теоремы . . . .................... 136
§ 3. Вспомогательные результаты (непрерывное время) 140
§ 4. Вспомогательные результаты (дискретное время) 149
§ 5. Одномерные п роц ед уры ............................................. 156
Г л а в а 6. Асимптотическая нормальность процедуры Роббинса — Монро . . ............................................. 160
§ 1. Предварительные замечания ................................ 160
§ 2. Асимптотическое поведение р еш ен и й ................... 168
§ 3. Исследование процесса I\ ( t ) .................................... 171
§ 4. Исследование процесса I 2 ( t ) ................................ 178
§ 5. Асимптотическая нормальность (непрерывное
в р е м я ).............................................................................. 183
§ 6. Асимптотическая нормальность (дискретное время) 191
§ 7. Сходимость м о м е н т о в ................................................ 201
Г л а в а 7. Некоторые модификации процедур стохастической ап п рокси м ац и и ................................................. 208
§ 1. Постановка з а д а ч и ........................... 208
§ 2. Общая теорема ........................................................ 210
§ 3. Вспомогательные р е з у л ь т а т ы ................................ 214
§ 4. Теоремы о сходимости и асимптотической нормальности .............................................................................. 216
§ 5. Адаптивные процедуры Роббинса — Монро . . . 219
§ 6. Асимптотическая оптимальность ........................ 225
Г л а в а 8. Рекуррентное оценивание (дискретное время) 231
§ 1. Неравенство Крамера — Рао. Эффективность
оценок . ................................................................. 231
§ 2. Неравенство Крамера — Рао в многомерном случае .................................................................................. 237
§ 3. Оценивание одномерного параметра ................ 241
§ 4. Асимптотически эффективная рекуррентная процедура .......................................................................... 248
§ 5. Оценивание многомерного п а р ам етр а.................... 251
§ 6. Задача оценивания при зависимых наблюдениях 257
Г л а в а 9. Рекуррентное оценивание (непрерывное время) 262
§ 1. Неравенство Крамера — Р а о ................................ 262
§ 2. Применение процедуры Роббинса — М онро. . . 266
§ 3. Наблюдения, зависящие от в р е м е н и .................... 268
§ 4. Некоторые п р и л о ж е н и я ............................................. 270
§ 5. Одна м од и ф и к а ц и я ..................................................... 278
Г л а в а 10. Рекуррентное оценивание при наличии управляющего параметра ............................................. 280
§ 1. Постановка задачи .................................................... 280
§ 2. Асимптотически оптимальный рекуррентный план 283
§ 3. Два примера ............................................................. 287
§ 4. Случай непрерывного в р е м ен и ................................ 291
Примечания .......................................................................... 294
Литература ....................................................................................... 298
Предметный указатель ................................................................... 303
Основные обозначения , .................................................. 304