Регрессия: теория и практика. C примерами на R и Stan

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

В большинстве учебников по регрессии основное внимание уделяется теории и простейшим примерам. Однако настоящие задачи прикладной статистики сложнее и многограннее. Эта книга не о теории регрессии — а об использовании ее для решения реальных задач сравнения, оценки, предсказания и причинного вывода. Книга обеспечивает плавный переход к логистической регрессии и обобщенным линейным моделям. Вместо вывода формул основное внимание уделяется практическим вычислениям в средах R и Stan, а исходный код доступен для скачивания. Издание предназначено широкому кругу специалистов по анализу и обработке данных, а также может служить учебником для студентов технических вузов.

Author(s): Эндрю Гельман, Дженнифер Хилл, Аки Вехтари
Edition: 1
Publisher: ДМК Пресс
Year: 2022

Language: Russian
Commentary: Vector PDF
Pages: 748
City: М.
Tags: Regression; Bayesian Inference; Predictive Models; Statistics; Linear Regression; Logistic Regression; Simulation; Probability Theory; Linear Models; Causality; Statistical Inference; Sampling; Data Imputation; R

Предисловие
Благодарности
Краткое содержание книги
Более увлекательные названия глав
Скачивание исходного кода примеров
Максимально эффективное использование книги
В помощь преподавателю: возможная структура курсов
Типографские соглашения, принятые в книге
Отзывы и пожелания
Список опечаток
Нарушение авторских прав
Часть I. Основы
Глава 1
Обзор темы и знакомство с регрессией
1.1. Три задачи статистики
1.2. Зачем изучать регрессию?
1.3. Несколько примеров регрессии
1.4. Проблемы построения и интерпретации регрессий
1.5. Классический и байесовский вывод
1.6. Вычисление наименьших квадратов и байесовской регрессии
1.7. Упражнения
Глава 2
Данные и показатели
2.1. Проверка происхождения данных
2.2. Достоверность и надежность
2.3. Все графики служат для сравнения
2.4. Данные и корректировка: тенденции в уровнях смертности
2.5. Упражнения
Глава 3
Обзор основных методов математики и теории вероятностей
3.1. Средневзвешенные значения
3.2. Векторы и матрицы
3.3. Построение линии
3.4. Экспоненциальный и степенной рост и спад, логарифмические отношения
3.5. Распределения вероятностей
3.6. Вероятностное моделирование
3.7. Упражнения
Глава 4
Статистический вывод
4.1. Выборочные распределения и генеративные модели
4.2. Оценки, стандартные ошибки и доверительные интервалы
4.3. Предвзятость и немоделируемая погрешность
4.4. Статистическая значимость, проверка гипотез и статистические ошибки
4.5. Проблемы с концепцией статистической значимости
4.6. Пример проверки гипотезы: 55 000 жителей нуждаются в вашей помощи!
4.7. Выход за рамки проверки гипотез
4.8. Упражнения
Глава 5
Моделирование случайных величин
5.1. Моделирование дискретных вероятностей
5.2. Моделирование непрерывных и смешанных дискретно-непрерывных вероятностей
5.3. Вычисление сводных показателей моделей с использованием среднего и среднего абсолютного отклонения
5.4. Моделирование выборочного распределения с помощью бутстрапа
5.5. Моделирование имитационных данных как образ жизни
5.6. Упражнения
Часть II. Линейная регрессия
Глава 6
Основы регрессионного моделирования
6.1. Регрессионные модели
6.2. Подгонка простой регрессии к смоделированным данным
6.3. Интерпретируйте коэффициенты как сравнения, а не как эффекты
6.4. Историческое происхождение регрессии
6.5. Парадокс регрессии к среднему
6.6. Упражнения
Глава 7
Линейная регрессия с одним предиктором
7.1. Пример: прогнозирование итога президентских выборов по экономической ситуации
7.2. Проверка подгонки модели с помощью моделирования данных
7.3. Сравнения как частный случай регрессионных моделей
7.4. Упражнения
Глава 8
Подгонка регрессионных моделей
8.1. Наименьшие квадраты, максимальное правдоподобие и байесовский вывод
8.2. Влияние отдельных точек в подогнанной регрессии
8.3. Наклон линии в методе наименьших квадратов как средневзвешенное значение наклонов пар
8.4. Сравнение подгоночных функций lm и stan_glm
8.5. Упражнения
Глава 9
Прогнозирование и байесовский вывод
9.1. Распространение погрешности вывода с помощью апостериорного моделирования
9.2. Прогноз и погрешность: predict, posterior_linpred и posterior_predict
9.3. Априорная информация и байесовский синтез
9.4. Пример байесовского вывода: соотношение привлекательности и пола
9.5. Равномерные, малоинформативные и информативные априорные значения в регрессии
9.6. Упражнения
Глава 10
Линейная регрессия с несколькими предикторами
10.1. Добавление предикторов в модель
10.2. Интерпретация коэффициентов регрессии
10.3. Взаимодействия
10.4. Индикаторные переменные
10.5. Построение плана парного и группового эксперимента как задача регрессии
10.6. Погрешность прогнозирования выборов в Конгресс
10.7. Математические обозначения и статистический вывод
10.8. Взвешенная регрессия
10.9. Подгонка одной модели ко многим наборам данных
10.10. Упражнения
Глава 11
Предположения, диагностика и оценка модели
11.1. Предположения регрессионного анализа
11.2. Построение графика данных и подогнанной модели
11.3. Графики остатков
11.4. Сравнение данных с репликациями из подогнанной модели
11.5. Прогнозное моделирование для проверки подгонки модели временного ряда
11.6. Остаточное стандартное отклонение σ и объясненная дисперсия R2
11.7. Внешняя валидация: проверка подогнанной модели на новых данных
11.8. Перекрестная проверка
11.9. Упражнения
Глава 12
Регрессия и преобразования данных
12.1. Линейные преобразования
12.2. Центрирование и стандартизация моделей с взаимодействиями
12.3. Корреляция и регрессия к среднему
12.4. Логарифмические преобразования
12.5. Другие преобразования
12.6. Создание и сравнение регрессионных моделей для прогнозирования
12.7. Модели с большим количеством предикторов
12.8. Упражнения
Часть III. Обобщенные линейные модели
Глава 13
Логистическая регрессия
13.1. Логистическая регрессия с одним предиктором
13.2. Интерпретация коэффициентов логистической регрессии и правило деления на 4
13.3. Прогнозы и сравнения
13.4. Интерпретация регрессии через скрытые данные
13.5. Максимальное правдоподобие и байесовский вывод для логистической регрессии
13.6. Перекрестная проверка и логарифмическая оценка для логистической регрессии
13.7. Построение модели логистической регрессии: колодцы в Бангладеш
13.8. Упражнения
Глава 14
Продолжаем работу с логистической регрессией
14.1. Графическое представление логистической регрессии и двоичных данных
14.2. Логистическая регрессия с взаимодействиями
14.3. Прогностическое извлечение имитационных данных
14.4. Средние прогностические сравнения по шкале вероятности
14.5. Остатки регрессии дискретных данных
14.6. Идентификация и разделение
14.7. Упражнения
Глава 15
Другие обобщенные линейные модели
15.1. Определение и обозначения
15.2. Регрессия Пуассона и отрицательная биномиальная регрессия
15.3. Логистически-биномиальная модель
15.4. Пробит-регрессия: нормально распределенные скрытые данные
15.5. Упорядоченная и неупорядоченная категориальная регрессия
15.6. Робастная регрессия с использованием t-модели
15.7. Модели конструктивного выбора
15.8. Выходим за рамки обобщенных линейных моделей
15.9. Упражнения
Часть IV. До и после подгонки регрессии
Глава 16
План исследования и размер выборки
16.1. Проблема статистической мощности
16.2. Общие принципы разработки исследования на примере оценки долей
16.3. Размер выборки и расчет плана для непрерывных результатов
16.4. Взаимодействия труднее оценить, чем основные эффекты
16.5. Расчет эксперимента после сбора данных
16.6. Анализ эксперимента с использованием имитационных данных
16.7. Упражнения
Глава 17
Постстратификация и внедрение недостающих данных
17.1. Постстратификация: использование регрессии для обобщения на новую популяцию
17.2. Генерация имитационных данных для регрессии и постстратификации
17.3. Моделирование недостающих данных
17.4. Простые подходы к работе с отсутствующими данными
17.5. Что такое множественная подстановка?
17.6. Неисключающие модели отсутствующих данных
17.7. Упражнения
Часть V. Причинный вывод
Глава 18
Причинный вывод и рандомизированные эксперименты
18.1. Основы причинного вывода
18.2. Средние причинные эффекты
18.3. Рандомизированные эксперименты
18.4. Распределения выборки, распределения рандомизации и систематическая ошибка в оценке
18.5. Использование дополнительной информации при планировании экспериментов
18.6. Свойства, допущения и ограничения рандомизированных экспериментов
18.7. Упражнения
Глава 19
Причинный вывод с использованием регрессии по переменной воздействия
19.1. Ковариаты до воздействия, методы воздействия и потенциальные результаты
19.2. Пример: эффект от показа детям образовательного телешоу
19.3. Использование предикторов, известных до воздействия
19.4. Различные эффекты воздействия, взаимодействие и постстратификация
19.5. Проблемы интерпретации коэффициентов регрессии как эффектов воздействия
19.6. Не применяйте для корректировки модели вторичные переменные
19.7. Промежуточные результаты и причинно-следственные связи
19.8. Упражнения
Глава 20
Наблюдательные исследования со всеми предполагаемыми искажающими факторами
20.1. Проблема причинного вывода
20.2. Использование регрессии для оценки причинного эффекта по данным наблюдений
20.3. Допущение о неведении при назначении воздействия в наблюдательном исследовании
20.4. Дисбаланс и недостаточное перекрытие
20.5. Пример: оценка программы по воспитанию детей
20.6. Подклассификация и средние эффекты воздействия
20.7. Сопоставление меры склонности в примере ухода за детьми
20.8. Реструктуризация для создания сбалансированных экспериментальных и контрольных групп
20.9. Дополнительные соображения относительно наблюдательных исследований
20.10. Упражнения
Глава 21
Дополнительные соображения о причинном выводе
21.1. Косвенная оценка причинно-следственных связей с использованием инструментальных переменных
21.2. Инструментальные переменные в регрессионном подходе
21.3. Разрывная регрессия: известный механизм назначения, но без перекрытия
21.4. Идентификация с использованием различий внутри или между группами
21.5. Причины следствий и следствия причин
21.6. Упражнения
Часть VI. Что дальше?
Глава 22
Расширенная регрессия и многоуровневые модели
22.1. Представление моделей в наиболее обобщенном виде
22.2. Неполные данные
22.3. Коррелированные ошибки и многомерные модели
22.4. Регуляризация моделей со многими предикторами
22.5. Многоуровневые, или иерархические, модели
22.6. Нелинейные модели – демонстрация с использованием Stan
22.7. Непараметрическая регрессия и машинное обучение
22.8. Вычислительная эффективность
22.9. Упражнения
Приложение A
Вычисления в R
A.1. Загрузка и установка R и Stan
A.2. Скачивание данных и кода примеров
А.3. Основы
A.4. Чтение, запись и просмотр данных
А.5. Создание графиков
A.6. Работа с неупорядоченными данными
A.7. Основы программирования на R
A.8. Работа с объектами rstanarm
Приложение B
10 кратких советов по регрессионному моделированию
B.1. Не забывайте о вариации и репликации
B.2. Забудьте о статистической значимости
B.3. Изображайте на графике только релевантные данные
B.4. Интерпретируйте коэффициенты регрессии как сравнения
B.5. Изучайте методы статистики при помощи симуляции данных
B.6. Подгоняйте много моделей
B.7. Настройте вычислительную часть рабочего процесса
B.8. Используйте преобразования
B.9. Делайте целенаправленные выводы о причинно-следственных связях
B.10. Изучайте методы на живых примерах
Предметный указатель