Увлекательное введение в науку о данных, в котором упор делается на критическое мышление, а не на статистические методы. Введение в науку о данных или статистику не должно начинаться с доказательства сложных теорем или запоминания терминов и формул, но именно так устроены многие учебники по статистике. В книге показано, как инструменты критического анализа применяются к проблемам в самых разных областях, включая выборы, гражданские конфликты, преступность, терроризм, финансовые кризисы, здравоохранение, спорт, музыка и космические путешествия.
Введение в науку о данных или статистику не должно начинаться с доказательства сложных теорем или запоминания терминов и формул, но именно так устроены многие учебники по количественному анализу. В отличие от них эта книга посвящена критическому мышлению и концептуальному пониманию; она учит читателей быть вдумчивыми потребителями и аналитиками тех видов информации и аргументов, с которыми они будут сталкиваться на протяжении всей своей жизни. Книга, наполненная реальными примерами, показывает, как инструменты критического анализа применяются к проблемам в самых разных областях, включая выборы, гражданские конфликты, преступность, терроризм, финансовые кризисы, здравоохранение, спорт, музыку и космические путешествия. Прочитав эту книгу, вы узнаете, почему, несмотря на обширное применение данных в современном мире, они никогда не смогут заменить критическое мышление. В конце каждой главы есть упражнения, которые читатели могут выполнить самостоятельно, чтобы убедиться, что они усвоили материал. Некоторые из этих упражнений включают анализ данных, с ним могут справиться читатели и студенты, которые научились (или учатся) использовать статистическое программное обеспечение, такое как Stata или R.
Author(s): Итан Буэно де Мескита, Энтони Фаулер
Publisher: ДМК Пресс
Year: 2023
Language: Russian
Pages: 454
City: М.
Оглавление
Предисловие от издательства
Предисловие
Как построена эта книга
Кому адресована эта книга?
Благодарности
Глава 1. Критическое мышление в эпоху данных
О чем эта глава
Введение
Поучительные истории
Поспешный диагноз Эйба
Гражданское сопротивление
Теория разбитых окон
Дополнение или замена?
Дополнительное чтение и ссылки
Часть I. В поиске общего языка
Глава 2. Корреляция: что это такое и для чего она нужна?
О чем эта глава
Введение
Что такое корреляция?
Факт или корреляция?
Для чего нужна корреляция?
Описание
Прогнозирование
Причинный вывод
Измерение корреляций
Среднее значение, дисперсия и стандартное отклонение
Ковариация
Коэффициент корреляции
Наклон линии регрессии
Совокупности и выборки
Откровенно о линейности
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 3. Причинно-следственная связь: что это такое и для чего она нужна?
О чем эта глава
Введение
Что такое причинно-следственная связь?
Потенциальные исходы и контрфактические сравнения
Зачем нужно знать причинно-следственную связь?
Фундаментальная проблема причинного вывода
Принципиальные вопросы
В чем причина?
Причинность и контрпримеры
Причинность и закон
Может ли причинно-следственная связь распространяться вспять во времени?
Требует ли причинно-следственная связь физической связи?
Причинно-следственная связь не обязательно подразумевает корреляцию
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Часть II. Существует ли взаимосвязь?
Глава 4. Не бывает корреляции без вариаций
О чем эта глава
Введение
Выбор зависимой переменной
Правило 10 000 часов
Деградация молодежи
Уход из средней школы
Атаки смертников
Мир заставляет нас выбирать зависимую переменную
Врачи чаще наблюдают за больными людьми
Анализ постфактум
Катастрофа «Челленджера»
Финансовый кризис 2008 года
Жизненные советы
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 5. Применение регрессии в описании и прогнозировании
О чем эта глава
Введение
Основы регрессии
Линейная регрессия при нелинейных данных
Проблема переобучения
Прогнозирование президентских выборов
Как представляют выводы регрессии
Краткая история регрессии
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 6. Выборки, неопределенность и статистические выводы
О чем эта глава
Введение
Оценка
Почему оценка отличается от оцениваемой величины?
Смещение
Шум
Как получается хороший оцениватель?
Количественная оценка точности
Стандартные ошибки
Маленькие выборки и экстремальные наблюдения
Доверительные интервалы
Статистический вывод и проверка гипотез
Проверка гипотез
Статистическая значимость
Статистический вывод о взаимосвязях
Что, если у нас есть данные для всей совокупности?
Содержательная и статистическая значимость
Социальные сети и голосование
Второй закон о реформе
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 7. Завышение значимости и занижение отчетности
О чем эта глава
Введение
Может ли осьминог быть футбольным экспертом?
Предвзятость публикации
р-хакинг
p-скрининг
Являются ли большинство научных «фактов» ложными?
Экстрасенсорное восприятие
Явка избирателей на голосование
Выявление p-хакинга
Возможные решения проблемы
Уменьшение порога статистической значимости
Корректировка p-значения при многократном тестировании
Не зацикливайтесь на статистической значимости
Предварительная регистрация
Предварительная регистрация схемы испытания лекарств
Повторяемость
Футбол и выборы
Проверка важных и правдоподобных гипотез
Поза власти
За пределами науки
Суперзвезды
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 8. Возврат к среднему значению
О чем эта глава
Введение
Исчезает ли истина?
Фрэнсис Гальтон и возврат к среднему
Возврат к среднему значению не является силой притяжения
Поиск помощи
Работает ли операция на колене?
Возвращение к среднему, эффект плацебо и космическое привыкание
Эффект плацебо
Объяснение космического привыкания
Космическое привыкание и генетика
Убеждения не возвращаются к среднему значению
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Часть III. Является ли связь причинно-следственной?
Глава 9. Почему корреляция и причинно-следственная связь не одно и то же
О чем эта глава
Введение
Чартерные школы
Критический анализ потенциальных исходов
Источники смещения
Искажающие факторы
Обратная причинно-следственная связь
Новый взгляд на правило 10 000 часов
Диетическая газировка
Насколько похожи искажающие факторы и обратная причинность?
Расходы на предвыборную кампанию
Признаки смещения
Контрацепция и ВИЧ
Механизмы или факторы?
Критические размышления о смещении и шуме
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 10. Выявление и ограничение искажающих факторов
О чем эта глава
Введение
Влияние партии на голосование в Конгрессе
Примечание о гетерогенных эффектах воздействия
Анатомия регрессии
Как регрессия ограничивает влияние искажающего фактора?
Контроль и причинно-следственная связь
Вредят ли нам социальные сети?
Чтение таблицы регрессии
Чем искажающий фактор отличается от механизма?
Статистика без волшебства
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 11. Рандомизированные эксперименты
О чем эта глава
Введение
Грудное вскармливание
Рандомизация и причинно-следственный вывод
Оценка и вывод в экспериментах
Стандартные ошибки
Проверка гипотезы
Проблемы, возникающие при экспериментах
Несоблюдение условий и инструментальные переменные
Случайный дисбаланс
Нехватка статистической мощности
Убыль в ходе эксперимента
Взаимное влияние
Естественные эксперименты
Военная служба и будущие доходы
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 12. Модели разрывной регрессии
О чем эта глава
Введение
Реализация метода разрывной регрессии
Какие кандидаты более успешны – радикальные или умеренные?
Непрерывность в пороговой точке
Сохраняется ли непрерывность в разрывных регрессиях для анализа выборов?
Несоблюдение условий и нечеткая разрывная регрессия
Бомбардировки во Вьетнаме
Мотивация и успех
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 13. Метод разности различий
О чем эта глава
Введение
Параллельность трендов
Два объекта и два периода
Безработица и минимальная заработная плата
N объектов и два периода
Вредит ли просмотр телевизора детям?
N объектов и N периодов
Контрацепция и гендерный разрыв в оплате труда
Полезные проверки
Влияет ли поддержка газет на решение по голосованию?
Заразно ли ожирение?
Разность различий как проверка достоверности выводов
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 14. Механизмы причинно-следственных связей
О чем эта глава
Введение
Анализ причинной медиации
Промежуточные результаты
Когнитивно-поведенческая терапия и молодежь из группы риска в Либерии
Независимые теоретические прогнозы
Дискриминируют ли избиратели женщин?
Естественные способы тестирования механизмов
Давление общества и голосование
Косвенное выявление механизма
Скачки цен на сырьевые товары и вооруженные конфликты
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Часть IV. От информации к решению
Глава 15. Как наделить статистику смыслом
О чем эта глава
Введение
Каков правильный масштаб?
Мили на галлон или галлоны на милю ?
Процент или процентный пункт?
Визуальное представление данных
Политические предпочтения и перестройка Юга
Некоторые ключевые правила визуализации данных
От статистики к убеждениям
Правило Байеса
Информация, априорные и апостериорные убеждения
Возвращаясь к целиакии Эйба
Поиск террористов в аэропорту
Правило Байеса и количественный анализ
Ожидаемые затраты и выгоды
Скрининг: часто и точно
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 16. Измерение показателей вашей миссии
О чем эта глава
Введение
Оценка неправильного результата или воздействия
Частичные измерения
Металлодетекторы в аэропортах
Промежуточные результаты
Артериальное давление и сердечные приступы
Плохо определенные миссии
Изменение климата и экономическая продуктивность
Есть ли у вас подходящая выборка?
Внешняя валидность
Недоедание в Индии и Бангладеш
Ограниченная выборка
Поступление в университет
Почему питчеры высшей лиги плохо бьют?
Стратегическая адаптация и изменение отношений
Налоги на свет и окна
Сдвиг в бейсболе
Война с наркотиками
Подведение итогов
Ключевые термины
Упражнения
Дополнительное чтение и ссылки
Глава 17. О пределах возможностей количественной оценки
О чем эта глава
Введение
Принятие решений при ограниченных данных
Анализ затрат и выгод и экологическое регулирование
Использование зубной нити и ношение маски
Использование зубной нити
Ношение маски
Количественные данные и ценности
Как количественные инструменты крадут наши ценности
Алгоритмы и расовые предрассудки в здравоохранении
Как количественная оценка навязывает нам ценности
Научитесь мыслить критически и помогите научиться другим
Упражнения
Дополнительное чтение и ссылки
Предметный указатель