Статистика в рисунках

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

Статистика в наши дни стала незаменимой наукой в области не только естественных, но и общественных дисциплин. В этой книге рассказывается о видах статистики, рассматриваются основные понятия, описываются различные методы анализа данных. Множество графиков, таблиц и иллюстраций дополняет и упрощает изучение теории. Для выполнения тех видов анализа, которые невозможно провести с помощью программ табличных вычислений, приведены способы, основанные на бесплатной программе R. В конце собраны справочные материалы, к которым можно обращаться при выполнении собственных расчетов. Издание предназначено для студентов технических вузов и тех, кто хочет ознакомиться с основами статистического анализа.

Author(s): Курихара Синъити, Маруяма Ацуси
Edition: 1
Publisher: ДМК Пресс
Year: 2021

Language: Russian
Commentary: Vector PDF
Pages: 304
City: М.
Tags: Regression; Popular Science; Big Data; Bayesian Inference; R; Statistics; Excel; Probability Theory; Hypothesis Testing; Statistical Inference; Nonparametric Models; Statistical Samples

Статистика в рисунках_обложка
Статистика в рисунках_165х235.pdf
Предисловие
Пролог. Что такое статистика?
Что такое статистика?
Возможности статистики
Глава 1. Описательная статистика
Разнообразные средние
Разброс данных ①. Квантиль и дисперсия
Разброс данных ②. Коэффициент вариации
Связь переменных ①. Коэффициент корреляции
Связь переменных ②. Ранговая корреляция
Глава 2. Распределения вероятностей
Вероятность и распределение вероятностей
Распределение с равными вероятностями. Равномерное распределение
Распределение при подбрасывании монеты. Биномиальное распределение
Распределение в виде подвешенного колокола. Нормальное распределение
Безразмерное распределение. Cтандартное нормальное распределение
Узнаем позиции данных. Интервал сигма
Форма распределения. Асимметрия и эксцесс
Распределение вероятности редких событий. Распределение Пуассона
Несколько независимых случайных величин. Распределение хи-квадрат (χ2)
Отношение распределений хи-квадрат. Распределение Фишера (F-распределение)
Распределение, используемое вместо нормального. Распределение Стьюдента (t-распределение)
Глава 3. Статистический вывод
Определяем особенности генеральной совокупности по выборке. Статистический вывод
Умело угадываем статистический параметр. Несмещенная оценка
Неограниченное число данных. Число степеней свободы
Распределение выборочных статистик ①. Распределение средних
Распределение выборочных статистик ②. Распределение доли
Распределение выборочных статистик ③. Распределение дисперсии
Распределение выборочных статистик ④. Распределение коэффициента корреляции
Смещение от истинного значения. Систематическая ошибка и случайная ошибка
Две теоремы о выборочном среднем. Закон больших чисел и центральная предельная теорема
Глава 4. Оценка доверительного интервала
Расширенная оценка ①. Доверительный интервал математического ожидания генеральной совокупности
Расширенная оценка ②. Доверительный интервал доли в генеральной совокупности
Расширенная оценка ③. Доверительный интервал дисперсии генеральной совокупности
Расширенная оценка ④. Доверительный интервал коэффициента корреляции генеральной совокупности
Оцениваем статистический параметр путем моделирования. Бутстрэп-метод
Глава 5. Проверка статистических гипотез
Делаем вывод о наличии разницы. Проверка статистической гипотезы
Две статистические гипотезы. Нулевая гипотеза и альтернативная гипотеза
Порядок проверки статистической гипотезы
Проверка гипотезы о равенстве выборочного среднего определенному значению (математическому ожиданию генеральной совокупности)
Два типа ошибок при проверке статистических гипотез. Ошибки 1-го рода и ошибки 2-го рода
Проверка гипотезы о равенстве долей признака в выборке определенному значению (доле в генеральной совокупности)
Проверка гипотезы о равенстве выборочной дисперсии определенному значению (дисперсии генеральной совокупности)
Действительно ли имеется корреляция? Проверка гипотезы о некоррелированности
Проверка гипотезы о разности средних ①. Случай двух непарных групп
Проверка гипотезы о разности средних ②. Случай двух парных групп
Проверка гипотезы о разнице долей. Случай двух непарных групп
Доказываем не меньшую эффективность. Испытания не меньшей эффективности
Глава 6. Дисперсионный анализ и множественное сравнение
Проверяем эффекты с помощью эксперимента. Однофакторный дисперсионный анализ
Проверка однородности дисперсий множества групп. Критерий Бартлетта
Учитываем межэкземплярную неоднородность. Парный однофакторный дисперсионный анализ
Находим эффекты взаимодействия. Двухфакторный дисперсионный анализ
Повторять проверку нельзя. Множественное сравнение
Проверка, допускающая повторение ①. Метод Бонферрони и метод Шеффе
Проверка, допускающая повторение ②. Метод Тьюки и метод Тьюки–Крамера
Проверка, допускающая повторение ③. Метод Даннетта
Глава 7. Непараметрические методы
Проверка, не зависящая от распределения. Непараметрические методы
Проверка качественных данных. Проверка независимости (критерий χ2 Пирсона)
Проверка таблиц сопряженности 2×2. Точный критерий Фишера
Проверка ранговых данных двух непарных групп. U-критерий Манна–Уитни
Проверка ранговых данных двух парных групп. Критерий знаков
Непараметрическая проверка числовых данных двух парных групп. Критерий знаковых рангов Уилкоксона
Проверка ранговых данных множества непарных групп. Критерий Краскела–Уоллиса
Проверка ранговых данных множества парных групп. Критерий Фридмана
Глава 8. Планирование эксперимента
Три основных принципа Фишера ①. Повторение
Три основных принципа Фишера ②. Рандомизация
Три основных принципа Фишера ③. Локальный контроль
Различные методы упорядочения данных в эксперименте
Уменьшаем число проводимых экспериментов. Ортогональный план
Ортогональный план на практике ①. Проектирование качества (проектирование параметров)
Ортогональный план на практике ②. Совместный анализ
Задание размера выборки. Анализ статистической мощности
Глава 9. Регрессионный анализ
Ищем связи причин и результатов. Регрессионный анализ
Применяем к данным числовую формулу. Метод наименьших квадратов
Оцениваем точность линии регрессии. Коэффициент смешанной корреляции
Проверяем наклон линии регрессии. t-критерий
Проверяем правильность анализа. Анализ остатков
Регрессионный анализ при наличии нескольких влияющих переменных. Множественный регрессионный анализ
Взаимозависимость, возникающая между влияющими переменными. Мультиколлинеарность
Выбираем эффективные влияющие переменные. Методы выбора переменных
Переменные, объясняющие качественные различия ①. Фиктивная переменная сдвига
Переменные, объясняющие качественные различия ②. Фиктивная переменная наклона
Регрессионный анализ с бинарными переменными. Пробит-анализ
Анализируем время до наступления события ①. Кривая выживания
Анализируем время до наступления события ②. Сравнение кривых выживания
Анализируем время до наступления события ③. Регрессионный анализ пропорциональных рисков Кокса
Глава 10. Многомерная статистика
Обобщаем данные. Метод главных компонент
Открываем скрытые факторы. Факторный анализ
Описываем причинную структуру. Моделирование структурными уравнениями (SEM)
Классифицируем экземпляры. Кластерный анализ
Анализируем связи качественных данных. Анализ соответствий
Глава 11. Байесовская статистика и большие данные
Статистика, использующая знания и опыт. Байесовская статистика
Универсальная формула. Теорема Байеса
Ищем причину, двигаясь от результата в обратном направлении. Апостериорная вероятность
Более точно благодаря новым данным. Байесовское обновление
Анализ больших данных ①. Что такое большие данные?
Анализ больших данных ②. Ассоциативный анализ
Анализ больших данных ③. Прогнозирование трендов и анализ соцсетей
Приложение А. Установка и использование R на персональном компьютере
Приложение В. Статистические таблицы, ортогональные таблицы, буквы греческого алфавита
Предметный указатель
Краткая биография авторов
Статистика
Предисловие
Пролог. Что такое статистика?
Что такое статистика?
Возможности статистики
Глава 1. Описательная статистика
Разнообразные средние
Разброс данных ①. Квантиль и дисперсия
Разброс данных ②. Коэффициент вариации
Связь переменных ①. Коэффициент корреляции
Связь переменных ②. Ранговая корреляция
Глава 2. Распределения вероятностей
Вероятность и распределение вероятностей
Распределение с равными вероятностями. Равномерное распределение
Распределение при подбрасывании монеты. Биномиальное распределение
Распределение в виде подвешенного колокола. Нормальное распределение
Безразмерное распределение. Cтандартное нормальное распределение
Узнаем позиции данных. Интервал сигма
Форма распределения. Асимметрия и эксцесс
Распределение вероятности редких событий. Распределение Пуассона
Несколько независимых случайных величин. Распределение хи-квадрат (χ2)
Отношение распределений хи-квадрат. Распределение Фишера (F-распределение)
Распределение, используемое вместо нормального. Распределение Стьюдента (t-распределение)
Глава 3. Статистический вывод
Определяем особенности генеральной совокупности по выборке. Статистический вывод
Умело угадываем статистический параметр. Несмещенная оценка
Неограниченное число данных. Число степеней свободы
Распределение выборочных статистик ①. Распределение средних
Распределение выборочных статистик ②. Распределение доли
Распределение выборочных статистик ③. Распределение дисперсии
Распределение выборочных статистик ④. Распределение коэффициента корреляции
Смещение от истинного значения. Систематическая ошибка и случайная ошибка
Две теоремы о выборочном среднем. Закон больших чисел и центральная предельная теорема
Глава 4. Оценка доверительного интервала
Расширенная оценка ①. Доверительный интервал математического ожидания генеральной совокупности
Расширенная оценка ②. Доверительный интервал доли в генеральной совокупности
Расширенная оценка ③. Доверительный интервал дисперсии генеральной совокупности
Расширенная оценка ④. Доверительный интервал коэффициента корреляции генеральной совокупности
Оцениваем статистический параметр путем моделирования. Бутстрэп-метод
Глава 5. Проверка статистических гипотез
Делаем вывод о наличии разницы. Проверка статистической гипотезы
Две статистические гипотезы. Нулевая гипотеза и альтернативная гипотеза
Порядок проверки статистической гипотезы
Проверка гипотезы о равенстве выборочного среднего определенному значению (математическому ожиданию генеральной совокупности)
Два типа ошибок при проверке статистических гипотез. Ошибки 1-го рода и ошибки 2-го рода
Проверка гипотезы о равенстве долей признака в выборке определенному значению (доле в генеральной совокупности)
Проверка гипотезы о равенстве выборочной дисперсии определенному значению (дисперсии генеральной совокупности)
Действительно ли имеется корреляция? Проверка гипотезы о некоррелированности
Проверка гипотезы о разности средних ①. Случай двух непарных групп
Проверка гипотезы о разности средних ②. Случай двух парных групп
Проверка гипотезы о разнице долей. Случай двух непарных групп
Доказываем не меньшую эффективность. Испытания не меньшей эффективности
Глава 6. Дисперсионный анализ и множественное сравнение
Проверяем эффекты с помощью эксперимента. Однофакторный дисперсионный анализ
Проверка однородности дисперсий множества групп. Критерий Бартлетта
Учитываем межэкземплярную неоднородность. Парный однофакторный дисперсионный анализ
Находим эффекты взаимодействия. Двухфакторный дисперсионный анализ
Повторять проверку нельзя. Множественное сравнение
Проверка, допускающая повторение ①. Метод Бонферрони и метод Шеффе
Проверка, допускающая повторение ②. Метод Тьюки и метод Тьюки–Крамера
Проверка, допускающая повторение ③. Метод Даннетта
Глава 7. Непараметрические методы
Проверка, не зависящая от распределения. Непараметрические методы
Проверка качественных данных. Проверка независимости (критерий χ2 Пирсона)
Проверка таблиц сопряженности 2×2. Точный критерий Фишера
Проверка ранговых данных двух непарных групп. U-критерий Манна–Уитни
Проверка ранговых данных двух парных групп. Критерий знаков
Непараметрическая проверка числовых данных двух парных групп. Критерий знаковых рангов Уилкоксона
Проверка ранговых данных множества непарных групп. Критерий Краскела–Уоллиса
Проверка ранговых данных множества парных групп. Критерий Фридмана
Глава 8. Планирование эксперимента
Три основных принципа Фишера ①. Повторение
Три основных принципа Фишера ②. Рандомизация
Три основных принципа Фишера ③. Локальный контроль
Различные методы упорядочения данных в эксперименте
Уменьшаем число проводимых экспериментов. Ортогональный план
Ортогональный план на практике ①. Проектирование качества (проектирование параметров)
Ортогональный план на практике ②. Совместный анализ
Задание размера выборки. Анализ статистической мощности
Глава 9. Регрессионный анализ
Ищем связи причин и результатов. Регрессионный анализ
Применяем к данным числовую формулу. Метод наименьших квадратов
Оцениваем точность линии регрессии. Коэффициент смешанной корреляции
Проверяем наклон линии регрессии. t-критерий
Проверяем правильность анализа. Анализ остатков
Регрессионный анализ при наличии нескольких влияющих переменных. Множественный регрессионный анализ
Взаимозависимость, возникающая между влияющими переменными. Мультиколлинеарность
Выбираем эффективные влияющие переменные. Методы выбора переменных
Переменные, объясняющие качественные различия ①. Фиктивная переменная сдвига
Переменные, объясняющие качественные различия ②. Фиктивная переменная наклона
Регрессионный анализ с бинарными переменными. Пробит-анализ
Анализируем время до наступления события ①. Кривая выживания
Анализируем время до наступления события ②. Сравнение кривых выживания
Анализируем время до наступления события ③. Регрессионный анализ пропорциональных рисков Кокса
Глава 10. Многомерная статистика
Обобщаем данные. Метод главных компонент
Открываем скрытые факторы. Факторный анализ
Описываем причинную структуру. Моделирование структурными уравнениями (SEM)
Классифицируем экземпляры. Кластерный анализ
Анализируем связи качественных данных. Анализ соответствий
Глава 11. Байесовская статистика и большие данные
Статистика, использующая знания и опыт. Байесовская статистика
Универсальная формула. Теорема Байеса
Ищем причину, двигаясь от результата в обратном направлении. Апостериорная вероятность
Более точно благодаря новым данным. Байесовское обновление
Анализ больших данных ①. Что такое большие данные?
Анализ больших данных ②. Ассоциативный анализ
Анализ больших данных ③. Прогнозирование трендов и анализ соцсетей
Приложение А. Установка и использование R на персональном компьютере
Приложение В. Статистические таблицы, ортогональные таблицы, буквы греческого алфавита
Предметный указатель
Краткая биография авторов
Статистика
Предисловие
Пролог. Что такое статистика?
Что такое статистика?
Возможности статистики
Глава 1. Описательная статистика
Разнообразные средние
Разброс данных ①. Квантиль и дисперсия
Разброс данных ②. Коэффициент вариации
Связь переменных ①. Коэффициент корреляции
Связь переменных ②. Ранговая корреляция
Глава 2. Распределения вероятностей
Вероятность и распределение вероятностей
Распределение с равными вероятностями. Равномерное распределение
Распределение при подбрасывании монеты. Биномиальное распределение
Распределение в виде подвешенного колокола. Нормальное распределение
Безразмерное распределение. Cтандартное нормальное распределение
Узнаем позиции данных. Интервал сигма
Форма распределения. Асимметрия и эксцесс
Распределение вероятности редких событий. Распределение Пуассона
Несколько независимых случайных величин. Распределение хи-квадрат (χ2)
Отношение распределений хи-квадрат. Распределение Фишера (F-распределение)
Распределение, используемое вместо нормального. Распределение Стьюдента (t-распределение)
Глава 3. Статистический вывод
Определяем особенности генеральной совокупности по выборке. Статистический вывод
Умело угадываем статистический параметр. Несмещенная оценка
Неограниченное число данных. Число степеней свободы
Распределение выборочных статистик ①. Распределение средних
Распределение выборочных статистик ②. Распределение доли
Распределение выборочных статистик ③. Распределение дисперсии
Распределение выборочных статистик ④. Распределение коэффициента корреляции
Смещение от истинного значения. Систематическая ошибка и случайная ошибка
Две теоремы о выборочном среднем. Закон больших чисел и центральная предельная теорема
Глава 4. Оценка доверительного интервала
Расширенная оценка ①. Доверительный интервал математического ожидания генеральной совокупности
Расширенная оценка ②. Доверительный интервал доли в генеральной совокупности
Расширенная оценка ③. Доверительный интервал дисперсии генеральной совокупности
Расширенная оценка ④. Доверительный интервал коэффициента корреляции генеральной совокупности
Оцениваем статистический параметр путем моделирования. Бутстрэп-метод
Глава 5. Проверка статистических гипотез
Делаем вывод о наличии разницы. Проверка статистической гипотезы
Две статистические гипотезы. Нулевая гипотеза и альтернативная гипотеза
Порядок проверки статистической гипотезы
Проверка гипотезы о равенстве выборочного среднего определенному значению (математическому ожиданию генеральной совокупности)
Два типа ошибок при проверке статистических гипотез. Ошибки 1-го рода и ошибки 2-го рода
Проверка гипотезы о равенстве долей признака в выборке определенному значению (доле в генеральной совокупности)
Проверка гипотезы о равенстве выборочной дисперсии определенному значению (дисперсии генеральной совокупности)
Действительно ли имеется корреляция? Проверка гипотезы о некоррелированности
Проверка гипотезы о разности средних ①. Случай двух непарных групп
Проверка гипотезы о разности средних ②. Случай двух парных групп
Проверка гипотезы о разнице долей. Случай двух непарных групп
Доказываем не меньшую эффективность. Испытания не меньшей эффективности
Глава 6. Дисперсионный анализ и множественное сравнение
Проверяем эффекты с помощью эксперимента. Однофакторный дисперсионный анализ
Проверка однородности дисперсий множества групп. Критерий Бартлетта
Учитываем межэкземплярную неоднородность. Парный однофакторный дисперсионный анализ
Находим эффекты взаимодействия. Двухфакторный дисперсионный анализ
Повторять проверку нельзя. Множественное сравнение
Проверка, допускающая повторение ①. Метод Бонферрони и метод Шеффе
Проверка, допускающая повторение ②. Метод Тьюки и метод Тьюки–Крамера
Проверка, допускающая повторение ③. Метод Даннетта
Глава 7. Непараметрические методы
Проверка, не зависящая от распределения. Непараметрические методы
Проверка качественных данных. Проверка независимости (критерий χ2 Пирсона)
Проверка таблиц сопряженности 2×2. Точный критерий Фишера
Проверка ранговых данных двух непарных групп. U-критерий Манна–Уитни
Проверка ранговых данных двух парных групп. Критерий знаков
Непараметрическая проверка числовых данных двух парных групп. Критерий знаковых рангов Уилкоксона
Проверка ранговых данных множества непарных групп. Критерий Краскела–Уоллиса
Проверка ранговых данных множества парных групп. Критерий Фридмана
Глава 8. Планирование эксперимента
Три основных принципа Фишера ①. Повторение
Три основных принципа Фишера ②. Рандомизация
Три основных принципа Фишера ③. Локальный контроль
Различные методы упорядочения данных в эксперименте
Уменьшаем число проводимых экспериментов. Ортогональный план
Ортогональный план на практике ①. Проектирование качества (проектирование параметров)
Ортогональный план на практике ②. Совместный анализ
Задание размера выборки. Анализ статистической мощности
Глава 9. Регрессионный анализ
Ищем связи причин и результатов. Регрессионный анализ
Применяем к данным числовую формулу. Метод наименьших квадратов
Оцениваем точность линии регрессии. Коэффициент смешанной корреляции
Проверяем наклон линии регрессии. t-критерий
Проверяем правильность анализа. Анализ остатков
Регрессионный анализ при наличии нескольких влияющих переменных. Множественный регрессионный анализ
Взаимозависимость, возникающая между влияющими переменными. Мультиколлинеарность
Выбираем эффективные влияющие переменные. Методы выбора переменных
Переменные, объясняющие качественные различия ①. Фиктивная переменная сдвига
Переменные, объясняющие качественные различия ②. Фиктивная переменная наклона
Регрессионный анализ с бинарными переменными. Пробит-анализ
Анализируем время до наступления события ①. Кривая выживания
Анализируем время до наступления события ②. Сравнение кривых выживания
Анализируем время до наступления события ③. Регрессионный анализ пропорциональных рисков Кокса
Глава 10. Многомерная статистика
Обобщаем данные. Метод главных компонент
Открываем скрытые факторы. Факторный анализ
Описываем причинную структуру. Моделирование структурными уравнениями (SEM)
Классифицируем экземпляры. Кластерный анализ
Анализируем связи качественных данных. Анализ соответствий
Глава 11. Байесовская статистика и большие данные
Статистика, использующая знания и опыт. Байесовская статистика
Универсальная формула. Теорема Байеса
Ищем причину, двигаясь от результата в обратном направлении. Апостериорная вероятность
Более точно благодаря новым данным. Байесовское обновление
Анализ больших данных ①. Что такое большие данные?
Анализ больших данных ②. Ассоциативный анализ
Анализ больших данных ③. Прогнозирование трендов и анализ соцсетей
Приложение А. Установка и использование R на персональном компьютере
Приложение В. Статистические таблицы, ортогональные таблицы, буквы греческого алфавита
Предметный указатель
Краткая биография авторов