В последние годы машинное обучение вышло на уровень большого бизнеса: компании активно используют его для зарабатывания денег, прикладные исследования бурно развиваются, а неугомонные разработчики используют любую возможность повысить свой уровень владения данной тематикой.
Данная книга рассчитана на тех, кто хочет решать самые разнообразные задачи при помощи машинного обучения. Как правило, для этого нужен Python, поэтому в примерах кода используется этот язык, а также библиотеки pandas и scikit-learn. Вы познакомитесь с основными понятиями ML, такими как сбор данных, моделирование, классификация и регрессия, а главное, получите практический опыт обработки реальных данных.
Author(s): Хенрик Бринк, Джозеф Ричардс, Марк Феверолф
Series: Серия «Библиотека программиста»
Publisher: Питер
Year: 2017
Language: Russian
Commentary: уменьшен размер файла, исправлены закладки
Pages: 336
City: Санкт-Петербург
Обложка
Краткое содержание
Оглавление
Предисловие
Вступление
О книге
Об авторах
Часть I. Последовательность действий при машинном обучении
1. Что такое машинное обучение?
1.2 Принятие решений на основе данных
1.3 Рабочий процесс: от данных до внедрения
1.4 Усовершенствованные способы повышения эффективности
1.5 Заключение
1.6 Терминология
2. Реальные данные
2.1 Первый этап: сбор данных
2.2 Подготовка данных к моделированию
2.3 Визуализация данных
2.4 Заключение
2.5 Терминология
3. Моделирование и прогнозирование
3.1 Основы моделирования
с машинным обучением
3.2 Классификация: распределение
по классам
3.3 Регрессия: предсказание численных значений
3.4 Заключение
3.5 Терминология
4. Оценка и оптимизация модели
4.1 Оценка прогностической точности на новых данных
4.2 Оценка моделей классификации
4.3 Оценка моделей регрессии
4.4 Оптимизация модели путем подбора параметров
4.5 Заключение
4.6 Терминология
5. Основы проектирования признаков
5.1 Мотивация: в чем польза проектирования признаков?
5.2 Основные этапы проектирования признаков
5.3 Выбор признаков
5.4 Заключение
5.5 Терминология
ЧАСТЬ II. Практическое применение
6. Пример: чаевые для таксистов
6.1 Данные: сведения о чаевых и плате за проезд
6.2 Моделирование
6.3 Заключение
6.4 Терминология
7. Усовершенствованное проектирование признаков
7. 1 . Более сложные текстовые признаки
7.2 Признаки, извлекаемые из изображений
7.3 Признаки временных рядов
7.4 Заключение
7.5 Терминология
8. Пример обработки естественного языка
8.1 Изучение данных и сценарии их применения
8.2 Генерация базовых NLР-признаков и построение первого варианта модели
8.3 Усовершенствованные алгоритмы и тонкости процесса внедрения
8.4 Заключение
8.5 Терминология
9. Масштабирование процесса машинного обучения
9.1 Перед началом масштабирования
9.2 Масштабирование конвейера МL-моделирования
9.3 Масштабирование предсказаний
9.4 Заключение
9.5 Терминология
10. Пример с цифровой рекламой
10.1 Показ рекламы
10.2 Данные, связанные с цифровой рекламой
10.3 Проектирование признаков и стратегия моделирования
10.4 Размер и форма данных
10.5 Сингулярное разложение
10.6 Оценка и оптимизация ресурсов
10.7 Моделирование
10.8 Метод k-ближайших соседей
10.9 «Случайные леса»
10.10 Другие практические моменты
10.11 Заключение
10.12 Терминология
10.13 Подводим итоги
Приложение. Популярные алгоритмы машинного обучения