В данной книге подробно рассказывается, как использовать на практике языки программирования R и Python для визуализации данных, загрузки в модель, преобразования и выполнения других задач с помощью аналитического инструмента Power BI. Вы узнаете, как создавать пользовательские элементы визуализации, реализовывать методы машинного обучения и искусственного интеллекта, применять продвинутые методы обработки текстовой информации с использованием техник, недоступных в Power Query и DAX, обеспечивать взаимодействие со службами Microsoft Cognitive Services без необходимости приобретать дорогостоящую подписку на Power BI Premium. В заключение рассказывается, как можно воспользоваться языками программирования R и Python в корпоративных решениях, внедренных в Power BI.
Для выполнения практических упражнений понадобится облачная платформа Microsoft Azure. Также для работы с примерами из данной книги рекомендуется настроить виртуальную машину для анализа данных (Data Science Virtual Machine – DSVM).
Издание адресовано читателям, которые работают с большими объемами данных и хотят эффективно применять инструменты бизнес-аналитики.
https://github.com/Apress/adv-analytics-in-power-bi-w-r-and-python
Author(s): Райан Уэйд
Publisher: ДМК Пресс
Year: 2021
Language: Russian
Pages: 338
City: М.
Tags: bi, python, r
Содержание
От издательства
Отзывы и пожелания
Скачивание исходного кода примеров
Список опечаток
Нарушение авторских прав
Об авторе
О техническом редакторе
Благодарности
Введение
Настройка вашего окружения Azure
Подписка на Azure
Подписка на Microsoft Cognitive Services
Создание виртуальной машины для анализа данных (DSVM)
Шаги создания виртуальной машины в Azure
Настройка R на виртуальной машине
Настройка Python на виртуальной машине
Настройка SQL Server Machine Learning Services на виртуальной машине
Установка пакетов R
Установка библиотек Python
Настройка Power BI на виртуальной машине
Альтернативная настройка
Загрузка пакетов R в SSMLS
Шаг 1. Загрузите пакет sqlmlutils в папку Documents
Шаг 2. Запустите следующий код из командной строки
Шаг 3. Загрузите необходимые пакеты
Загрузка необходимых библиотек Python в SSMLS
Шаг 1. Скачайте пакет sqlmlutils на свой компьютер в папку Documents
Шаг 2. Откройте командную строку и введите следующие инструкции
Шаг 3. Загрузите необходимые пакеты
Локальный шлюз данных
Источники информации
Репозиторий книги
Ресурсы по R
Ресурсы по Python
Ресурсы по Power BI
Общие ресурсы
Описание глав
Часть I. Создание пользовательской визуализации при помощи R
Глава 1. Грамматика графиков
Пошаговое создание визуализации в Power BI при помощи R
Шаг 1. Настройте Power BI
Шаг 2. Перенесите визуальный элемент R в рабочую область Power BI
Шаг 3. Определитесь с набором данных
Шаг 4. Спроектируйте визуальный элемент в среде разработки R
Шаг 5. Используйте следующий шаблон для разработки элемента на R
Шаг 6. Добавьте скрипту функциональности
Рекомендованные шаги по созданию визуального элемента на R при помощи ggplot2
Шаг 1. Импортируйте нужные для скрипта пакеты
Шаг 2. Выполните необходимое преобразование исходных данных
Шаг 3. Создайте визуализацию при помощи функции ggplot()
Шаг 4. Добавьте нужные геометрии
Шаг 5. Определите заголовки, подзаголовки и подписи
Шаг 6. Приведите в порядок оси
Шаг 7. Примените тему при необходимости
Шаг 8. Используйте функцию theme() для настройки оформления
Дополнительный шаг: задайте цвета точек на диаграмме рассеяния
Важность оперирования «чистыми» данными
Популярные геометрии
Управление эстетиками через шкалы
Встроенные в пакет ggplot2 темы
Использование визуальных элементов R в службе Power BI
Вспомогательные пакеты ggplot2
Заключение
Глава 2. Создание пользовательских визуализаций на R в Power BI при помощи ggplot2
Диаграмма с аннотацией
Шаг 1. Загрузите исходные данные
Шаг 2. Создайте срез на основании года на панели фильтров
Шаг 3. Настройте визуальный элемент R в Power BI
Шаг 4. Экспортируйте данные в R Studio для дальнейшей разработки
Шаг 5. Загрузите необходимые пакеты
Шаг 6. Создайте переменные для проверки данных
Шаг 7. Выполните проверку данных
Шаг 8. Добавьте столбцы к набору данных, необходимые для нашей визуализации
Шаг 9. Создайте переменные для динамических составляющих диаграммы
Шаг 10. Постройте диаграмму при помощи функции ggplot()
Шаг 11. Добавьте слой со столбчатой диаграммой на визуальный элемент
Шаг 12. Добавьте текстовый слой на визуальный элемент
Шаг 13. Измените ось y
Шаг 14. Преобразуйте вертикальную столбчатую диаграмму в горизонтальную
Шаг 15. Добавьте на диаграмму динамическую аннотацию
Шаг 16. Добавьте динамические заголовки и подпись на визуальный элемент
Шаг 17. Удалите метки с осей x и y
Шаг 18. Удалите легенду с диаграммы
Шаг 19. Измените внешний вид диаграммы при помощи темы theme_few()
Шаг 20. Расположите заголовки по центру
Шаг 21. Перенесите код в Power BI
Пузырьковая диаграмма
Шаг 1. Загрузите исходные данные
Шаг 2. Загрузите данные в Power BI
Шаг 3. Создайте срез на основании года
Шаг 4. Выполните базовую настройку визуального элемента R
Шаг 5. Экспортируйте данные в R Studio для разработки элемента
Шаг 6. Загрузите требуемые пакеты
Шаг 7. Создайте переменные для проверки данных
Шаг 8. Создайте код для проверки
Шаг 9. Определите цвета для конференций и дивизионов
Шаг 10. Динамически определите заголовок диаграммы
Шаг 11. Создайте набор данных для диаграммы
Шаг 12. Создайте диаграмму при помощи функции ggplot
Шаг 13. Добавьте слой для пузырьковой диаграммы при помощи геометрии geom_point
Шаг 14. Добавьте метки на диаграмму
Шаг 15. Измените цвет границ и заливок пузырьков на диаграмме
Шаг 16. Создайте заголовок диаграммы
Шаг 17. Задайте тему
Шаг 18. Перенесите код в Power BI
Визуализация прогнозирования
Шаг 1. Загрузите исходные данные
Шаг 2. Создайте срез по квотербекам на панели фильтров
Шаг 3. Настройте визуальный элемент R в Power BI
Шаг 4. Экспортируйте данные в R Studio для дальнейшей разработки
Шаг 5. Загрузите необходимые пакеты
Шаг 6. Создайте переменные для проверки данных
Шаг 7. Выполните проверку данных
Шаг 8. Создайте динамический заголовок для визуализации
Шаг 9. Создайте набор данных, необходимый для составления прогноза
Шаг 10. Постройте прогноз
Шаг 11. Постройте диаграмму
Шаг 12. Перенесите код в Power BI
Линейная диаграмма с затенением
Шаг 1. Загрузите исходные данные
Шаг 2. Загрузите данные в Power BI
Шаг 3. Создайте срезы в отчете
Шаг 4. Настройте визуальный элемент R в Power BI
Шаг 5. Экспортируйте данные в R Studio для дальнейшей разработки
Шаг 6. Загрузите необходимые пакеты
Шаг 7. Создайте переменные для проверки данных
Шаг 8. Выполните проверку данных
Шаг 9. Создайте новый датафрейм на основании датафрейма dataset
Шаг 10. Создайте переменные для динамических составляющих диаграммы
Шаг 11. Создайте наборы данных, необходимые для наложения тени
Шаг 12. Создайте наборы данных, необходимые для отрисовки графика
Шаг 13. Создайте символьный вектор для хранения цветовой схемы затенения
Шаг 14. Постройте диаграмму при помощи функции ggplot()
Шаг 15. Добавьте слой для создания затенения
Шаг 16. Добавьте линейную диаграмму на основании выбора пользователя
Шаг 17. Раскрасьте фоновую заливку в соответствии с предопределенной цветовой схемой партий
Шаг 18. Отформатируйте ось y в соответствии с выбором пользователя
Шаг 19. Добавьте метки на оси x и y
Шаг 20. Снабдите диаграмму динамическим заголовком и подзаголовком
Шаг 21. Измените внешний вид диаграммы в стиле журнала The Economist
Шаг 22. Перенесите код в Power BI
Карта
Шаг 1. Загрузите исходные данные
Шаг 2. Загрузите данные в Power BI
Шаг 3. Создайте срез в отчете на основании выбранного в фильтре штата
Шаг 4. Настройте визуальный элемент R в Power BI
Шаг 5. Экспортируйте данные в R Studio для дальнейшей разработки
Шаг 6. Загрузите необходимые пакеты
Шаг 7. Создайте переменные для проверки данных
Шаг 8. Выполните проверку данных
Шаг 9. Создайте переменные для заголовков диаграммы
Шаг 10. Добавьте к набору данных столбец с квинтилем
Шаг 11. Создайте символьный вектор для хранения цветовой схемы затенения
Шаг 12. Постройте диаграмму при помощи функции ggplot()
Шаг 13. Добавьте слой с картой
Шаг 14. Отформатируйте оси x и y
Шаг 15. Раскрасьте округа на основании квинтилей
Шаг 16. Улучшите отображение карты выбранного штата
Шаг 17. Снабдите диаграмму динамическим заголовком и подзаголовком
Шаг 18. Примените тему theme_map()
Шаг 19. Перенесите код в Power BI
Диаграмма квадрантов
Шаг 1. Загрузите исходные данные
Шаг 2. Загрузите данные в Power BI
Шаг 3. Создайте срезы в отчете по типу игры и четверти матча
Шаг 4. Настройте визуальный элемент R в Power BI
Шаг 5. Экспортируйте данные в R Studio для дальнейшей разработки
Шаг 6. Загрузите необходимые пакеты
Шаг 7. Создайте переменные для проверки данных
Шаг 8. Выполните проверку данных
Шаг 9. Создайте заголовки диаграммы
Шаг 10. Добавьте дополнительные столбцы в набор данных
Шаг 11. Постройте диаграмму при помощи функции ggplot()
Шаг 12. Используйте геометрию geom_point() для создания диаграммы рассеяния
Шаг 13. Добавьте метки игроков для всех квадрантов
Шаг 14. Добавьте горизонтальные и вертикальные линии, проходящие через центр
Шаг 15. Добавьте на диаграмму заголовки квадрантов
Шаг 16. Добавьте метки на оси x и y
Шаг 17. Снабдите диаграмму динамическими заголовками и подписями
Шаг 18. Примените тему theme_tufte
Шаг 19. Выполните финальную очистку
Шаг 20. Перенесите код в Power BI
Добавление линии регрессии
Шаг 1. Загрузите исходные данные
Шаг 2. Загрузите данные в Power BI
Шаг 3. Настройте визуальный элемент R в Power BI
Шаг 4. Экспортируйте данные в R Studio для дальнейшей разработки
Шаг 5. Загрузите необходимые пакеты
Шаг 6. Создайте переменные для проверки данных
Шаг 7. Выполните проверку данных
Шаг 8. Постройте диаграмму при помощи функции ggplot()
Шаг 9. Используйте геометрию geom_point() для создания диаграммы рассеяния
Шаг 10. Добавьте на визуализацию слой с линией регрессии
Шаг 11. Снабдите диаграмму заголовком и подзаголовком
Шаг 12. Примените тему
Шаг 13. Выполните финальную очистку
Шаг 14. Перенесите код в Power BI
Часть II. Загрузка информации в модель данных Power BI при помощи R и Python
Глава 3. Чтение файлов CSV
Динамическое объединение файлов
Пример сценария
Выбор файлов за скользящий период из 24 месяцев при помощи R
Шаг 1. Импортируйте необходимые пакеты для скрипта
Шаг 2. Установите рабочую директорию на папку, содержащую наборы данных о продажах
Шаг 3. Считайте имена файлов в символьный вектор
Шаг 4. Создайте вектор дат
Шаг 5. Создайте датафрейм, состоящий из двух векторов
Шаг 6. Получите верхнюю и нижнюю границы желаемого диапазона дат
Шаг 7. Ограничьте датафрейм только нужными нам месяцами
Шаг 8. Создайте датафрейм на основании объединенных файлов
Шаг 9. Соберите написанный код и перенесите в редактор скриптов в Power BI
Выбор файлов за скользящий период из 24 месяцев при помощи Python
Шаг 1. Создайте скрипт на Python и загрузите необходимые библиотеки
Шаг 2. Установите рабочую директорию на папку Python_Code
Шаг 3. Загрузите перечень имен файлов в список
Шаг 4. Создайте датафрейм pandas с информацией о файлах для объединения
Шаг 5. Создайте новый столбец с датой в датафрейме
Шаг 6. Определите границы нужного нам диапазона дат
Шаг 7. Ограничьте датафрейм нужным диапазоном
Шаг 8. Объедините файлы в единый датафрейм
Шаг 9. Перенесите скрипт в Power BI
Фильтрация строк на основе регулярных выражений
Использование регулярных выражений в R
Шаг 1. Загрузите необходимые для работы пакеты
Шаг 2. Загрузите в R файл с потенциальными избирателями
Шаг 3. Определите регулярное выражение
Шаг 4. Исключите неправильные адреса из набора данных
Шаг 5. Объедините написанный код в один скрипт и перенесите в редактор скриптов в Power BI
Использование регулярных выражений в Python
Шаг 1. Загрузите необходимые для работы библиотеки
Шаг 2. Загрузите в Python файл с избирателями и присвойте его содержимое датафрейму
Шаг 3. Определите регулярное выражение
Шаг 4. Исключите неправильные адреса из набора данных
Шаг 5. Объедините написанный код в один скрипт и перенесите в редактор скриптов Python в Power BI
Глава 4. Чтение данных из Microsoft Excel
Чтение файлов Excel при помощи R
Шаг 1. Импортируйте пакеты tidyverse и readxl
Шаг 2. Создайте оболочку функции combine_sheets
Шаг 3. Получите имена листов для объединения из указанной рабочей книги
Шаг 4. Преобразуйте символьный вектор, полученный на предыдущем шаге, в именованный символьный вектор
Шаг 5. Используйте функцию map_dfr() для объединения информации с листов в один датафрейм
Шаг 6. Верните датафрейм из функции
Шаг 7. Направьте рабочую директорию на папку с файлами Excel
Шаг 8. Сохраните в переменной excel_file_paths список файлов для обработки
Шаг 9. Используйте функцию map_dfr() для применения функции combine_sheets() ко всем выбранным файлам
Шаг 10. Скопируйте скрипт и вставьте в редактор скриптов R в Power BI через инструмент Получить данные (GetData)
Чтение файлов Excel при помощи Python
Шаг 1. Импортируйте библиотеки os и pandas
Шаг 2. Создайте оболочку функции combine_sheets()
Шаг 3. Создайте объект Excel на основании пути, переданного в функцию в аргументе excel_file_path
Шаг 4. Создайте список имен листов в рабочей книге
Шаг 5. Используйте метод read_excel() из библиотеки pandas для считывания данных в один датафрейм
Шаг 6. Верните датафрейм df из функции combine_sheets
Шаг 7. Установите рабочую директорию в папку, в которой находятся файлы Excel
Шаг 8. Получите список файлов в текущей рабочей директории и присвойте его переменной excel_file_paths
Шаг 9. Создайте пустой датафрейм и назовите его combined_workbooks
Шаг 10. Создайте заготовку для цикла for
Шаг 11. Объедините данные со всех листов в один датафрейм при помощи функции combine_sheets()
Шаг 12. Добавьте датафрейм combined_workbook к главному датафрейму combined_workbooks
Шаг 13. Скопируйте скрипт и вставьте в редактор скриптов Python в Power BI через инструмент Получить данные (GetData)
Глава 5. Чтение данных из SQL Server
Добавление базы данных AdventureWorksDW_StarSchema к вашему экземпляру SQL Server
Чтение данных из SQL Server в Power BI при помощи R
Шаг 1. Создайте DSN для подключения к базе данных SQL Server
Шаг 2. Создайте таблицу лога в SQL Server
Шаг 3. Начните написание скрипта на R для загрузки таблицы DimDate
Шаг 4. Создайте переменную для хранения имени загружаемой таблицы
Шаг 5. Создайте переменную для хранения SQL-выражения
Шаг 6. Создайте подключение к SQL Server
Шаг 7. Извлеките данные из SQL Server и сохраните их в датафрейм
Шаг 8. Получите текущее время
Шаг 9. Получите количество прочитанных записей
Шаг 10. Добавьте в датафрейм запись с информацией для сохранения в лог
Шаг 11. Сохраните собранную информацию в базе данных
Шаг 12. Закройте соединение
Шаг 13. Скопируйте написанный скрипт в Power BI
Шаг 14. Создайте скрипт для загрузки таблицы DimProduct на базе ReadLog_DimDate.R
Шаг 15. Создайте скрипт для загрузки таблицы DimPromotion
Шаг 16. Создайте скрипт для загрузки таблицы DimSalesTerritory на основе ReadLog_DimDate.R
Шаг 17. Создайте скрипт для загрузки таблицы FactInternetSales на основе ReadLog_DimDate.R
Чтение данных из SQL Server в Power BI при помощи Python
Шаг 1. Создайте DSN для SQL Server
Шаг 2. Создайте таблицу для ведения логов в SQL Server
Шаг 3. Создайте скрипт для загрузки таблицы DimDate
Шаг 4. Определите переменную для хранения имени таблицы, предназначенной для загрузки в Power BI
Шаг 5. Создайте подключение к базе данных с помощью библиотеки sqlalchemy
Шаг 6. Прочитайте содержимое таблицы DimDate и сохраните его в переменной df_read
Шаг 7. Получите текущую дату и время и сохраните в переменной datestamp
Шаг 8. Посчитайте количество записей в таблице DimDate
Шаг 9. Добавьте запись в датафрейм с информацией для сохранения логов
Шаг 10. Добавьте информацию, добытую на предыдущем шаге, в таблицу логов
Шаг 11. Скопируйте скрипт в Power BI
Шаг 12. Создайте скрипт для загрузки таблицы DimProduct на основе ReadLog_DimDate.py
Шаг 13. Создайте скрипт для загрузки таблицы DimPromotion на основе ReadLog_DimDate.py
Шаг 14. Создайте скрипт для загрузки таблицы DimSalesTerritory на основе ReadLog_DimDate.py
Шаг 15. Создайте скрипт для загрузки таблицы FactInternetSales на основе ReadLog_DimDate.py
Глава 6. Чтение в модель данных Power BI посредством API
Чтение и загрузка данных в Power BI из API с помощью R
Шаг 1. Получите персональный ключ API к Census
Шаг 2. Загрузите необходимые пакеты R
Шаг 3. Определите переменные для возврата из вашего набора данных
Шаг 4. Создайте символьный вектор, содержащий нужные вам переменные
Шаг 5. Сконфигурируйте функцию get_acs
Шаг 6. Присвойте переменным (столбцам) осмысленные имена
Шаг 7. Скопируйте скрипт в Power BI
Чтение и загрузка данных в Power BI из API с помощью Python
Шаг 1. Получите персональный ключ API к Census
Шаг 2. Загрузите необходимые библиотеки Python
Шаг 3. Определите переменные для возврата из вашего набора данных
Шаг 4. Создайте список, содержащий нужные вам переменные
Шаг 5. Создайте список кортежей с географическими фильтрами для набора данных
Шаг 6. Извлеките данные при помощи функции censusdata.download()
Шаг 7. Переиндексируйте датафрейм, созданный на шестом шаге
Шаг 8. Дайте столбцам осмысленные имена
Шаг 9. Переименуйте столбцы в датафрейме
Шаг 10. Скопируйте скрипт в Power BI
Заключение
Часть III. Преобразование данных при помощи R и Python
Глава 7. Продвинутые строковые операции и распознавание шаблонов
Защита конфиденциальных сведений
Защита конфиденциальных сведений в Power BI с помощью R
Шаг 1. Импортируйте пакеты tidyverse и stringr
Шаг 2. Напишите функцию для очистки данных
Шаг 3. Считайте комментарии в датафрейм
Шаг 4. Скройте телефонные номера и номера социального страхования в поле комментария
Шаг 5. Скопируйте скрипт в Power BI
Защита конфиденциальных сведений в Power BI с помощью Python
Шаг 1. Импортируйте библиотеки pandas, os и re
Шаг 2. Напишите функцию mask_text()
Шаг 3. Установите рабочую директорию
Шаг 4. Считайте комментарии в датафрейм
Шаг 5. Выполните замену телефонных номеров и номеров социального страхования
Шаг 6. Скопируйте скрипт в Power BI
Подсчет количества слов и предложений в обзорах
Подсчет количества слов и предложений в обзорах с помощью R
Шаг 1. Импортируйте библиотеки tidyverse и stringr
Шаг 2. Измените рабочую директорию
Шаг 3. Считайте информацию из файла
Шаг 4. Ограничьте набор данных требуемыми столбцами
Шаг 5. Добавьте столбцы с количеством слов и предложений
Шаг 6. Скопируйте скрипт в Power BI
Подсчет количества слов в обзорах с помощью Python
Шаг 1. Импортируйте библиотеки pandas и os
Шаг 2. Установите рабочую директорию
Шаг 3. Считайте информацию из файла
Шаг 4. Создайте в датафрейме столбец word_count
Шаг 5. Скопируйте скрипт в Power BI
Удаление имен неподходящего формата
Удаление имен неподходящего формата с помощью R
Шаг 1. Импортируйте пакеты tidyverse и stringr
Шаг 2. Установите рабочую директорию
Шаг 3. Создайте регулярное выражение с правильным шаблоном имени
Шаг 4. Считайте данные в датафрейм
Шаг 5. Выполните обновление столбца Name
Шаг 6. Скопируйте скрипт в Power BI
Удаление имен неподходящего формата с помощью Python
Шаг 1. Импортируйте библиотеки pandas, re и os
Шаг 2. Установите рабочую директорию
Шаг 3. Считайте данные из файла DimEmployee.csv в датафрейм
Шаг 4. Создайте регулярное выражение, соответствующее правильному формату имени
Шаг 5. Скомпилируйте регулярное выражение
Шаг 6. Напишите функцию для проверки имен на совместимость с шаблоном
Шаг 7. Примените функцию к столбцу, чтобы избавиться от лишних имен
Шаг 8. Скопируйте скрипт в Power BI
Определение шаблонов в строках на основании условной логики
Поиск шаблонов в строках на основании условной логики с помощью R
Шаг 1. Импортируйте пакеты tidyverse и stringr
Шаг 2. Установите рабочую директорию
Шаг 3. Напишите функцию для поиска изделий
Шаг 4. Считайте данные из файла ProductionOrders.csv в датафрейм
Шаг 5. Добавьте в датафрейм df столбец Monitored Products
Шаг 6. Скопируйте скрипт в Power BI
Поиск шаблонов в строках на основании условной логики с помощью Python
Шаг 1. Импортируйте библиотеки pandas, re и os
Шаг 2. Установите рабочую директорию
Шаг 3. Скомпилируйте регулярное выражение
Шаг 4. Напишите функцию для распознавания нужных нам деталей
Шаг 5. Считайте данные в датафрейм Pandas
Шаг 6. Создайте новый столбец с именем Monitored Products
Шаг 7. Скопируйте скрипт в Power BI
Заключение
Глава 8. Вычисляемые столбцы с помощью R и Python
Создание ключа Google Geocoding API
Шаг 1. Зайдите в консоль Google
Шаг 2. Настройте учетную запись
Шаг 3. Добавьте новый проект
Шаг 4. Активируйте API геокодирования
Геокодирование адресов с помощью R
Геокодирование адресов с помощью Python
Вычисление расстояния между точками с помощью пользовательской функции в R
Вычисление расстояния между точками с помощью пользовательской функции в Python
Вычисление расстояния между точками с помощью готовой функции в R
Вычисление расстояния между точками с помощью готовой функции в Python
Заключение
Часть IV. Машинное обучение и искусственный интеллект в Power BI при помощи R и Python
Глава 9. Применение методов машинного обучения и искусственного интеллекта к моделям данных Power BI
Применение алгоритмов машинного обучения к набору данных перед загрузкой в модель Power BI
Прогнозирование цен на недвижимость с помощью R
Шаг 1. Пусть аналитик данных сохранит для вас модель
Шаг 2. Загрузите пакет tidyverse
Шаг 3. Загрузите объект модели и набор данных для оценки
Шаг 4. Ограничьте датафрейм столбцами, необходимыми для вашей модели
Шаг 5. Примените модель машинного обучения к своему набору данных для составления прогноза цен на недвижимость
Шаг 6. Добавьте прогноз к исходному набору данных
Шаг 7. Скопируйте скрипт в Power BI
Прогнозирование цен на недвижимость с помощью Python
Шаг 1. Пусть аналитик данных сохранит для вас модель
Шаг 2. Загрузите необходимые библиотеки
Шаг 3. Загрузите объект модели и актуальный набор данных
Шаг 4. Извлеките нужную информацию из датафрейма
Шаг 5. Примените модель к подготовленному набору данных для расчета прогноза
Шаг 6. Добавьте прогнозные данные к исходному набору данных
Шаг 7. Скопируйте скрипт в Power BI
Использование готовых моделей ИИ для расширения функционала моделей данных в Power BI
Настройка Cognitive Services в Azure
Виртуальная машина для анализа данных (Data Science Virtual Machine – DSVM)
Анализ тональности текста в Microsoft Cognitive Services при помощи Python
Шаг 1. Загрузите набор данных с отзывами Yelp с сайта Kaggle
Шаг 2. Загрузите нужные библиотеки, модули и функции для скрипта
Шаг 3. Инициализируйте переменные для работы скрипта
Шаг 4. Считайте фрагмент файла с отзывами в датафрейм
Шаг 5. Преобразуйте датафрейм к формату, приемлемому для службы Microsoft Cognitive Services
Шаг 6. Оцените отзывы посетителей при помощи метода sentiment()
Шаг 7. Создайте датафрейм, содержащий оценки отзывов
Шаг 8. Скопируйте скрипт в Power BI
Применение сторонних моделей машинного обучения к моделям данных Power BI
Конфигурирование средства анализа настроения текста в IBM Watson
Шаг 1. Заведите аккаунт в IBM Cloud
Шаг 2. Выполните вход в IBM Cloud
Шаг 3. Перейдите на страницу Tone Analyzer
Шаг 4. Настройте службу Tone Analyzer
Шаг 5. Получите ключ API
Написание скрипта на Python для анализа настроения текста в IBM Watson
Шаг 1. Импортируйте необходимые библиотеки и модули
Шаг 2. Создайте экземпляр класса IAMAuthenticator
Шаг 3. Создайте экземпляр класса ToneAnalyzerV3
Шаг 4. Установите ссылку на службу для созданного объекта
Шаг 5. Создайте датафрейм с исходными данными для анализа
Шаг 6. Создайте основу для датафрейма с оценочными данными
Шаг 7. Определите циклическую конструкцию для отправки документов в службу IBM Watson
Шаг 8. Отформатируйте и оцените настроение текста в документе
Шаг 9. Извлеките результат анализа текста и инициализируйте переменные исходными значениями
Шаг 10. Пройдите по тонам и присвойте их значения соответствующим переменным
Шаг 11. Создайте датафрейм на основе списка listReturnedUtterance
Шаг 12. Объедините датафреймы dfReturnedUtterance и dfDocuments
Шаг 13. Скопируйте скрипт в Power BI
Глава 10. Создание моделей анализа данных и скриптов для обработки информации
Прогнозирование цен на недвижимость в Power BI с помощью R со службой SSMLS
Написание скрипта на языке R для добавления модели в SQL Server
Шаг 1. Загрузите необходимые пакеты
Шаг 2. Загрузите модель R в вашу сессию
Шаг 3. Подключитесь к базе данных
Шаг 4. Определите переменные модели
Шаг 5. Напишите выражение на T-SQL для добавления модели в базу данных
Шаг 6. Добавьте код, необходимый для запуска выражения T-SQL из R
Шаг 7. Сохраните скрипт
Использование SSMLS совместно с R для оценки данных
Шаг 1. Запустите SQL Server Management Studio
Шаг 2. Создайте подключение к серверу, который хотите использовать
Шаг 3. Добавьте базу данных BostonHousingInfo на ваш сервер
Шаг 4. Добавьте модель в базу данных
Шаг 5. Создайте в базе данных хранимую процедуру для прогноза
Шаг 6. Извлеките данные с прогнозами из SQL Server в Power BI
Прогнозирование цен на недвижимость в Power BI с помощью Python со службой SSMLS
Написание скрипта на языке Python для добавления модели в SQL Server
Шаг 1. Подберите версии библиотек
Шаг 2. Создайте окружение conda
Шаг 3. Напишите код для загрузки модели в SQL Server
Использование SSMLS совместно с Python для оценки данных
Шаг 1. Запустите SQL Server Management Studio
Шаг 2. Создайте подключение к серверу, который хотите использовать
Шаг 3. Добавьте базу данных BostonHousingInfo на ваш сервер
Шаг 4. Добавьте модель в базу данных
Шаг 5. Создайте в базе данных хранимую процедуру для прогноза
Шаг 6. Извлеките данные с прогнозами из SQL Server в Power BI
Анализ тональности текста в Power BI с помощью R со службой SSMLS
Добавление готовых моделей R в SSMLS с помощью PowerShell
Шаг 1. Проверьте, установлены ли предварительно обученные модели
Шаг 2. Откройте PowerShell от имени администратора
Шаг 3. Загрузите скрипт PowerShell
Шаг 4. Запустите загруженный скрипт в PowerShell
Решение проблем
Использование готовой модели R в SSMLS для анализа тональности текста в Power BI
Шаг 1. Определите хранимую процедуру
Шаг 2. Определите переменные
Шаг 3. Инициализируйте переменную @Query
Шаг 4. Инициализируйте переменную @RScript
Шаг 5. Сконфигурируйте процедуру sp_execute_external_script
Шаг 6. Определите выходные данные
Шаг 7. Создайте хранимую процедуру в базе данных
Шаг 8. Вызовите процедуру из Power BI
Анализ тональности текста в Power BI с помощью Python со службой SSMLS
Добавление готовых моделей Python в SSMLS
Шаг 1. Проверьте, установлены ли предварительно обученные модели
Шаг 2. Откройте PowerShell от имени администратора
Шаг 3. Загрузите скрипт PowerShell
Шаг 4. Запустите загруженный скрипт в PowerShell
Решение проблем
Использование готовой модели Python в SSMLS для анализа тональности текста в Power BI
Шаг 1. Определите хранимую процедуру
Шаг 2. Определите переменные
Шаг 3. Инициализируйте переменную @Query
Шаг 4. Инициализируйте переменную @PythonScript
Шаг 5. Сконфигурируйте процедуру sp_execute_external_script
Шаг 6. Определите выходные данные
Шаг 7. Создайте хранимую процедуру в базе данных
Шаг 8. Вызовите процедуру из Power BI
Вычисление расстояния между точками в Power BI с помощью R со службой SSMLS
Шаг 1. Убедитесь, что в SSMLS загружен пакет dplyr
Шаг 2. Запустите SSMS и подключитесь к SQL Server
Шаг 3. Добавьте базу данных CalculateDistance на ваш сервер
Шаг 4. Создайте хранимую процедуру для расчета расстояний
Шаг 5. Вызовите процедуру из Power BI
Вычисление расстояния между точками в Power BI с помощью Python со службой SSMLS
Шаг 1. Запустите SSMS и подключитесь к SQL Server
Шаг 2. Добавьте базу данных CalculateDistance на ваш сервер
Шаг 3. Создайте хранимую процедуру для расчета расстояний
Шаг 4. Вызовите процедуру из Power BI
Предметный указатель