Конспект лекций по курсу Методы анализа больших массивов данных

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

Тульский государственный университет, 2001, 93 с.
Содержание.
Введение в анализ данных.
Проблема обработки данных.
Матрица данных.
Гипотезы компактности и скрытых факторов.
Структура матрицы данных и задачи обработки.
Матрица объект-объект и признак-признак. Расстояние и бли-зость.
Измерение признаков.
Отношения и их представление.
Основные проблемы измерений.
Основные типы шкал.
Проблема адекватности.
Основы анализа связей.
Предположение о природе связи.
Нормальное распределение.
Корреляционная матрица и ее основные свойства.
Собственные векторы и собственные числа корреляционной матрицы.
Приведение корреляционной матрицы к диагональной форме.
Геометрическая интерпретация главных компонент на плоско-сти.
Модель главных компонент.
Приближенное вычисление собственных чисел и векторов корреляционной матрицы.
Понятие об измерении связи между качественными признака-ми. Статистический подход.
Теоретико-информационный подход.
Проблема интерпретации значений коэффициентов связи.
Задача факторного анализа.
Модель факторного анализа.
Структура факторных уравнений.
Неоднозначность факторного решения.
Метод главных факторов.
Метод центроидных факторов.
Проблема оценки значений факторов и виды факторных моде-лей.
Оценки общностей и вращение факторов.
Экстремальная группировка признаков (параметров).
Алгоритмы экстремальной группировки.
Задачи классификации и кластер-анализа.
Постановка задач классификации и кластер-анализа.
Байесовское решающее правило классификации.
Вероятности ошибок байесовского классификатора.
Формирование решающего правила как обучение распознава-нию образов.
Восстановление плотностей распределения классов.
Восстановление функций степени достоверности.
Минимизация среднего риска.
Линейные разделяющие функции.
Область решений линейной разделяющей функции.
Алгоритмы построения разделяющих гиперплоскостей.
Алгоритм построения оптимальной разделяющей гиперпло-скости.
Алгоритмы кластер-анализа.

Author(s): Двоенко С.Д.

Language: Russian
Commentary: 706199
Tags: Математика;Теория вероятностей и математическая статистика;Обработка результатов измерений