Автоматическое распознавание речи

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

Учебное пособие. − СПб: Университет ИТМО, 2016. – 138 с.
В учебном пособии рассматриваются методы автоматического распознавания речи. Материал пособия разбит на 16 разделов. Первые два раздела посвящены вопросам речеобразования и восприятия слуховой системой. В каждом разделе приведены краткие теоретические и/или практические сведения.
Пособие может быть использовано при подготовке магистров по направлению 09.04.02 - "Информационные системы и технологии" и аспирантов.
Введение.
Речеобразование.
Физиология речеобразования.
Процесс образования звуков с голосовым возбуждением.
Передаточная функция голосового тракта.
Расчёт передаточной функции с помощью электроаналогий.
Турбулентный и импульсный источники звука.
Носовые согласные.
Выводы.
Слуховая система.
Строение уха человека.
Маскировка. Восприятие высоты звука.
Восприятие громкости звука. Кривая равной громкости.
Адаптация.
Физиологические методы обработки сигналов.
Выводы.
Признаки речевого сигнала для распознавания речи.
Количественная оценка систем распознавания речи.

Показатели оценки качества распознавания речи.
Показатели оценки скорости распознавания речи.
Метод динамического программирования для распознавания речи.
Меры близости в пространстве признаков.
Распознавание речи с помощью скрытых марковских моделей.
Алгоритм «Вперёд-Назад».
Алгоритм Витерби.
Алгоритм Баума-Уэлша.
Неоднородная марковская модель.
Проблема выбора единиц фонетического уровня.
Кластеризация на основе дерева решений.
Управляемый данными метод построения состояний.
Методы нормализации и адаптации.
Вычитание среднего кепстра.
Адаптация акустических моделей к шуму векторными рядами Тейлора.
Байесовская адаптация.
Линейная регрессия максимума правдоподобия.
Метод собственных дикторов.
Нормализация признаков по длине голосового тракта.
Дискриминантные методы.
Долговременные признаки.
Условные случайные поля.
Глубокие нейронные сети.
Модели языка.

Использование условных вероятностей.
Статистическое сглаживание.
Классовые модели.
Морфемные модели.
Синтаксические и семантические модели.
Модели темы высказывания.
Декодер.
Организация лексикона в виде префиксного дерева.
Использование взвешенных конечных автоматов.
Использование взвешенных преобразователей с конечным числом состояний.
Проблема внесловарных слов.
Использование моделей заполнения.
Использование фиксированных комбинаций фонем.
Использование нескольких систем распознавания.
Аудиовизуальное распознавание речи.
Способы объединения аудио- и видеомодальностей речи.
Методы аудиовизуального моделирования и распознавания речи.
Литература.

Author(s): Тампель И.Б., Карпов А.А.

Language: Russian
Commentary: 1907550
Tags: Информатика и вычислительная техника;Обработка медиа-данных;Обработка звука;Обработка речи