Идентификация автора текста по распределению частот буквосочетаний

This document was uploaded by one of our users. The uploader already confirmed that they had the permission to publish it. If you are author/publisher or own the copyright of this documents, please report to us by using this DMCA report form.

Simply click on the Download Book button.

Yes, Book downloads on Ebookily are 100% Free.

Sometimes the book is free on Amazon As well, so go ahead and hit "Search on Amazon"

Препринты ИПМ им. М.В. Келдыша. 2013. № 27. 26 с.
Исследованы распределения расстояний между распределениями триграмм, получена оценка точности частот буквосочетаний в зависимости от длины текста и даны оценки вероятности правильной идентификации автора текста по близости текста к его средневзвешенному эталону в смысле распределения частот. Построены авторские длины представительности для большого числа писателей и показано, что стабилизация триграмм происходит примерно на половине текста независимо от автора и длины текста. Проведен анализ литературного наследия Е.И. Рерих с целью кластеризации ее произведений и проверки ряда утверждений о возможном соавторстве.
Содержание:
Распределение расстояний между выборочными распределениями
Точность оценки вероятностей буквосочетаний
Авторская длина представительности
Статистический эксперимент определения автора текста
Анализ литературного наследия Е.И. Рерих

Author(s): Борисов Л.А., Орлов Ю.Н., Осминин К.П.

Language: Russian
Commentary: 1146254
Tags: Языки и языкознание;Лингвистика;Прикладная лингвистика;Матметоды и моделирование в лингвистике