Статья. // Computational Linguistics — 1999. — 25/4 — С. 527-571.
Интерактивный диалог, по замечанию авторов, «обеспечивает много новых проблем для систем понимания спонтанной речи». Одной из самых критических названа проблема сегментации дискурса и определения намеченного говорящим высказывания. Последняя проблема осложнена тем, что прекрасно распознавая отдельные слова, система не может распознать возникновения самоисправлений, происходящих, когда говорящий возвращается к началу забракованного фрагмента высказывания и повторяет или изменяет его. В таких случаях, забракованный участок дискурса больше не является частью высказывания и не должен учитываться системой распознавания речи. Сегментация дискурса и решение проблемы возникновения самоисправлений тесно переплетены с задачей идентификации дискурсивных маркеров, использующихся в речи для структурирования высказывания, заострения внимания слушающего на некоторых его частях или отсылки к тому, то было сказано ранее. Используется и много других дискурсивных маркеров, исполняющих самые разные функции и зачастую не несущих никакой информационной нагрузки. Так как все три явления тесно переплетены друг с другом, П. Хееман и Дж. Аллен представляют в своей статье статистическую языковую модель, особенностью которой является распознавание речи с учетом общих закономерностей, возникающих при использовании дискурсивных маркеров, самоисправлений и фразовой интонации, отмечающей сегментацию дискурса, а также с учетом контекста их употребления. Одновременное решение этих проблем позволило создать систему распознавания речи, показывающую лучшие результаты, чем системы, обращающиеся к каждой из них отдельно.