Из описания к программе (
http://www.textology.ru/atr_resum.html)
Программа-атрибутор представляет собой лингвистический процессор для автоматического сравнения и классификации текстов по параметрам индивидуального авторского стиля. Первая версия программы настроена для сравнения художественных прозаических текстов, в основном романов.
Задачей этой программы является чтение и обработка присылаемого пользователем текста неизвестного происхождения с целью распознания его автора или выдачи списка наиболее близких к нему по стилистике авторов из числа входящих в некоторый заранее заданный перечень "эталонных" авторов. Предусмотрены три варианта вывода:
1. Скорее всего, этот текст принадлежит <автору имярек >. Этот вывод означает, что в нашей выборке имеются тексты присланного на исследования писателя.
2. Автора этого текста в нашей базе, по-видимому, нет. Этот вывод означает, что присланный текст содержит особенности индивидуального стиля, по которым он достаточно резко отличается от имеющихся в выборке писателей.
3. Этот текст, по-видимому, не содержит индивидуальных стилистических черт.
Список наиболее близких авторов (в порядке убывания вероятности):
<автор имярек >
<автор имярек >
<автор имярек >
Этот вывод означает, что присланный текст по стилистике не совпадает определенно ни с одним из имеющихся в выборке писателей и, в то же время, не имеет резких отличий сразу от нескольких из них.
Возможны как минимум два объяснения. Во-первых, расплывчатость стилистических показателей может быть связана с неоднородностью стилистики - отдельные фрагменты текста могут быть написаны настолько по-разному, что суммарный показатель оказывается излишне усредненным. Существует достаточно много художественных текстов, где стилистическая чересполосица (так сказать "полифония") входит в писательский замысел. Во-вторых, расплывчатость стиля может появляться вследствие подражательности или коллективного авторства, особенно в том случае, когда соавторы пишут по главам.
В следующей версии программы мы надеемся уйти от получившейся двусмысленности за счет проверки однородности стилистики на протяжении текста и определения точек перехода. То же самое касается и проверки романистики конкретного писателя на стилистическую однородность. Фактически проблема - в разбивке собрания сочинений некоторых авторов на различные периоды их творчества, характеризуемые сменой стиля. Такая работа предусматривается в будущем и программа может оказать существенную помощь при ее проведении, но тем не менее это потребует значительных затрат ручного труда при экспертной обработке текстов.