Аннотация:Целью работы является разработка метода верификации авторства коротких текстов. Специфика данной задачи подразумевает применение для ее решения методов машинного обучения. Так как искусственные нейронные сети на данный момент являются одним из наиболее эффективных подходов, автор выбрал их в качестве базового алгоритма для разрабатываемого метода верификации.
В рамках работы выполнен анализ ряда подходов к построению признаковых описаний текстов, на основании этого предложено признаковое пространство для представления коротких сообщений. В отличие от многих публикаций, где для определения авторства решается задача идентификации для фиксированного набора авторов, в данной работе предложен более универсальный подход, основанный на введении некоторого подобия метрики в пространстве сообщений: сообщения от одного автора «ближе» друг к другу, чем от разных. Вычисление значений данной метрики реализовано при помощи искусственной нейронной сети. Для принятия окончательного решение об авторстве сообщения в работе предложен статистический анализатор, который обрабатывает значения метрики для нескольких пар сообщений.