Идентифицировать пользователей Интернета будут по стилю

По сообщению издания SC Magazine Australia, появилась технология, позволяющая при помощи применения лингвистического анализа определить, кто именно написал ту, или иную публикацию, размещенную без подписи, или же под чужим именем. Технология была продемонстрирована в Берлине, в рамках проводившейся там конференции 29С3.

Предложили этот лингвистический способ учащиеся аспирантуры Университета Дрекселя из Соединенных Штатов Америки. В качестве «сырья» для последующего анализа могут использоваться любые текстовые сообщения – форумные посты, сообщения в ICQ или Skype, письма, отправленные по электронной почте, или тексты в блоге. Общие для всех сообщений особенности и определенные закономерности выявляются при помощи применения статистических методов, позволяющих вычислить особенности стиля.

Садиа Афроз, которая стала одним из авторов этого нового метода, отметила, что вставленные в переписку служебные слова помогают в самые сжатые сроки определить, кто именно выступил автором текста. Под служебными словами подразумеваются «связки», отображающие зависимость слов в предложении друг от друга.

Пока что этот метод рассчитан на использование лишь в английском языке, хотя, как утверждается, допустимо также использование обычного онлайн-переводчика. Кроме того, метод пока неустойчив при использовании нетрадиционных алфавитов. Тем не менее, если раньше для опознания человека при помощи устной речи надо было диктофон купить, а затем анализировать полученные записи, то новый метод позволяет рассчитывать на столь же точную идентификацию печатных текстов.

Конечно, речь не идет о поиске среди бесконечного множества авторов. Однако определить одного из полусотни «подозреваемых» можно уже сегодня, правда, при условии наличия на каждого «языкового досье». Возможно, со временем метод станет более совершенным.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *