1

Компьютер сочинил альтернативные версии русских романов

Опубликовано: 12.04.2017


Доцент школы лингвистики НИУ ВШЭ Борис Орехов научил компьютер писать векторные романы.

Автор эксперимента решил посмотреть, как изменятся тексты из школьной программы, если все слова заменить на близкие по смыслу. Для этого были выбраны пять классических русских романов: «Евгений Онегин», «Преступление и наказание», «Война и мир», «Отцы и дети», «Мастер и Маргарита». С помощью сервиса RusVectōrēs все слова, исключая служебные части речи, были автоматически заменены на близкие по значению. В основе технологии лежат векторные модели, которые анализируют статистику употребления слов в миллионах текстов и извлекают данные об их значении. Использованная в эксперименте модель построена на текстах Национального корпуса русского языка и Википедии.

Альтернативные версии русской классики позволяют по-новому взглянуть на художественный текст и переосмыслить процесс литературного творчества. Оказывается, новые варианты текстов могут увлекать не меньше оригиналов: чего только стоит «Кампания и континент» — альтернативное название эпопеи Льва Толстого. Результаты исследования можно использовать на уроках литературы или русского языка: например, предложить ученикам опознать оригинальный текст в векторном романе. Все тексты доступны в открытом доступе.

Борис Орехов, :

«Конечно, в большей степени получившийся результат — это развлечение. Но не только. На основе этих текстов можно составлять задания для «олимпиад» по литературе. Кроме того, как кажется, эти тексты можно использовать для медленного чтения. Они могут помочь на каждом шаге задавать себе вопросы: «Почему здесь стоит это слово, а не другое?», «Что это нам даёт и что это меняет в нашем восприятии?» То есть, по сути, речь идёт о литературоведческом эксперименте, о введении экспериментальной плоскости в науку, которая, казалось бы, лишена её от природы и навсегда».