1

Литературоведение в цифровую эпоху

Как и зачем строить онтологии для текстов?

Опубликовано: 08.01.2016


Каждая область человеческого знания поддается классификации. Таксономии и стандарты плотно вошли в жизнь обычного человека, предлагая модели научного знания, системы для хранения знаний в виде библиотек или педагогических теорий. Виталий Болатаев, аспирант факультета философии НИУ ВШЭ, рассказывает, почему за построением онтологий – будущее.

Еще Аристотель, первый классификатор, создал деление наук на теоретические и практические для всестороннего образования гражданина полиса – пайдейи. Весь миропорядок можно уложить в формальные логические структуры, которые разделяют мир на категории, каждая из которых отличается от другой логическими свойствами. Начиная с Декарта вся новоевропейская наука была увлечена построением классификаций и рубрикаторов: система Линнея, таблица периодических элементов Менделеева, матрицы Лейбница и модели физических законов Ньютона. Немалая часть границ между дисциплинами возникли из-за разницы в классификациях.

Современные образовательные технологии позволяют по-новому взглянуть на эти задачи, используя инструмент, пришедший из философского жаргона – онтологии. Онтология – это попытка формализовать существующую область знаний с помощью некоторой схемы, в которой ключевую роль играет практика применения. Инструмент построения онтологий не просто позволяет увидеть значимые связи между объектами и логическими классами, но и является попыткой по-новому взглянуть на природу человеческого знания. В последние годы технологии представления знаний, которые обычно маркировались как семантические сети, начали активно использоваться в философии, истории, литературы (онтологии описания литературных персонажей).

Производство метаданных становится рутинной частью рабочих процессов преподавателей и кураторов учебных курсов. Цифровая среда становится культурной средой, а старые классификации – онтологиями.

Построение онтологии по литературным текстам

Литературоведение, конечно, не может быть формализовано до положения абсолютно точной науки, но при помощи расширения объектного поля богатством интерпретаций, она может стать куда более строгой. Предложенный эскиз представляет собой описание концептуальной иерархии понятий в литературном произведении.

Для нашей цели мы используем роман «Москва-Петушки» Венедикта Ерофеева как веховое произведение советской эпохи. Мемуаристы свидетельствуют, что писатель Ерофеев обладал тягой к ненормативному классификаторству: «Каждое лето он вел дневник грибника. Возвратившись с добычей ... он открывал записную книжку и, тщательно рассортировав находки и пересчитав каждую кучку, вносил в соответствующие графы (далее таблица, сколько в какой день найдено отдельно белых, подберезовиков, свинушек, лисичек и сыроежек)» (цит. по книге Вячеслава Курицина). Построение онтологии алкогольных напитков или онтологии-классификации персонажей может стать своеобразной формой «логического постмодернизма» – рациональной реконструкцией личности писателя.

Другая, более существенная задача – это экземплификация гуманитарных знаний из произведения, первый шаг к гипертекстовой энциклопедии знаний о повседневности советского человека.

В качестве программы мы возьмем Protégé – инструмент, разработанный Стэнфордским университетом специально для задач онтоинженерии. В Protégé по умолчанию уже стоит класс «вещь» из которого мы в виде дерева можем вводить подклассы. После первичного класса вводятся подклассы, а уже в них индивиды – конкретные вещи и сущности.

Онтология первая: напитки

Построение онтологии напитков. Фрагмент онтологии напитков. Онтология напитков.

Какие выводы можно сделать, построив классификацию напитков, упоминаемых в романе? Венечка действительно пародирует большинство коктейлей – учитывая, что большинство напитков состоят всего из двух компонентов, его коктейли (множества) обладают большей логической мощностью. Частично это может быть интерпретировано как противопоставление народной культуры пития – официозной. Такая онтология грешит разделением повторяющихся подклассов – большинство готовых напитков, не употреблялись в чистом виде, а исполосовывались в качестве готовых ингредиентов. Потребление в чистом виде готовых образцов промышленного производства отвергалось, предпочитая смешиваемость напитка, как подлинно «народный» стиль.

Онтология вторая: персонажи

Построение онтологии персонажей. Онтология: персонажи.

Персонажи вымышленные и реальные, их литературные портреты и описания позволяют более жестко воспроизвести логику произведения. В дальнейших планах построения такой онтологии – создание связей конкретных персонажей с конкретным произведением, которые читал Венечка (широкая связь Митридиата Евпатора с классическими «Жизнеописаниями Плутарха» советских лет издания). Такая мифология персонажей позволяет проследить и источники творчества автора.

В конце концов, онтология – это просто инструмент, и выбор онтологии должен задаваться прагматическими задачами.

Онтоинженерию в педагогике можно использовать двояко: с одной стороны, это инструмент для подготовки бизнес-архитекторов в духе логического стандарта ISO 15926, на котором основана все бизнес-логика крупных компаний. С другой стороны, это первый и важный шаг для подготовки нового поколения компьютерных лингвистов с их ориентацией на онтологии предметных областей, которые описывают язык и которая уже реализована в программе ABBYY Compreno. Вслед за ними подтягивается информационная архитектура, копирайтинг и контент-менеджмент крупных СМИ с их манифестами создания эко-систем продуктов. Компетенции создания онтологий для студентов становятся мейнстримом на Западе, а философы, логики и филологи получают новый инструмент для развития собственных университетских дисциплин в плане практического применения результатов лекционных курсов. А студенты задействуют большое количество навыков – от логической классификации до изучения моделей различных дисциплин и получают уникальный опыт синтеза знаний.

Виталий Болатаев