1

Словарь учебной аналитики: часть 1. Пироги, темные личности, маскировка

Опубликовано: 13.06.2018


Что нужно знать для грамотной работы с образовательными данными? В первую очередь, терминологию. Платформа Learnmetrix, помогающая американским школам собирать и анализировать данные об учебном процессе, сделала небольшой словарь самых важных терминов. А мы его перевели!

Начальный уровень: «Набор данных»

Когда мы впервые смотрим на данные, то, как правило, видим хаотичные, сбивающие с толку числа и обозначения. Главный секрет работы с данными заключается в том, чтобы уметь отрезать от большого пирога данных маленький, но точный кусочек. «Набор данных» — это массив нужной вам информации, который можно рассматривать как по кусочкам, так и в целом.

К примеру, набором данных может быть ведомость с оценками 5-Б класса по математике за 2016/17 учебный год. Мы сможем посмотреть на оценки каждого ученика по отдельности, а сможем проанализировать всех скопом, чтобы выявить закономерности развития класса.

Средний уровень: «Персональные данные»

Работая с данными о людях — в нашем случае, это преимущественно, школьники и студенты — очень важно помнить, какой у этих данных источник. Сам термин «персональные данные» указывает на то, что информацию можно отследить, понять, кому она принадлежит.

Есть два типа персональных данных: прямые идентификаторы и непрямые. Первые указывают на личность человека прямым текстом. Это такие вещи, как имя школьника или номер студенческого билета. По непрямым идентификаторы установить личность чуть сложнее, но тоже возможно. Здесь используются косвенные показатели: адрес, дата рождения, номер телефона родителей.

Довольно часто возникает путаница: что считать персональными данными, а что нет, которая заметно мешает работе аналитиков. Об этом в интервью Edutainme говорил аналитик Stepic Максим Скрябин. По словам Максима, закон о персональных данных довольно запутан, и механизмы, когда, как, в каком объеме и кому можно предоставлять данные, еще не выработаны. Из-за этого источники боятся лишний раз раскрывать данные, а исследователи не могут получить информацию, необходимую для работы.

Продвинутый уровень: «Маскировка данных»

«Маскировка данных» — это способ защиты конфиденциальной информации. Этот термин буквально означает что при обработке данных можно изменить, «замаскировать» их оригинальные значения. Самый простой способ — заменить имена школьников на номера. Каждому ребенку присваивается уникальный номер, и под этим номером его данные вносятся в базу. Если речь идет о более широком масштабе, например, об анализе всех школ в стране, номера можно присваивать не детям, а, собственно, школам.

Если вам интересно, с помощью каких механизмов анализ данных способен изменить образование, почитайте материал «Учебная аналитика: типы и способы применения».

Продолжение следует.