1

Словарь учебной аналитики: часть 4. Данные, данные и еще раз данные

Опубликовано: 11.07.2018


Привет, это четвертая часть словаря, который поможет вам понять и полюбить данные. Добавляем в нашу копилку еще три термина, без которых никуда!

Начальный уровень: «База данных»

Если вы слышали, что где-то хранятся данные, вы автоматически слышали о базах данных. По сути, это наборы данных, о которых мы уже писали, но — важная деталь — данные в этом наборе собраны не хаотично. Они организованы определенным образом, чтобы с ними было удобно работать.

У каждой школы есть множество данных об учениках: имена-фамилии, оценки, номера телефонов родителей... Эти данные станут базой, как только будут упорядочены так, что информацию можно будет легко найти, например, по фамилии ученика.

Для работы с базами данных нужны специальные программы. Самая простая и известная — Excel. Чуть сложнее программы для статистического анализа: SPSS, Stata, R.

Средний уровень: «Совокупные данные и дезагрегированные данные»

Снова термины, значение которые вы, скорее всего, знаете, просто называете другими словами. Совокупные данные — это данные из разных источников, собранные в единый показатель. Например, из данных о количестве учеников, их успеваемости и посещаемости занятий можно вывести общий показатель результативности школы.

Дезагрегированные данные — это данные, прошедшие обратную процедуру. Предположим, у нас есть результаты теста, который сдал каждый десятиклассник. Мы можем собрать их и посмотреть средний балл по школе. А можем сделать более интересный ход: разбить и перегруппировать результаты по таким показателям, как пол, средний уровень оценок, посещаемость. Тогда мы сможем сравнить: кто лучше сдал тест, мальчики или девочки? Как проявили себя признанные отличники? Сказались ли на результатах пропуски занятий?

Продвинутый уровень: «Метаданные»

Если коротко, метаданные — это данные о других данных.

Допустим, у нас есть база данных по каждому классу — всего 35 баз. У каждой из них есть определенные характеристики. К примеру, возьмем количество строк, соответствующее количеству учеников, имя классного руководителя, ответственного за заполнение базы, и ответ на вопрос, заполнена ли база до конца. Если мы захотим создать еще одну базу, в которой будет обобщающая информация о каждой из 35 баз по классам, мы получим метаданные — данные о данных.

Эта была четвертая часть словарика учебной аналитики. Первая, вторая и третья части доступны по ссылкам.

Источник: Learnmetrics Data Vocabulary