1

Словарь учебной аналитики: часть 3. Колокольчики, конкуренция, тайные связи

Опубликовано: 02.07.2018


Привет, это снова словарик учебной аналитики! Он поможет вам разобраться с основными терминами, которые используют для анализа данных. В сегодняшнем выпуске поговорим о том, как данные распределяются, как соотносятся и как показывают, кто круче.

Начальный уровень: «Распределение»

Когда речь идет о данных, распределение — это список всех точек в наборе данных и представление того, как часто они появляются. Самое частое распределение, с которым так или иначе сталкивались большинство людей, называется «нормальное распределение». Еще на него говорят «колокол», «распределение колокольчиком».

Простым примером распределения данных может служить список оценок в классе. Если ученики получают много четверок, но мало двоек, троек и пятерок, кривая на графике будет подниматься на оценке «4».

В «нормальном распределении» большинство данных собирается возле среднего значения и плавно «расходится» от него. При другом распределении данные могут быть разбросаны без заметного принципа. В таком случае, задача аналитика — найти этот самый принцип среди, казалось бы, хаотичного разброса значений.

Средний уровень: «Сравнение эффективности»

«Сравнение эффективности», или «бенчмаркинг» — термин, который часто встречается как в образовании, так и в бизнесе. В бизнесе это сравнение себя с конкурентами с помощью разных метрик и показателей. Насколько хорош поиск Яндекса по сравнению с Гуглом? Можно ответить на этот вопрос, используя такие показатели, как количество результатов, время, за которые они были получены, их качество (соответствие запросу) и другие.

В образовании сравнение эффективности работает точно также. Есть определенные стандарты, одинаковые для всех школ или университетов. Соответствие этим стандартам используется для сравнения.

Например, можно использовать трудоустройство выпускников как показатель эффективности университета, и сравнить: выпускники какого вуза чаще работают по специальности и больше зарабатывают?

Продвинутый уровень: «Реляционные данные»

На самом деле, большинство людей работает с данными, не подозревая, что их данные попадают в категорию «реляционных», или относительных. «Реляционные данные» — это данные, которые содержат идентификационный «ключ», уникальный для каждой строки. Этот ключ позволяет определить источник данных, им может быть, к примеру, номер ученического. Ключ можно использовать, чтобы сопоставить ваши данные с данными из других таблиц и посмотреть, как они соотносятся друг с другом и какие между ними связи.

На этом наш выпуск подходит к концу. Посмотрите еще первую часть и вторую. И ждите продолжения!

Источник: Learnmetrics Data Vocabulary