Типы переменных
Подробнее поговорим о разных типах переменных, которые могут характеризовать наш объект наблюдения. В датасете переменные представлены в столбцах. Умение определять тип переменных – необходимое условие для корректного анализа и визуализации данных.
Выделяются 4 основных типа.
Категориальные (номинальные) переменные – называют категории, по которым распределяются данные.
Категории могут быть любыми:
- Москва, Петербург, Казань.
- Молоко, кефир, масло.
- Шагал, Миро, Пикассо и так далее.
Если переменная может принимать только два значения, то она относится к подтипу бинарных: да/нет, правда/ложь.
Представим, что мы анализируем горячие напитки. В этом случае возможными категориальными переменными могут быть: кофе, чай, какао. А бинарными переменными: горячий или холодный напиток.
Количественные дискретные переменные – всё, что мы можем посчитать. Дискретные переменные выражены только целыми числами. Например:
- 5 учеников в классе (не может быть 1.5 ученика)
- 6 парков в городе (невозможно иметь 6.7 парков).
В нашем исследовании горячих напитков дискретной переменной может быть – количество кусочков сахара, которое мы положили в чашки:
Количественные непрерывные переменные – всё, что мы можем измерить. Непрерывные переменные могут принимать любое целые и нецелые значения из диапазона:
- 4.5 килограммов,
- 124.6 километров и так далее.
В случае с нашими чашками непрерывная переменная – это объём напитка:
Ранговые переменные – представляют категории с некоторым упорядочением. Например:
- уровни удовлетворенности обслуживанием: от крайней неудовлетворенности до крайней удовлетворенности,
- порядковый номер бегуна – первый, второй третий.
Ранговая переменная, которая может характеризовать горячие напитки – их степень крепости:
Как видите, определение типа переменных – не самая сложная задача (главное – не запутаться в названиях). Поэтому предлагаем закрепить типы переменных с помощью небольшого теста.