Поделиться Поделиться

Шкалы измерений, типы данных и переменных

Переменные различаются тем, как много измеряемой информации они содержат. Объём этой информации определяется выбранной шкалой измерения.

Шкала – это совокупность числовых значений какого-то признака, в которой введена единица измерения, направление возрастания или убывания и начало отсчета. Каждая шкала, как правило, применяется ко многим признакам и переменным. Шкала является инструментом измерения признаков или свойств тех или иных объектов. Каждая шкала предполагает наличие определенных правил её использования, например установление соответствия между числами и признаками или свойствами эмпирических объектов, преобразований шкал, т.е. приданию иных значений числовых выражений этих признаков и свойств, методов вычислений с числовыми значениями шкал. Шкалы могут объединяться в группы, которые имеют одинаковую форму и сходные правила использования.

Различают следующие типы шкал:

· Номинальная (номинативная) шкала.

· Порядковая (ординальная) или ранговая шкала.

· Интервальная шкала.

· Шкала отношений (шкала отношений или равных отношений).

Первые два вида шкал называются неметрическими, а последние два – метрическими шкалами.

Эти четыре шкалы измерения принадлежат к трем типам данных: качественные, порядковые и количественные. Данные – это информация, предназначенная для обработки с применением процедур, основанных на алгоритмах. Данные в ходе обработки нередко классифицируются, разбиваются на категории или преобразуются. Типы измеряемых данных определяют допустимые для данной шкалы математические преобразования, а также типы отношений, отображаемых соответствующей шкалой.

В номинальных шкалах нет ни единиц, ни направлений, а в порядковых – единиц. Но такие совокупности данных тоже включаются в типологию шкал для обеспечения единообразия изложения: от номинальной шкалы до шкалы отношений в каждом типе будут появляться те или иные дополнительные их свойства.

Номинальные переменные используются только для качественной классификации. Это означает, что данные переменные могут быть измерены только в терминах принадлежности к некоторым, существенно различным классам. Эти классы не могут быть упорядочены по увеличению или уменьшению интенсивности какого-то качества, например, лучше или хуже, больше или меньше. Типичные примеры номинальных переменных – пол, национальность, цвет, группа крови, город и т.д. Номинальные переменные – наблюдение, классифицированные в одну из целого ряда взаимоисключающих категорий. Например, человек может иметь лишь одну из четырех групп крови (I, II, III, IV). При этом установить, как группа крови лучше или какой пол у людей лучше – невозможно. Хотя обычно можно определить и группу крови и какому полу принадлежит человеческий индивид, а различать индивидов разного пола или с разными группами крови по их социальному статусу запрещают современные нормы прав человека. Часто номинальные переменные называют категориальными. Никакие арифметические операции с номинальными переменными невозможны, их можно только сравнивать на совпадение.

Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. На порядковой шкале значения переменных можно сравнивать только по порядку: какое больше или меньше, выше или ниже. Никакие другие сравнения невозможны. В частности, нельзя сказать «на сколько больше» или «на сколько меньше» одно значение другого. Порядковые переменные иногда также называют ординальными. Типичный пример порядковой переменной – социоэкономический статус семьи. Мы понимаем, что верхний средний уровень выше среднего уровня, однако сказать, что разница между ними равна, скажем, 18% мы не сможем. Другой пример – оценки на экзамене. Понятно, что высший балл – отлично, ниже – хорошо, ещё ниже – удовлетворительно. Но определить, например, насколько хорошо лучше, чем удовлетворительно невозможно. Никакие арифметические операции с номинальными переменными невозможны, их можно только сравнивать на совпадение или больше – меньше.

Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Для значений по этой шкале вполне осмыслен вопрос насколько одно значение больше или меньше другого. Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Можно не только сказать, что температура 40 градусов выше, чем температура 30 градусов, но и что увеличение температуры с 20 до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов. С интервальными переменными возможны операции сложения и вычитания, операции умножения и деления - невозможны.

Относительные переменные очень похожи на интервальные переменные. В дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их характерной чертой является наличие определенной точки абсолютного нуля или точки отсчёта. Таким образом, для этих переменных являются обоснованными предложения типа: одно значение в два раза больше, чем другое. Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура по Кельвину образует шкалу отношения, и можно не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. С относительными переменными возможны любые арифметические операции.

Правда, в большинстве статистических процедур не делается различия между свойствами интервальных шкал и шкал отношений. Это означает просто, что для интервальных шкал исследователи вводят условные точки отсчёта, которые фактически преобразуют интервальные переменные в относительные. Но для интервальных переменных такие точки отсчёта могут поменяться в других исследованиях, и тогда, например, пропорции значений таких переменных могут измениться. Это необходимо учитывать при интерпретации результатов анализа данных.

Сводная таблица характеристик типов шкал

Тип шкалы Отношения между шкальными значениями Допустимые преобразования шкалы Допустимые статистические расчеты Наличие нуля и единиц измерения
Номинальная шкала отношения неравенства, различия установление взаимооднозначных соответствий процент, доля, мода нет нуля, нет единиц измерения
Порядковая шкала есть иерархия признаков, сравнение, отношение неравенства. Больше, меньше, равно, не равно. сохранение порядка процент, доля, мода, медиана нет нуля, нет единиц измерения
Интервальная шкала равенство, неравенство, больше, меньше, больше на, меньше на. Отношения между интервалами. можно менять единицу измерения и условный ноль процент, доля. мода, медиана, среднее арифметическое, дисперсия, среднеквадратическое отклонение условный ноль, есть единицы измерения
Шкала отношений равенство, неравенство, больше, меньше, больше на, меньше на, больше в..., меньше в.... можно менять единицы измерения, ноль переносить нельзя процент, доля. мода, медиана, среднее арифметическое, дисперсия, среднеквадратическое отклонение абсолютный ноль, есть единицы измерения

Таблицы данных

Результаты сбора данных располагаются обычно в таблицах данных. В современной науке существует стандарт отображения данных в таблицах, который позволяет легко обрабатывать эти табличные данные с помощью практически любых статистических программ.

Таблица является весьма рациональной, наглядной и компактной формой представления результатов измерения тех или иных признаков, выраженных в соответствующих значениях переменных.

Таблица должна иметь заголовок, который показывает, какая информация располагается в ней. В самой таблице по столбцам располагаются наименования переменных, а по строкам – номера или много реже наименования объектов, признаки которых были измерены в переменных. Для использования методов современной прикладной статистики для целей анализа данных предпочтительно все результаты измерений признаков выражать в числовом виде. Тогда каждая номинальная или ранговая переменная получает коды значений соответствующего признака, которые часто имеют и словесное объяснение.

Примеры.

Список учебной группы (номинальная переменная):

1. Иванов

2. Петрова

3. Сидоров

Пол (номинальная переменная):

1. мужской

2. женский

Оценка на экзамене (ранговая переменная):

2. неудовлетворительно

3. удовлетворительно

4. хорошо

5. отлично

Рост в сантиметрах (относительная переменная).

Таблица данных оценок группы на экзамене может выглядеть так:

Оценки учебной группы на экзамене

№ по списку Пол Оценка Рост в см

В таком виде оценки учебной группы могут быть подвергнуты статистическому анализу. В частности, можно проверить, нет ли зависимости оценки на экзамене от пола, нет ли связи пола и роста. Это довольно обычные вопросы социальных и экономических исследований.

← Предыдущая страница | Следующая страница →