Поделиться Поделиться

Понятие описательной статистики

Описательная статистика – это совокупность методов и способов сбора и суммирования количественных данных, используемая для превращения больших объёмов цифровых данных в форму, удобную для восприятия и обсуждения.

Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.

Описательная статистика нужна, как правило, для понимания характера совокупности, сырых данных. Включает в себя различные методы агрегирования данных. Общие из них таковы:

1. Частотный анализ

· Анализ гистограммы

· Подгонка распределения

2. Вычисление и анализ показателей центра распределения

· Мода

· Медиана

· Среднее

3. Оценка разброса данных в совокупности

· Стандартное отклонение

· Дисперсия

· Коэффициенты вариации

Расчет средних величин производится разными способами, и, соответственно, применение их тоже зависит от исследуемой совокупности.

Ряд распределения

Ряд распределения - совокупность значений (или интервалов значений) переменной и их частот. Обычно ряд распределения представляют таблицей. Значения переменной X обычно обозначают Понятие описательной статистики - Инвестирование - 1 , соответствующие им частоты - Понятие описательной статистики - Инвестирование - 2 .

Различают абсолютные или относительные частоты. Абсолютная частота представляет собой количество объектов из выборки, обладающих соответствующим значением переменной. Сумма абсолютных частот равна объему выборки.

Совокупность абсолютных частот, упорядоченных по возрастанию значений, называется вариационным рядом. Причина такого названия в том, что значения Понятие описательной статистики - Инвестирование - 1 часто называют вариантами.

Относительная частота может выражаться в долях единицы или в процентах. Сумма относительных частот, выраженных в долях, равна 1, сумма относительных частот в процентах - 100%.

Ряд распределения относительных частот для генеральной совокупности – это ряд распределения случайной величины X/

Если переменная является дискретной, частоты обычно вычисляют для каждого значения, как в этом примере:

значения (xi)
частоты (fi)
относительные частоты (pi) 15/120 30/120 40/120 25/120 10/120
накопленные частоты (Fi)  

Если переменная является непрерывной, значения предварительно должны быть сгруппированы в интервалы (см. Группировка). (См. Таблицу 7 в Приложении.)

Для количественных и порядковых переменных может вычисляться накопленная частота ( Понятие описательной статистики - Инвестирование - 4 ), представляющая собой сумму частот всех значений, от Понятие описательной статистики - Инвестирование - 5 до Понятие описательной статистики - Инвестирование - 6 : Понятие описательной статистики - Инвестирование - 7 . По накопленной частоте Понятие описательной статистики - Инвестирование - 4 можно определить, для какой части выборки значения переменной X не превосходят значения Понятие описательной статистики - Инвестирование - 9 . Так, в примере с 5-балльной шкалой 85 респондентов из 120 поставили оценки, не превосходящие 3 баллов (1, 2 и 3). Во втором примере накопленная частота 41,5% для интервала 20-29 лет свидетельствует о том, что 41,5% населения не достигло 30-летнего возраста.

Если переменная X является непрерывной, её значения предварительно должны быть сгруппированы в интервалы, чтобы можно было из них составить ряд распределения.

Понятие «группировка » в статистике может иметь два основных значения.

1) Группировка – процедура разделения шкалы переменной на интервалы: как правило, применяется к непрерывным переменным. Различают три основных вида группирования количественных шкал. Аналитическая группировка предназначена для изучения характеристик распределения переменной и представляет собой значительное количество интервалов (обычно 12-15) одинаковой длины. Процентильная (перцентильная) группировка позволяет получить интервалы с заданным числом объектов внутри каждого интервала. Типологическая группировка предполагает разделение шкалы на небольшое количество интервалов, имеющих содержательную интерпретацию.

2) Группировка - распределение объектов из выборки по классам, образованным значениями дискретных или интервалами непрерывных переменных. Группировка по нескольким критериям (перекрестная классификация, кросстабуляция) представляет собой распределение объектов по классам, образованным "пересечением" классов по каждому отдельно взятому критерию. Примером такой группировки является поло-возрасто-образовательная структура населения.

Таблица поло-возрасто-образовательная структура населения

Возраст 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80+
fi 11,3% 16,2% 14% 15,4% 14,9% 9,6% 10,5% 6,3% 1,8% 100%
Fi 11,3% 27,5% 41,5% 56,9% 71,8% 81,4% 91,9% 98,2% 100%  
← Предыдущая страница | Следующая страница →