Поделиться Поделиться

Генеральная и выборочная совокупности

Генеральной совокупностью называется вся подлежащая изучению совокупность объектов (наблюдений). Один или несколько элементов, взятых из генеральной совокупности для получения информации о ней, называется выборочной совокупностью или выборкой. Объемом совокупности (выборочной или генеральной) называется число элементов этой совокупности.

Метод статистического исследования, состоящий в том, что на основе изучения выборки делается заключение обо всей генеральной совокупности, называется выборочным. Для того чтобы по отобранным значениям некоторого показателя можно было достаточно уверенно судить обо всей совокупности, полученная выборка должна быть репрезентативной (представительной), т.е. правильно отражать пропорции генеральной совокупности. Выборка будет представительной лишь тогда, когда все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку.

В дальнейшем под генеральной совокупностью будем подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В статистике обычно исследуемые случайные величины называют признаками и обозначают большими латинскими буквами Генеральная и выборочная совокупности - Инвестирование - 101 , Генеральная и выборочная совокупности - Инвестирование - 102 и т.д.

Выборку будем рассматривать как совокупность независимых случайных величин Генеральная и выборочная совокупности - Инвестирование - 103 , распределенных так же, как и случайная величина (признак) Генеральная и выборочная совокупности - Инвестирование - 101 , представляющая генеральную совокупность.Конкретные значения, которые приняли эти случайные величины в результате эксперимента, называют реализацией выборки или значениями признака и обозначают строчными буквами Генеральная и выборочная совокупности - Инвестирование - 104 . Различные значения признака называют вариантами.

Вариационные ряды

Числа, показывающие, сколько раз встречаются варианты Генеральная и выборочная совокупности - Инвестирование - 105 в выборке, называются частотами (обозначаются Генеральная и выборочная совокупности - Инвестирование - 106 ).

Вариационным (статистическим) рядом называется расположенный в порядке возрастания или убывания ряд вариант с соответствующими им частотами. Вариационный ряд часто называют рядом распределения выборки.

Вариация (изменение) количественных признаков может быть дискретной, например, академическая система успеваемости: 5 – отлично, 4 – хорошо и т.д., или непрерывной, например, возраст, рост или вес человека. В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину. Он представляет собой таблицу, состоящую из двух строк: конкретных значений признака и их частот:

Генеральная и выборочная совокупности - Инвестирование - 105 Генеральная и выборочная совокупности - Инвестирование - 107 Генеральная и выборочная совокупности - Инвестирование - 108 Генеральная и выборочная совокупности - Инвестирование - 109
Генеральная и выборочная совокупности - Инвестирование - 106 Генеральная и выборочная совокупности - Инвестирование - 110 Генеральная и выборочная совокупности - Инвестирование - 111 Генеральная и выборочная совокупности - Инвестирование - 112

где Генеральная и выборочная совокупности - Инвестирование - 113 .

Вариационный ряд называется интервальным, если варианты могут отличаться один от другого на сколь угодно малую величину[1]. Он представляет собой таблицу, состоящую из двух строк – интервалов значений признака и числа значений выборки, попадающих в этот интервал:

Интервал, Генеральная и выборочная совокупности - Инвестирование - 114 Генеральная и выборочная совокупности - Инвестирование - 115 Генеральная и выборочная совокупности - Инвестирование - 116 Генеральная и выборочная совокупности - Инвестирование - 117
Частота, Генеральная и выборочная совокупности - Инвестирование - 106 Генеральная и выборочная совокупности - Инвестирование - 110 Генеральная и выборочная совокупности - Инвестирование - 111 Генеральная и выборочная совокупности - Инвестирование - 112

Числовые характеристики

Вариационный ряд содержит достаточно полную информацию об изменчивости признака. Однако обилие числовых данных, с помощью которых он задается, усложняет их использование. В то же время на практике часто оказывается достаточным знание лишь сводных числовых характеристик выборочной совокупности. Рассмотрим наиболее часто используемые числовые характеристики вариационных рядов: среднюю арифметическую, дисперсию и среднее квадратическое отклонение.

Средняя арифметическая

Средние величины характеризуют значения признака, вокруг которого концентрируются наблюдения. Наиболее распространенной из средних величин является средняя арифметическая. Для ее расчета используют формулу:

Генеральная и выборочная совокупности - Инвестирование - 118 , (14)

где Генеральная и выборочная совокупности - Инвестирование - 105 – варианты, Генеральная и выборочная совокупности - Инвестирование - 106 – соответствующие им частоты, Генеральная и выборочная совокупности - Инвестирование - 119 – объем совокупности.

Если средняя арифметическая рассчитывается по всей генеральной совокупности в целом, то ее называют генеральной средней, а если по выборке – выборочной средней.

Если статистический материал представлен в виде интервального вариационного ряда, то при расчете выборочной средней сначала необходимо вычислить середины каждого интервала Генеральная и выборочная совокупности - Инвестирование - 120 , которые рассчитываются по формуле: Генеральная и выборочная совокупности - Инвестирование - 121 . Далее расчеты ведутся, как и для дискретного вариационного ряда, но в качестве вариантов используем Генеральная и выборочная совокупности - Инвестирование - 120 .

Дисперсия и среднее квадратическое отклонение

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формуле:

Генеральная и выборочная совокупности - Инвестирование - 122 . (15)

Дисперсия, рассчитанная для генеральной совокупности, называется генеральной дисперсией, а для выборки – выборочной дисперсией.

При вычислении выборочной дисперсии для интервальных вариационных рядов в качестве Генеральная и выборочная совокупности - Инвестирование - 105 , как и при вычислении выборочной средней, используются середины соответствующих интервалов.

Иногда, особенно если дисперсию приходится рассчитывать «вручную», удобнее использовать другую формулу, которая легко получается из формулы (15) с помощью несложных математических преобразований:

Генеральная и выборочная совокупности - Инвестирование - 123 . (16)

Среднее квадратическое отклонение представляет собой квадратный корень из дисперсии:

Генеральная и выборочная совокупности - Инвестирование - 124 .

Среднее квадратическое отклонение (СКО) выражается в тех же единицах измерения, что и признак.

Точечные оценки

Большинство случайных величин имеют распределения, зависящие от одного или нескольких параметров. Так, например, нормальное распределение зависит от параметров Генеральная и выборочная совокупности - Инвестирование - 125 и Генеральная и выборочная совокупности - Инвестирование - 126 .

Выборочная характеристика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется статистической точечной оценкой этого параметра. Статистическая оценка неизвестных параметров теоретического распределения генеральной совокупности (или просто параметров генеральной совокупности) – одна из основных задач математической статистики.

Обозначим через Генеральная и выборочная совокупности - Инвестирование - 127 некоторый неизвестный параметр генеральной совокупности, а через Генеральная и выборочная совокупности - Инвестирование - 128 – точечную оценку этого параметра. Оценка Генеральная и выборочная совокупности - Инвестирование - 128 есть функция Генеральная и выборочная совокупности - Инвестирование - 129 от выборки объема Генеральная и выборочная совокупности - Инвестирование - 119 из независимых случайных величин Генеральная и выборочная совокупности - Инвестирование - 130 , каждая из которых имеет тот же закон распределения, что и генеральная совокупность. Поэтому оценка Генеральная и выборочная совокупности - Инвестирование - 128 , как функция случайных величин, также является случайной величиной, в отличие от оцениваемого параметра Генеральная и выборочная совокупности - Инвестирование - 127 , который является величиной неслучайной, детерминированной.

Оценка Генеральная и выборочная совокупности - Инвестирование - 128 для параметра Генеральная и выборочная совокупности - Инвестирование - 131 называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е. Генеральная и выборочная совокупности - Инвестирование - 132 . В противном случае оценка называется смещенной.

Несмещенность – свойство оценок при фиксированном Генеральная и выборочная совокупности - Инвестирование - 119 . Оно означает отсутствие ошибки "в среднем", т.е. при систематическом использовании данной оценки.

Рассмотрим некоторые наиболее часто встречающиеся точечные оценки параметров генеральной совокупности.

1. Выборочная средняя Генеральная и выборочная совокупности - Инвестирование - 133 есть несмещенная оценка для генеральной средней Генеральная и выборочная совокупности - Инвестирование - 134 , причем Генеральная и выборочная совокупности - Инвестирование - 135 , где Генеральная и выборочная совокупности - Инвестирование - 136 – объем выборки, Генеральная и выборочная совокупности - Инвестирование - 137 – генеральная дисперсия признака.

2. Выборочная дисперсия Генеральная и выборочная совокупности - Инвестирование - 138 является смещенной оценкой генеральной дисперсии Генеральная и выборочная совокупности - Инвестирование - 137 .

3. Исправленная дисперсия Генеральная и выборочная совокупности - Инвестирование - 139 , вычисляемая по формуле

Генеральная и выборочная совокупности - Инвестирование - 140 (17)

или

Генеральная и выборочная совокупности - Инвестирование - 141 , (18)

является несмещенной оценкой для генеральной дисперсии Генеральная и выборочная совокупности - Инвестирование - 137 .

Разница между Генеральная и выборочная совокупности - Инвестирование - 142 и Генеральная и выборочная совокупности - Инвестирование - 143 заметна при небольшом числе наблюдений Генеральная и выборочная совокупности - Инвестирование - 136 . При Генеральная и выборочная совокупности - Инвестирование - 144 получим, что Генеральная и выборочная совокупности - Инвестирование - 145 , т.е. в качестве оценки Генеральная и выборочная совокупности - Инвестирование - 137 вполне можно использовать выборочную дисперсию Генеральная и выборочная совокупности - Инвестирование - 142 .

Интервальные оценки

Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной, то для выборок небольшого объема вопрос точности оценок становится очень важным.

Чтобы получить представление о точности и надежности оценки Генеральная и выборочная совокупности - Инвестирование - 128 параметра Генеральная и выборочная совокупности - Инвестирование - 131 , используют интервальную оценку параметра.

Интервальной оценкой параметра Генеральная и выборочная совокупности - Инвестирование - 131 называется числовой интервал Генеральная и выборочная совокупности - Инвестирование - 146 , который с заданной вероятностью Генеральная и выборочная совокупности - Инвестирование - 147 накрывает неизвестное значение параметра Генеральная и выборочная совокупности - Инвестирование - 131 , т.е. Генеральная и выборочная совокупности - Инвестирование - 148 . Такой интервал Генеральная и выборочная совокупности - Инвестирование - 146 называется доверительным, а вероятность Генеральная и выборочная совокупности - Инвестирование - 149доверительной вероятностью или надежностью оценки.

Обычно надежность оценки Генеральная и выборочная совокупности - Инвестирование - 149 задается заранее величиной, близкой к единице, например: 0,9, 0,95, 0,99 или 0,999.

Границы доверительного интервала и его длина находятся по выборочным данным и поэтому являются случайными величинами. Длина доверительного интервала уменьшается с ростом объема выборки Генеральная и выборочная совокупности - Инвестирование - 119 и увеличивается с ростом доверительной вероятности Генеральная и выборочная совокупности - Инвестирование - 147 .

Очень часто (но не всегда) доверительный интервал выбирается симметричным относительно несмещенной точечной оценки Генеральная и выборочная совокупности - Инвестирование - 128 , т.е. выбирается интервал вида Генеральная и выборочная совокупности - Инвестирование - 150 . Число Генеральная и выборочная совокупности - Инвестирование - 151 при этом называется точностью оценки.

Так, например, интервальная оценка (доверительный интервал) для генеральной средней Генеральная и выборочная совокупности - Инвестирование - 134 исследуемого признака Генеральная и выборочная совокупности - Инвестирование - 101 , имеющего нормальное распределение, может быть найдена по формуле:

Генеральная и выборочная совокупности - Инвестирование - 152 . (19)

В случае, когда генеральная дисперсия Генеральная и выборочная совокупности - Инвестирование - 137 известна (например, это заранее заданная ошибка измерительного прибора), то точность оценки Генеральная и выборочная совокупности - Инвестирование - 151 находится по формуле:

Генеральная и выборочная совокупности - Инвестирование - 153 , (20)

где Генеральная и выборочная совокупности - Инвестирование - 119 – объем выборки, а число Генеральная и выборочная совокупности - Инвестирование - 154 определяется из равенства Генеральная и выборочная совокупности - Инвестирование - 155 , т.е. по таблице значений функции Лапласа Генеральная и выборочная совокупности - Инвестирование - 156 находится значение аргумента Генеральная и выборочная совокупности - Инвестирование - 154 , которому соответствует значение функции Генеральная и выборочная совокупности - Инвестирование - 156 , равное Генеральная и выборочная совокупности - Инвестирование - 157 .

В случае, когда генеральная дисперсия Генеральная и выборочная совокупности - Инвестирование - 137 неизвестна, а известна лишь ее оценка – исправленная выборочная дисперсия Генеральная и выборочная совокупности - Инвестирование - 158 , то точность оценки Генеральная и выборочная совокупности - Инвестирование - 151 находится по формуле:

Генеральная и выборочная совокупности - Инвестирование - 159 , (21)

где значение числа Генеральная и выборочная совокупности - Инвестирование - 160 определяется по таблице критических точек распределения Стьюдента при доверительной вероятности Генеральная и выборочная совокупности - Инвестирование - 147 и числе степеней свободы Генеральная и выборочная совокупности - Инвестирование - 161 .

Замечание. Если выборка Генеральная и выборочная совокупности - Инвестирование - 130 объема Генеральная и выборочная совокупности - Инвестирование - 119 представляет собой набор независимых одинаково распределенных случайных величин, то, согласно центральной предельной теореме, распределение Генеральная и выборочная совокупности - Инвестирование - 162 при больших Генеральная и выборочная совокупности - Инвестирование - 119 близко к стандартному нормальному. Это позволяет строить доверительный интервал для генеральной средней Генеральная и выборочная совокупности - Инвестирование - 134 по формулам (19) и (20) при любом распределении признака, если объем выборки является достаточно большим ( Генеральная и выборочная совокупности - Инвестирование - 163 ), при этом в качестве Генеральная и выборочная совокупности - Инвестирование - 137 используется ее любая оценка.

← Предыдущая страница | Следующая страница →