Поделиться Поделиться

Проверка статистической гипотезы о равенстве долей или вероятностей

Пусть в двух генеральных совокупностях проводятся независимые испытания, в результате которых может осуществиться или не осуществиться одно и то же событие.

Обозначим неизвестную долю появления этого события в первой генеральной совокупности через Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  1 , а во второй генеральной совокупности – через Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  2 . Нулевая гипотеза формулируется как утверждение о равенстве этих долей в обоих генеральных совокупностях: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  3 , где Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  4 - это просто обозначение общего значения долей в двух генеральных совокупностях. В качестве альтернативной гипотезы можно выбрать следующие варианты: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  5 - двусторонняя, Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  6 - односторонняя, Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  7 - тоже односторонняя.

Для осуществления проверки нулевой гипотезы производится выборка, объёмом Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  8 из первой генеральной совокупности, т.е. для этой генеральной совокупности произведено Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  9 испытаний. Пусть в этих испытаниях интересующее нас событие появлялось Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  10 раз. Тогда относительная частота появления этого события в выборке из первой генеральной совокупности Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  11 . Аналогично, производится выборка, объёмом Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  12 из второй генеральной совокупности, т.е. для этой генеральной совокупности произведено Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  13 испытаний. Пусть в этих испытаниях интересующее нас событие появлялось Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  14 раз. Тогда относительная частота появления этого события в выборке из второй генеральной совокупности Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  15 .

Если обе выборки достаточно велики, то законы распределения случайных величин Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  11 и Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  15 будут близки к нормальному.

Выше уже обосновывалось, что математическое ожидание выборочной частоты равно генеральной доле: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  18 и Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  19 . Дисперсии этих случайных величин таковы: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  20 и Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  21 .

Покажем, что Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  22 является несмещённой оценкой для Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  23 . Действительно, Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  24 . Поскольку испытания независимы, выборки будут тоже независимыми. Тогда можно использовать следующую формулу для дисперсии разности: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  25 .

Если нулевая гипотеза верна, то Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  26 . Величина Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  4 - неизвестна, её заменяют наилучшей точечной статистической оценкой: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  28 .

Для проверки нулевой гипотезы в этом случае используют Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  29 -оценку, имеющую стандартное нормальное распределение: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  30

Вычисленное значение Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  31 -оценки следует сравнить с критическим. А вывод о том, принимать или отклонять нулевую гипотезу определяется тем, как сформулированы альтернативные гипотезы.

Пусть уровень значимости равен Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  32 . Напомним, что уровень значимости задаёт исследователь из своих содержательных соображений, используя свой опыт проверки аналогичных гипотез. По таблицам или, например, в Excel необходимо определить значение Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  33 - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  32 .

Случай 1. Альтернативная гипотеза представлена двусторонним неравенством Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  5 (двусторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  36 . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  37 попадает в критическую область.

Случай 2. Альтернативная гипотеза представлена односторонним неравенством Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  6 (односторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  39 . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  37 попадает в критическую область.

Случай 3. Альтернативная гипотеза представлена односторонним неравенством Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  7 (односторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  42 . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  37 попадает в критическую область.

Пример. Для того чтобы оценить в сравнении активность электората Москвы и Санкт-Петербурга при избрании депутатов Государственной Думы, была сделана случайная выборка избирателей в этих двух городах. Затем выяснялось, какая часть каждой выборки реально пришла на тот или иной избирательный участок для участия в выборах. Данные оказались следующими: в Москве из 1500 потенциальных случайно выбранных избирателей реально в выборах приняли участие 480 человек, а в Санкт-Петербурге из 1630 потенциальных избирателей на избирательные участки пришли 490 человек. На уровне значимости 10% проверить гипотезу о равенстве генеральных долей избирателей в двух этих городах, которые реально приняли участие в выборах.

В качестве нулевой гипотезы можно принять равенство генеральных долей избирателей в Москве и в Санкт-Петербурге, а в качестве двусторонней альтернативной гипотезы – неравенство этих долей.

В данном случае в Москве приняли участие в выборах Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  44 человек из Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  45 избирателей, а в Санкт-Петербурге – Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  46 человек из Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  47 избирателей. Тогда доли избирателей из выборок, реально принявших участие в выборах в Москве равна Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  48 , а в Санкт-Петербурге – Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  49 .

Вычислим наилучшую точечную статистическую оценку доли, если она одинакова в обоих генеральных совокупностях: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  50 . Используя эту оценку доли избирателей, вычислим Z-оценку: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  51 .

По таблице значений функции Лапласа или используя функцию =НОРМСТОБР в Microsoft Excel находим критические значения для нормального распределения: для уровня значимости 0,9 оно равно 1,2816, а дополнительно – для уровня значимости 0,95 оно равно 1,6449, для уровня значимости 0,99 оно равно 2,3263.

Для всех уровней значимости получается, что вычисленное значение Z-оценки оказалось меньшим критических при указанных выше уровнях значимости – 0,9, 0,95 и 0,99. Ъто означает, что вычисленное значение Z-оценки находится в области допустимых значений, поэтому нет оснований отвергать нулевую гипотезу. Следовательно, генеральные доли избирателей, реально принявших участие в выборах в Москве и в Санкт-Петербурге, статистически значимо не отличаются, т.е. их можно считать одинаковыми.

Покажем все найденные значения на графике плотности стандартного нормального закона распределения, который описывает поведение случайной величины Zпри справедливости нулевой гипотезы.

a/2=0.05 a
Zкр= -1.65 0 Zкр=1.65 x
a/2=0.05 a
g=0.90 a
p(x) Zнабл=1.17


График стандартного нормального распределения с указанием области допустимых и критических значений для уровня значимости 0,9 ( Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  52 ). Тогда Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  53 , а Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование -  54 ).

На этом графике видно, что красная точка, соответствующая вычисленному значению Z-оценки, находится внутри области допустимых значений нулевой гипотезы на уровне значимости 0,9. Это положение красной точки и определяет вывод о том, что нет оснований отвергать нулевую гипотезу на этом уровне значимости.

← Предыдущая страница | Следующая страница →