Поделиться Поделиться

Проверка статистической гипотезы о равенстве долей или вероятностей

Пусть в двух генеральных совокупностях проводятся независимые испытания, в результате которых может осуществиться или не осуществиться одно и то же событие.

Обозначим неизвестную долю появления этого события в первой генеральной совокупности через Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 1 , а во второй генеральной совокупности – через Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 2 . Нулевая гипотеза формулируется как утверждение о равенстве этих долей в обоих генеральных совокупностях: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 3 , где Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 4 - это просто обозначение общего значения долей в двух генеральных совокупностях. В качестве альтернативной гипотезы можно выбрать следующие варианты: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 5 - двусторонняя, Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 6 - односторонняя, Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 7 - тоже односторонняя.

Для осуществления проверки нулевой гипотезы производится выборка, объёмом Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 8 из первой генеральной совокупности, т.е. для этой генеральной совокупности произведено Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 9 испытаний. Пусть в этих испытаниях интересующее нас событие появлялось Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 10 раз. Тогда относительная частота появления этого события в выборке из первой генеральной совокупности Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 11 . Аналогично, производится выборка, объёмом Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 12 из второй генеральной совокупности, т.е. для этой генеральной совокупности произведено Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 13 испытаний. Пусть в этих испытаниях интересующее нас событие появлялось Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 14 раз. Тогда относительная частота появления этого события в выборке из второй генеральной совокупности Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 15 .

Если обе выборки достаточно велики, то законы распределения случайных величин Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 11 и Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 15 будут близки к нормальному.

Выше уже обосновывалось, что математическое ожидание выборочной частоты равно генеральной доле: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 18 и Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 19 . Дисперсии этих случайных величин таковы: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 20 и Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 21 .

Покажем, что Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 22 является несмещённой оценкой для Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 23 . Действительно, Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 24 . Поскольку испытания независимы, выборки будут тоже независимыми. Тогда можно использовать следующую формулу для дисперсии разности: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 25 .

Если нулевая гипотеза верна, то Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 26 . Величина Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 4 - неизвестна, её заменяют наилучшей точечной статистической оценкой: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 28 .

Для проверки нулевой гипотезы в этом случае используют Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 29 -оценку, имеющую стандартное нормальное распределение: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 30

Вычисленное значение Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 31 -оценки следует сравнить с критическим. А вывод о том, принимать или отклонять нулевую гипотезу определяется тем, как сформулированы альтернативные гипотезы.

Пусть уровень значимости равен Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 32 . Напомним, что уровень значимости задаёт исследователь из своих содержательных соображений, используя свой опыт проверки аналогичных гипотез. По таблицам или, например, в Excel необходимо определить значение Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 33 - границу критической области. Это значение аргумента, при котором стандартная нормальная величина принимает значение Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 32 .

Случай 1. Альтернативная гипотеза представлена двусторонним неравенством Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 5 (двусторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 36 . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 37 попадает в критическую область.

Случай 2. Альтернативная гипотеза представлена односторонним неравенством Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 6 (односторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 39 . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 37 попадает в критическую область.

Случай 3. Альтернативная гипотеза представлена односторонним неравенством Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 7 (односторонняя гипотеза).

Критическая область для такой альтернативной гипотезы будет задаваться неравенством: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 42 . Если это неравенство выполняется, нет оснований принимать нулевую гипотезу, т.е. она должна быть отклонена, поскольку значение статистического критерия Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 37 попадает в критическую область.

Пример. Для того чтобы оценить в сравнении активность электората Москвы и Санкт-Петербурга при избрании депутатов Государственной Думы, была сделана случайная выборка избирателей в этих двух городах. Затем выяснялось, какая часть каждой выборки реально пришла на тот или иной избирательный участок для участия в выборах. Данные оказались следующими: в Москве из 1500 потенциальных случайно выбранных избирателей реально в выборах приняли участие 480 человек, а в Санкт-Петербурге из 1630 потенциальных избирателей на избирательные участки пришли 490 человек. На уровне значимости 10% проверить гипотезу о равенстве генеральных долей избирателей в двух этих городах, которые реально приняли участие в выборах.

В качестве нулевой гипотезы можно принять равенство генеральных долей избирателей в Москве и в Санкт-Петербурге, а в качестве двусторонней альтернативной гипотезы – неравенство этих долей.

В данном случае в Москве приняли участие в выборах Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 44 человек из Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 45 избирателей, а в Санкт-Петербурге – Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 46 человек из Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 47 избирателей. Тогда доли избирателей из выборок, реально принявших участие в выборах в Москве равна Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 48 , а в Санкт-Петербурге – Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 49 .

Вычислим наилучшую точечную статистическую оценку доли, если она одинакова в обоих генеральных совокупностях: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 50 . Используя эту оценку доли избирателей, вычислим Z-оценку: Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 51 .

По таблице значений функции Лапласа или используя функцию =НОРМСТОБР в Microsoft Excel находим критические значения для нормального распределения: для уровня значимости 0,9 оно равно 1,2816, а дополнительно – для уровня значимости 0,95 оно равно 1,6449, для уровня значимости 0,99 оно равно 2,3263.

Для всех уровней значимости получается, что вычисленное значение Z-оценки оказалось меньшим критических при указанных выше уровнях значимости – 0,9, 0,95 и 0,99. Ъто означает, что вычисленное значение Z-оценки находится в области допустимых значений, поэтому нет оснований отвергать нулевую гипотезу. Следовательно, генеральные доли избирателей, реально принявших участие в выборах в Москве и в Санкт-Петербурге, статистически значимо не отличаются, т.е. их можно считать одинаковыми.

Покажем все найденные значения на графике плотности стандартного нормального закона распределения, который описывает поведение случайной величины Zпри справедливости нулевой гипотезы.

a/2=0.05 a
Zкр= -1.65 0 Zкр=1.65 x
a/2=0.05 a
g=0.90 a
p(x) Zнабл=1.17


График стандартного нормального распределения с указанием области допустимых и критических значений для уровня значимости 0,9 ( Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 52 ). Тогда Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 53 , а Проверка статистической гипотезы о равенстве долей или вероятностей - Инвестирование - 54 ).

На этом графике видно, что красная точка, соответствующая вычисленному значению Z-оценки, находится внутри области допустимых значений нулевой гипотезы на уровне значимости 0,9. Это положение красной точки и определяет вывод о том, что нет оснований отвергать нулевую гипотезу на этом уровне значимости.

← Предыдущая страница | Следующая страница →