Поделиться Поделиться

Выборка как модель генеральной совокупности. Цели и задачи выборочного метода.

По традиции множества объектов, которые изучаются в статистике называют статистическими совокупностями.

Статистическая совокупность– это множество единиц изучаемого явления, объединенных единой качественной основой, общей связью, но отличающихся друг от друга отдельными признаками. Таковы, например, совокупность домохозяйств, совокупность семей, совокупность предприятий, фирм, объединений и т.п. Таким образом, статистическая совокупность – это множество однотипных объектов, объединяемых общими признаками, но имеющими и некоторые различия, позволяющие эти объекты отличать один от другого.

Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность, в которую входят явления разного типа, считается разнородной.

Совокупность может быть однородна в одном отношении и разнородна в другом. В каждом отдельном случае однородность совокупности устанавливается путем проведения качественного анализа, выяснения содержания изучаемого общественного явления.

Объём совокупности – это число её элементов.

Генеральная совокупность– полная совокупность объектов, имеющих отношение к изучаемой проблеме. В статистических и социологических исследованиях в качестве генеральной совокупности чаще всего используются совокупности индивидов – население (города, страны и т.п.), социальная группа (молодежь, безработные, бизнесмены и т.п.), аудитория средств массовой коммуникации (СМК) и другие. Однако во многих случаях генеральной совокупности могут состоять из более крупных элементов (объектов) – семей (домохозяйств), академических групп, предприятий, религиозных общин, отдельных населенных пунктов или государств и т.п.

Большие по объёму генеральные совокупности изучать трудно, а иногда и просто невозможно. Так практически невозможно определить наиболее часто встречающееся мнение граждан нашей страны по тому или иному вопросу, опрашивая каждого из них. Во-первых, такой опрос потребовал бы очень много времени, ответы первых опрошенных будут определять одни условия, а ответы последних – другие условия социальной жизни, информация, представленная в этот момент в СМИ, и т.п. Во-вторых, такой опрос потребовал бы очень больших финансовых затрат, ведь пришлось бы ездить в отдалённые сёла, на Крайний Север к постоянно передвигающимся оленеводам и т.п. В-третьих, в любом случае каждого гражданина страны опросить бы не удалось по разным случайным причинам: кто-то оказался бы в командировке, кто-то, договорившись о встрече с интервьюером, на неё бы не пришёл, кто-то, начав отвечать на вопрос, затем потребовал бы не фиксировать его ответ, и т.п. Поэтому свойства генеральных совокупностей в статистике, как правило, изучают на основе сделанных из них выборок, т.е. множеств объектов, полученных извлечением сравнительно небольшого их числа из генеральной совокупности.

Выборка никогда не может абсолютно точно представить свойства генеральной совокупности. Но в статистике при правильном построении выборки почти всегда удаётся получить оценки этих свойств генеральной совокупности с любой наперёд заданной точностью.

Корректное определение генеральной совокупности и ее характеристик чрезвычайно важно для выбора дизайна исследования – стратегии построения репрезентативной выборки Важнейшими характеристиками генеральной совокупности являются ее объем и доступность элементов для определения и изучения.

С точки зрения объема, принято выделять конечные и бесконечные генеральной совокупности. Это деление является чисто техническим, оно обусловлено особенностями процедур оценивания объема и ошибок репрезентативной вероятностной (случайной) выборки. Конечными считаются генеральной совокупности, численность которых сопоставима с объемом выборки. Если объем выборки превышает несколько процентов от численности генеральной совокупности, ошибку выборки необходимо оценивать с поправкой на объем генеральной совокупности.

Бесконечными называются генеральной совокупности, объем которых, по сравнению с объемом репрезентативной случайной выборки, несоизмеримо велик. Строго говоря, все генеральные совокупности в социальных науках конечны (даже если их численность составляет несколько миллиардов), однако на практике генеральную совокупность можно считать бесконечной, если объем выборки, обеспечивающий приемлемый уровень ошибки, не превышает 1-2 % от ее численности. Иногда понятие бесконечности связывают непосредственно с объемом генеральной совокупности, например, более ста тысяч объектов.

Генеральные совокупности, принадлежность к которым очевидна или легко устанавливается, называются конкретными. Для конкретных генеральных совокупностей несложно определить объем и получить относительно полный список их элементов - основу выборки. Например, список совершеннолетних жителей города можно получить в адресном столе, а списки студентов крупного города - в университетах. Если конкретная генеральная совокупность очень велика (например, население страны), списки могут быть получены для всех ее структурных частей. Построение случайной репрезентативной выборки для конкретных генеральных совокупностей технически всегда возможно; проблемы могут возникнуть в связи с недостатком времени, квалифицированного персонала, финансовых или материальных ресурсов.

Генеральные совокупности, принадлежность к которым можно установить только в результате целенаправленных процедур или специальных исследований, называются гипотетическими. К таким генеральным совокупностям относятся, например, аудитории СМК (нельзя узнать, видел ли человек конкретный рекламный ролик, если не спросить его об этом), любители определенных видов аквариумных рыбок, эксперты по узкой проблеме и т.п. Для определения объема некоторых гипотетических генеральных совокупностей также необходимы специальные исследования. Возможность построения случайной репрезентативной выборки для гипотетичных генеральных совокупностей большого объема во многих случаях представляется проблематичной.

Выборочная совокупность или выборка– это часть генеральной совокупности, непосредственно участвующая в исследовании. Проблема формирования выборки (отбора объектов из генеральной совокупности) является важнейшей методологической проблемой для всех видов социологического исследования, за исключением полного обследования генеральной совокупности и, в некоторых случаях, полевого исследования. Но такие исследования проводятся сравнительно редко в силу их дороговизны и большой длительности сбора данных.

Выборкибывают следующих видов:

Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность.

Бесповторная – отобранный объект в генеральную совокупность не возвращается.

Объём выборки – это число объектов в ней.

Выборки репрезентативность- свойство выборки, заключающееся в ее способности адекватно представлять состояние дел в генеральной совокупности. В количественных исследованиях различают статистическое и нестатистическое обоснование репрезентативности.

Статистическое обоснование репрезентативности применяется к случайным (вероятностным, статистическим) выборкам - простым, стратифицированным, кластеризованным, многоступенчатым. Оно обеспечивается оцениванием случайной ошибки выборки для наиболее важных, с точки зрения целей исследования, переменных.

Для обеспечения репрезентативности выборки необходимо обеспечить равные вероятности попадания в такую выборку для каждого элемента генеральной совокупности. Для этого применяют различные методы, в частности, выбор таких элементов из генеральной совокупности с помощью таблиц случайных чисел, генераторов случайных чисел на компьютерах и т.п. Обычно элементы генеральной совокупности нумеруют от 1 до N, где N – объём генеральной совокупности, а затем тем или иным случайным способом определяют номера элементов генеральной совокупности, которые включаются в выборку. Так построенная выборка называется простой случайной выборкой. Другие варианты репрезентативной выборки строятся сложнее, их цель не только обеспечить равные вероятности попадания в них элементов генеральной совокупности, но и удобство сбора данных, например, при опросах граждан.

Простым, но не очень точным методом построения выборки неслучайной, но легко строемой, является механический отбор объектов в неё, когда отбор объектов в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки, т.е. единице, делённой на долю, которую выборка занимает в генеральной совокупности. Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке — каждая 20-я единица (1:0,05) и т.д. Иначе говоря, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь один объект.

В некоторых случаях для построения выборок применяется типический отбор. Для этого генеральная совокупность вначале расчленяется на однородные типические группы по тем или иным признакам или совокупностям признаков. Затем из каждой типической группы производится случайная по таблице случайных чисел или механическая выборка объектов. Общая совокупность объектов, отобранных из каждой типической группы, и составляет типическую выборку. Типическая выборка обычно применяется при изучении сложных статистических совокупностей, например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации, при обследовании представителей бизнеса, которых необходимо разделять хотя бы на типы малого, среднего и крупного, и т.п. Во многих социальных исследованиях типические выборки дают более точные результаты по сравнению с выборками, полученными другими методами.

Нестатистическое обоснование репрезентативности применяется к целевым (квотным, "основного массива", "снежного кома" и т.п.) выборкам. Репрезентативность квотной выборки обычно обосновывается соответствия распределения выборки распределению генеральной совокупности по наиболее важным социально-демографическим показателям, таким как пол, возраст, образование и т.п., а также применением рандомизирующих процедур при отборе респондентов, таких как использование элементов маршрутной выборки, запрет на опрос родственников и знакомых и др. Для выборки, полученной методом "основного массива" или "снежного кома" (когда опрошенных спрашивают, кого ещё по их мнению, можно привлечь к проводимому исследованию), обоснование репрезентативности строится на основе оценки неохваченной части генеральной совокупности - ее объема, а также существенности отличий от выборки исследования.

Выборки качественных исследований обосновываются теоретически и, в силу этого, часто называются теоретическими.

Существуют и другие методы построения выборок, в том числе – комбинации разных способов отбора на нескольких этапах построения выборочной совокупности.

Значение выборочного методасостоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции (товара), если проверка сопровождается уничтожением или разложением на составные части обследуемых образцов (определение сахаристости фруктов, клейковины печеного хлеба, установление носкости обуви, прочности тканей на разрыв и т.д.).

Цель выборочного метода– получение характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от целей исследований это осуществляется или прямым пересчётом показателей выборки для генеральной совокупности, или с учётом поправочных коэффициентов.

Показатели генеральной совокупности, которые изучаются в том или ином исследовании, называются параметрами. Показатели выборки, которые используются для оценивания показателей генеральной совокупности, называются статистиками. Таким образом, целью выборочного метода является оценка значений параметров по значениям статистик.

Задачи выборочного методаопределяются его целью. Поскольку статистики выборки должны адекватно оценивать параметры генеральной совокупности, необходимо осуществлять репрезентативные выборки, т.е. представительные для данных генеральных совокупностей. В большинстве случаев репрезентативность выборки обеспечивает случайный отбор объектов в неё.

Случайность при построении выборки не является стихийностью или произвольностью отбора объектов в неё. Напротив, случайность отбора объектов в выборку в данном случае означает то, что все объекты генеральной совокупности должны иметь равные шансы попасть в эту выборку. В этом случае и можно надеяться, что выборка будет с равной вероятностью представлять каждый объект генеральной совокупности, т.е. будет репрезентативной для неё.

Важной задачей выборочного метода поэтому является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности.

← Предыдущая страница | Следующая страница →