Повторный и бесповторный отбор
Ошибка выборки

Краткая теория

На основании выборочных данных дается оценка статистических показателей по всей (генеральной) совокупности. Подобное возможно, если выборка основывается на принципах случайности отбора и репрезентативности (представительности) выборочных данных. Каждая единица генеральной совокупности должна иметь равную возможность (вероятность) попасть в выборку.

При формировании выборочной совокупности используются следующие способы отбора: а) собственно-случайный отбор; б) механическая выборка; в) типический (районированный) отбор; г) многоступенчатая (комбинированная) выборка; д) моментно-выборочное наблюдение.

Выборка может осуществляться по схеме повторного и бесповторного отбора.

В первом случае единицы совокупности, попавшие в выборку, снова возвращаются в генеральную, а во втором случае – единицы совокупности, попавшие в выборку, в генеральную совокупность уже не возвращаются.

Выборка может осуществляться отдельными единицами или сериями (гнездами).

Собственно-случайная выборка

Отбор в этом случае производится либо по жребию, либо по таблицам случайных чисел.

На основании приемов классической выборки решаются следующие задачи:

а) определяются границы среднего значения показателя по генеральной совокупности;

б) определяются границы доли признака по генеральной совокупности.

Предельная ошибка средней при собственно-случайном отборе исчисляется по формулам:

а) при повторном отборе:

б) при бесповторном отборе:

где  – численность выборочной совокупности;  – численность генеральной совокупности;  – дисперсия признака;  – критерий кратности ошибки: при ; при ; при .

Значения   определяются по таблице функции Лапласа.

Границы (пределы) среднего значения признака по генеральной совокупности определяются следующим неравенством:

где  – среднее значение признака по выборочной совокупности.

Предельная ошибка доли при собственно-случайном отборе определяется по формулам:

а) при повторном отборе:

при бесповторном отборе:

где  – доля единиц совокупности с заданным значением признака в обзей численности выборки,  – дисперсия доли признака.

Границы (пределы) доли признака по всей (генеральной) совокупности определяются неравенством:

где  – доля признака по генеральной совокупности.

Типическая (районированная) выборка

Особенность этого вида выборки заключается в том, что предварительно генеральная совокупность по признаку типизации разбивается на частные группы (типы, районы), а затем в пределах этих групп производится выборка.

Предельная ошибка средней при типическом бесповторном отборе определяется по формуле:

где  – средняя из внутригрупповых дисперсий  по каждой типичной группе.

При пропорциональном отборе из групп генеральной совокупности средняя из внутригрупповых дисперсий определяется по формуле:

где  – численности единиц совокупности групп по выборке.

Границы (пределы) средней по генеральной совокупности на основании данных типической выборки определяются по тому же неравенству, что при собственно-случайной выборке. Только предварительно необходимо вычислить общую выборочную среднюю  из частных выборочных средних . Для случая пропорционального отбора это определяется по формуле:

При непропорциональном отборе средняя из  внутригрупповых дисперсий вычисляется по формуле:

где  – численность единиц групп по генеральной совокупности.

Общая выборочная средняя в этом случае определяется по формуле:

 

Предельная ошибка доли признака при типическом бесповторном отборе определяется формулой:

Средняя дисперсия доли признака из групповых дисперсий доли  при типической пропорциональной выборке вычисляется по формуле:

Средняя доля признака по выборке из показателей групповых долей рассчитывается формуле:

Средняя дисперсия доли при непропорциональном типическом отборе определяется следующим образом:

а средняя доля признака:

Формулы ошибок выборки при типическом повторном отборе будут те же, то и для случая бесповторного отбора. Отличие заключается только в том, что в них будет отсутствовать по корнем сомножитель .

Серийная выборка

Серийная ошибка выборки может применяться в двух вариантах:

а) объем серий различный

б) все серии имеют одинаковое число единиц (равновеликие серии).

Наиболее распространенной в практике статистических исследований является серийная выборка с равновеликими сериями. Генеральная совокупность делится на одинаковые по объему группы-серии  и производится отбор не единиц совокупности, а серий . Группы (серии) для обследования отбирают в случайном порядке или путем механической выборки как повторным, так и бесповторными способами. Внутри каждой отобранной серии осуществляется сплошное наблюдение. Предельные ошибки выборки  при серийном отборе исчисляются по формулам:

а) при повторном отборе

б) при бесповторном отборе

где  – число серий в генеральной совокупности;  – число отобранных серий;  – межсерийная дисперсия, исчисляемая для случая равновеликих серий по формуле:

где  – среднее значение признака в каждой из отобранных серий;  – межсерийная средняя, исчисляемая для случая равновеликих серий по формуле:

Определение численности выборочной совокупности

При проектировании выборочного наблюдения важно наряду с организационными вопросами решить одну из основных постановочных задач: какова должна быть необходимая численность выборки с тем, чтобы с заданной степенью точности (вероятности) заранее установленная ошибка выборки не была бы превзойдена.

Формулы определения численности выборки при различных способах отбора

Способ отбора Виды выборки
для средней для доли
повторная выборка бесповторная выборка повторная выборка бесповторная выборка
Собственно-случайная выборка
Типическая выборка
Серийная выборка ------ ------
Примеры решения задач

Пример 1

На основании результатов проведенного на заводе 5% выборочного наблюдения (отбор случайный, бесповторный) получен следующий ряд распределения рабочих по заработной плате:

Группы рабочих по размеру заработной платы, тыс.р. до 200 200-240 240-280 280-320 320 и выше Итого
Число рабочих 33 35 47 45 40 200

На основании приведенных данных определите:

1) с вероятностью 0,954 (t=2) возможные пределы, в которых ожидается средняя заработная плата рабочего в целом по заводу (по генеральной совокупности);

2) с вероятностью 0,997 (t=3) предельную ошибку и границы доли рабочих с заработной платой от 320 тыс.руб. и выше.

Решение

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:

Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Вычислим среднюю з/п: Для этого просуммируем произведения середин интервалов и соответствующих частот, и полученную сумму разделим на сумму частот.

2) Выборочная дисперсия:

Найдем доверительный интервал для средней. Предельная ошибка выборочной средней считается по формуле:

где  - аргумент функции Лапласа.  

Искомые возможные пределы, в которых ожидается средняя заработная плата рабочего в целом по заводу:

 

Найдем доверительный интервал для выборочной доли. Предельная ошибка выборочной доли считается по формуле:

Доля рабочих с з/п от 320 тыс.р.:

 

Искомые границы доли рабочих с заработной платой от 320 тыс.руб. и выше:


Пример 2

В городе 23560 семей. В порядке механической выборки предполагается определить количество семей в городе с числом детей трое и более. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,02 человека. На основе предыдущих обследований известно, что дисперсия равна 0,3.

Решение

Численность выборки можно найти по формуле:

В нашем случае:

 

Вывод к задаче

Таким образом численность выборки должна составить 2661 чел.


Пример 3

С целью определения средней месячной заработной платы персонала фирмы было проведено 25%-ное выборочное обследование с отбором единиц пропорционально численности типических групп. Для отбора сотрудников внутри каждого филиала использовался механический отбор. Результаты обследования представлены в следующей таблице:

Номер филиала Средняя месячная заработная плата, руб. Среднее квадратическое отклонение, руб. Число сотрудников, чел.
1 870 40 30
2 1040 160 80
3 1260 190 140
4 1530 215 190

С вероятностью 0,954 определите пределы средней месячной заработной платы всех сотрудников гостиниц.

Решение

Предельная ошибка выборочной средней:

Средняя из внутригрупповых дисперсий:

Получаем:

Средняя месячная заработная плата по всей совокупности филиалов:

Искомые пределы средней месячной заработной платы:

Вывод к задаче

Таким образом с вероятностью 0,954 средняя месячная заработная плата всех сотрудников гостиниц находится в пределах от 1294,3 руб. до 1325,7 руб.