Повторный и бесповторный отбор
Ошибка выборки
На основании выборочных данных дается оценка статистических показателей по всей (генеральной) совокупности. Подобное возможно, если выборка основывается на принципах случайности отбора и репрезентативности (представительности) выборочных данных. Каждая единица генеральной совокупности должна иметь равную возможность (вероятность) попасть в выборку.
При формировании выборочной совокупности используются следующие способы отбора: а) собственно-случайный отбор; б) механическая выборка; в) типический (районированный) отбор; г) многоступенчатая (комбинированная) выборка; д) моментно-выборочное наблюдение.
Выборка может осуществляться по схеме повторного и бесповторного отбора.
В первом случае единицы совокупности, попавшие в выборку, снова возвращаются в генеральную, а во втором случае – единицы совокупности, попавшие в выборку, в генеральную совокупность уже не возвращаются.
Выборка может осуществляться отдельными единицами или сериями (гнездами).
Собственно-случайная выборка
Отбор в этом случае производится либо по жребию, либо по таблицам случайных чисел.
На основании приемов классической выборки решаются следующие задачи:
а) определяются границы среднего значения показателя по генеральной совокупности;
б) определяются границы доли признака по генеральной совокупности.
Предельная ошибка средней при собственно-случайном отборе исчисляется по формулам:
а) при повторном отборе:
б) при бесповторном отборе:
где – численность выборочной совокупности; – численность генеральной совокупности; – дисперсия признака; – критерий кратности ошибки: при ; при ; при .
Значения определяются по таблице функции Лапласа.
Границы (пределы) среднего значения признака по генеральной совокупности определяются следующим неравенством:
где – среднее значение признака по выборочной совокупности.
Предельная ошибка доли при собственно-случайном отборе определяется по формулам:
а) при повторном отборе:
при бесповторном отборе:
где – доля единиц совокупности с заданным значением признака в обзей численности выборки, – дисперсия доли признака.
Границы (пределы) доли признака по всей (генеральной) совокупности определяются неравенством:
где – доля признака по генеральной совокупности.
Типическая (районированная) выборка
Особенность этого вида выборки заключается в том, что предварительно генеральная совокупность по признаку типизации разбивается на частные группы (типы, районы), а затем в пределах этих групп производится выборка.
Предельная ошибка средней при типическом бесповторном отборе определяется по формуле:
где – средняя из внутригрупповых дисперсий по каждой типичной группе.
При пропорциональном отборе из групп генеральной совокупности средняя из внутригрупповых дисперсий определяется по формуле:
где – численности единиц совокупности групп по выборке.
Границы (пределы) средней по генеральной совокупности на основании данных типической выборки определяются по тому же неравенству, что при собственно-случайной выборке. Только предварительно необходимо вычислить общую выборочную среднюю из частных выборочных средних . Для случая пропорционального отбора это определяется по формуле:
При непропорциональном отборе средняя из внутригрупповых дисперсий вычисляется по формуле:
где – численность единиц групп по генеральной совокупности.
Общая выборочная средняя в этом случае определяется по формуле:
Предельная ошибка доли признака при типическом бесповторном отборе определяется формулой:
Средняя дисперсия доли признака из групповых дисперсий доли при типической пропорциональной выборке вычисляется по формуле:
Средняя доля признака по выборке из показателей групповых долей рассчитывается формуле:
Средняя дисперсия доли при непропорциональном типическом отборе определяется следующим образом:
а средняя доля признака:
Формулы ошибок выборки при типическом повторном отборе будут те же, то и для случая бесповторного отбора. Отличие заключается только в том, что в них будет отсутствовать по корнем сомножитель .
Серийная выборка
Серийная ошибка выборки может применяться в двух вариантах:
а) объем серий различный
б) все серии имеют одинаковое число единиц (равновеликие серии).
Наиболее распространенной в практике статистических исследований является серийная выборка с равновеликими сериями. Генеральная совокупность делится на одинаковые по объему группы-серии и производится отбор не единиц совокупности, а серий . Группы (серии) для обследования отбирают в случайном порядке или путем механической выборки как повторным, так и бесповторными способами. Внутри каждой отобранной серии осуществляется сплошное наблюдение. Предельные ошибки выборки при серийном отборе исчисляются по формулам:
а) при повторном отборе
б) при бесповторном отборе
где – число серий в генеральной совокупности; – число отобранных серий; – межсерийная дисперсия, исчисляемая для случая равновеликих серий по формуле:
где – среднее значение признака в каждой из отобранных серий; – межсерийная средняя, исчисляемая для случая равновеликих серий по формуле:
Определение численности выборочной совокупности
При проектировании выборочного наблюдения важно наряду с организационными вопросами решить одну из основных постановочных задач: какова должна быть необходимая численность выборки с тем, чтобы с заданной степенью точности (вероятности) заранее установленная ошибка выборки не была бы превзойдена.
Формулы определения численности выборки при различных способах отбора
Способ отбора | Виды выборки | |||
для средней | для доли | |||
повторная выборка | бесповторная выборка | повторная выборка | бесповторная выборка | |
Собственно-случайная выборка | ||||
Типическая выборка | ||||
Серийная выборка | ------ | ------ |
Пример 1
На основании результатов проведенного на заводе 5% выборочного наблюдения (отбор случайный, бесповторный) получен следующий ряд распределения рабочих по заработной плате:
Группы рабочих по размеру заработной платы, тыс.р. | до 200 | 200-240 | 240-280 | 280-320 | 320 и выше | Итого |
Число рабочих | 33 | 35 | 47 | 45 | 40 | 200 |
На основании приведенных данных определите:
1) с вероятностью 0,954 (t=2) возможные пределы, в которых ожидается средняя заработная плата рабочего в целом по заводу (по генеральной совокупности);
2) с вероятностью 0,997 (t=3) предельную ошибку и границы доли рабочих с заработной платой от 320 тыс.руб. и выше.
Решение
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Вычислим среднюю з/п: Для этого просуммируем произведения середин интервалов и соответствующих частот, и полученную сумму разделим на сумму частот.
2) Выборочная дисперсия:
Найдем доверительный интервал для средней. Предельная ошибка выборочной средней считается по формуле:
где - аргумент функции Лапласа.
Искомые возможные пределы, в которых ожидается средняя заработная плата рабочего в целом по заводу:
Найдем доверительный интервал для выборочной доли. Предельная ошибка выборочной доли считается по формуле:
Доля рабочих с з/п от 320 тыс.р.:
Искомые границы доли рабочих с заработной платой от 320 тыс.руб. и выше:
Пример 2
В городе 23560 семей. В порядке механической выборки предполагается определить количество семей в городе с числом детей трое и более. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,02 человека. На основе предыдущих обследований известно, что дисперсия равна 0,3.
Решение
Численность выборки можно найти по формуле:
В нашем случае:
Вывод к задаче
Таким образом численность выборки должна составить 2661 чел.
Пример 3
С целью определения средней месячной заработной платы персонала фирмы было проведено 25%-ное выборочное обследование с отбором единиц пропорционально численности типических групп. Для отбора сотрудников внутри каждого филиала использовался механический отбор. Результаты обследования представлены в следующей таблице:
Номер филиала | Средняя месячная заработная плата, руб. | Среднее квадратическое отклонение, руб. | Число сотрудников, чел. |
1 | 870 | 40 | 30 |
2 | 1040 | 160 | 80 |
3 | 1260 | 190 | 140 |
4 | 1530 | 215 | 190 |
С вероятностью 0,954 определите пределы средней месячной заработной платы всех сотрудников гостиниц.
Решение
Предельная ошибка выборочной средней:
Средняя из внутригрупповых дисперсий:
Получаем:
Средняя месячная заработная плата по всей совокупности филиалов:
Искомые пределы средней месячной заработной платы:
Вывод к задаче
Таким образом с вероятностью 0,954 средняя месячная заработная плата всех сотрудников гостиниц находится в пределах от 1294,3 руб. до 1325,7 руб.