Повторный и бесповторный отбор
Ошибка выборки
Краткая теория
На основании выборочных данных дается оценка статистических показателей по всей (генеральной) совокупности. Подобное возможно, если выборка основывается на принципах случайности отбора и репрезентативности (представительности) выборочных данных. Каждая единица генеральной совокупности должна иметь равную возможность (вероятность) попасть в выборку.
При формировании выборочной совокупности используются следующие способы отбора: а) собственно-случайный отбор; б) механическая выборка; в) типический (районированный) отбор; г) многоступенчатая (комбинированная) выборка; д) моментно-выборочное наблюдение.
Выборка может осуществляться по схеме повторного и бесповторного отбора.
В первом случае единицы совокупности, попавшие в выборку, снова возвращаются в генеральную, а во втором случае – единицы совокупности, попавшие в выборку, в генеральную совокупность уже не возвращаются.
Выборка может осуществляться отдельными единицами или сериями (гнездами).
Собственно-случайная выборка
Отбор в этом случае производится либо по жребию, либо по таблицам случайных чисел.
На основании приемов классической выборки решаются следующие задачи:
а) определяются границы среднего значения показателя по генеральной совокупности;
б) определяются границы доли признака по генеральной совокупности.
Предельная ошибка средней при собственно-случайном отборе исчисляется по формулам:
а) при повторном отборе:
б) при бесповторном отборе:
где
– численность выборочной совокупности;
– численность генеральной совокупности;
– дисперсия признака;
– критерий кратности ошибки: при
;
при
;
при
.
Значения
определяются по таблице функции Лапласа.
Границы (пределы) среднего значения признака по генеральной совокупности определяются следующим неравенством:
где
– среднее значение признака по выборочной
совокупности.
Предельная ошибка доли при собственно-случайном отборе определяется по формулам:
а) при повторном отборе:
при бесповторном отборе:
где
– доля единиц совокупности с заданным
значением признака в обзей численности выборки,
– дисперсия доли признака.
Границы (пределы) доли признака по всей (генеральной) совокупности определяются неравенством:
где
– доля признака по генеральной совокупности.
Типическая (районированная) выборка
Особенность этого вида выборки заключается в том, что предварительно генеральная совокупность по признаку типизации разбивается на частные группы (типы, районы), а затем в пределах этих групп производится выборка.
Предельная ошибка средней при типическом бесповторном отборе определяется по формуле:
где
– средняя из внутригрупповых дисперсий
по каждой типичной группе.
При пропорциональном отборе из групп генеральной совокупности средняя из внутригрупповых дисперсий определяется по формуле:
где
– численности единиц совокупности групп по выборке.
Границы (пределы) средней по генеральной совокупности на основании
данных типической выборки определяются по тому же неравенству, что при
собственно-случайной выборке. Только предварительно необходимо вычислить общую
выборочную среднюю
из частных выборочных средних
.
Для случая пропорционального отбора это определяется по формуле:
При непропорциональном отборе средняя из внутригрупповых дисперсий вычисляется по формуле:
где
– численность единиц групп по генеральной
совокупности.
Общая выборочная средняя в этом случае определяется по формуле:
Предельная ошибка доли признака при типическом бесповторном отборе определяется формулой:
Средняя дисперсия доли
признака из групповых дисперсий доли
при
типической пропорциональной выборке вычисляется по формуле:
Средняя доля признака по выборке из показателей групповых долей рассчитывается формуле:
Средняя дисперсия доли при непропорциональном типическом отборе определяется следующим образом:
а средняя доля признака:
Формулы ошибок выборки при типическом повторном отборе будут те же,
то и для случая бесповторного отбора. Отличие заключается только в том, что в
них будет отсутствовать по корнем сомножитель
.
Серийная выборка
Серийная ошибка выборки может применяться в двух вариантах:
а) объем серий различный
б) все серии имеют одинаковое число единиц (равновеликие серии).
Наиболее распространенной
в практике статистических исследований является серийная выборка с
равновеликими сериями. Генеральная совокупность делится на одинаковые по объему
группы-серии
и
производится отбор не единиц совокупности, а серий
. Группы (серии) для обследования отбирают в
случайном порядке или путем механической выборки как повторным, так и
бесповторными способами. Внутри каждой отобранной серии осуществляется сплошное
наблюдение. Предельные ошибки выборки
при
серийном отборе исчисляются по формулам:
а) при повторном отборе
б) при бесповторном отборе
где
– число
серий в генеральной совокупности;
– число
отобранных серий;
– межсерийная дисперсия, исчисляемая для случая равновеликих
серий по формуле:
где
–
среднее значение признака в каждой из отобранных серий;
– межсерийная
средняя, исчисляемая для случая равновеликих серий по формуле:
Определение численности выборочной совокупности
При проектировании выборочного наблюдения важно наряду с организационными вопросами решить одну из основных постановочных задач: какова должна быть необходимая численность выборки с тем, чтобы с заданной степенью точности (вероятности) заранее установленная ошибка выборки не была бы превзойдена.
Формулы определения численности выборки при различных способах отбора
Способ отбора | Виды выборки | |||
для средней | для доли | |||
повторная выборка | бесповторная выборка | повторная выборка | бесповторная выборка | |
Собственно-случайная выборка |
|
|
|
|
Типическая выборка |
|
|
|
|
Серийная выборка |
|
|
------ | ------ |
Смежные темы решебника:
Примеры решения задач
Пример 1
Скачать пример 1 в формате pdf
На основании результатов проведенного на заводе 5% выборочного наблюдения (отбор случайный, бесповторный) получен следующий ряд распределения рабочих по заработной плате:
Группы рабочих по размеру заработной платы, тыс.р. | до 200 | 200-240 | 240-280 | 280-320 | 320 и выше | Итого |
Число рабочих | 33 | 35 | 47 | 45 | 40 | 200 |
На основании приведенных данных определите:
1) с вероятностью 0,954 (t=2) возможные пределы, в которых ожидается средняя заработная плата рабочего в целом по заводу (по генеральной совокупности);
2) с вероятностью 0,997 (t=3) предельную ошибку и границы доли рабочих с заработной платой от 320 тыс.руб. и выше.
Решение
На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение), а также онлайн-помощь на экзамене или зачете. Для этого вам нужно только связаться со мной:
Телеграм @helptask
ВКонтакте (vk.com/task100)
WhatsApp +7 (968) 849-45-98
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту.
Подробное решение получите точно в срок или раньше.
Вычислим среднюю з/п: Для этого просуммируем произведения середин интервалов и соответствующих частот, и полученную сумму разделим на сумму частот.
2) Выборочная дисперсия:
Найдем доверительный интервал для средней. Предельная ошибка выборочной средней считается по формуле:
где
-
аргумент функции Лапласа.
Искомые возможные пределы, в которых ожидается средняя заработная плата рабочего в целом по заводу:
Найдем доверительный интервал для выборочной доли. Предельная ошибка выборочной доли считается по формуле:
Доля рабочих с з/п от 320 тыс.р.:
Искомые границы доли рабочих с заработной платой от 320 тыс.руб. и выше:
Пример 2
Скачать пример 2 в формате pdf
В городе 23560 семей. В порядке механической выборки предполагается определить количество семей в городе с числом детей трое и более. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,02 человека. На основе предыдущих обследований известно, что дисперсия равна 0,3.
Решение
Численность выборки можно найти по формуле:
В нашем случае:
Вывод к задаче
Таким образом численность выборки должна составить 2661 чел.
Пример 3
Скачать пример 3 в формате pdf
С целью определения средней месячной заработной платы персонала фирмы было проведено 25%-ное выборочное обследование с отбором единиц пропорционально численности типических групп. Для отбора сотрудников внутри каждого филиала использовался механический отбор. Результаты обследования представлены в следующей таблице:
Номер филиала | Средняя месячная заработная плата, руб. | Среднее квадратическое отклонение, руб. | Число сотрудников, чел. |
1 | 870 | 40 | 30 |
2 | 1040 | 160 | 80 |
3 | 1260 | 190 | 140 |
4 | 1530 | 215 | 190 |
С вероятностью 0,954 определите пределы средней месячной заработной платы всех сотрудников гостиниц.
Решение
Предельная ошибка выборочной средней:
Средняя из внутригрупповых дисперсий:
Получаем:
Средняя месячная заработная плата по всей совокупности филиалов:
Искомые пределы средней месячной заработной платы:
Вывод к задаче
Таким образом с вероятностью 0,954 средняя месячная заработная плата всех сотрудников гостиниц находится в пределах от 1294,3 руб. до 1325,7 руб.