Структурные средние - мода, медиана, квантиль, дециль

Краткая теория

Наиболее широкое применение в статистике имеют структурные средние, к числу которых относятся мода и медиана (непараметрические средние).

Мода  - величина признака (варианта), которая встречается в ряду распределения с наибольшей частотой (весом). К моде (Мо) прибегают для выявления величины признака, имеющей наибольшее распространение (цена на рынке, по которой было совершено наибольшее число продаж данного товара, номер обуви, который пользуется наибольшим спросом у покупателей и т. д.). Мода используется только в совокупностях большой численности. В дискретном ряду мода находится как варианта, имеющая наибольшую частоту. В интервальном ряду сначала находится модальный интервал, то есть  интервал, обладающий наибольшей частотой, а затем – приближенное значение модальной величины признака по формуле:

 – нижняя граница модального интервала

  - величина модального интервала

 – частота интервала, предшествующего модальному

 – частота модального интервала

   – частота интервала, следующего за модальным

Квантили - величины, разделяющие совокупность на определенной количество равных по численности элементов частей. Самый известный квантиль – медиана,  делящая совокупность на две равные части.  Кроме медианы часто используются квартили,  делящие ранжированный ряд на 4 равные части,  децили -10 частей и перцентили - на 100 частей.

Медиана - величина признака у единицы, находящейся в середине ранжированного (упорядоченного) ряда. Если ряд распределения представлен конкретными значениями признака, то медиана (Me) находится как серединное значение признака.

Если ряд распределения дискретный, то медиана находится как серединное значение признака (например, если число значений нечетное – 45, то  соответствует 23 значению признака в ряду значений, расположенных в порядке возрастания, если число значений четное – 44, то медиана соответствует полусумме 22 и 23 значений признака).

Если ряд распределения интервальный, то первоначально находят медианный интервал, который содержит единицу, находящуюся в середине ранжированного ряда. Для определения этого интервала сумму частот  делят пополам и на основании  последовательного накопления (суммирования) частот интервалов, начиная с первого, находят интервал, где расположена медиана. Значение медианы в интервальном ряду вычисляют по формуле:

  - нижняя граница медианного интервала

   - величина медианного интервала

  - сумма частот ряда

 – сумма накопленных частот в интервалах, предшествующих медианному

 – частота медианного интервала

Квартили - это значения признака в ранжированном ряду, выбранные таким образом, что 25% единиц совокупности будут меньше величины ,  25% единиц будут заключены между   и  ; 25%  - между     и , остальные 25% превосходят .  Квартили определяются по формулам, аналогичным формуле для расчета медианы. Для интервального ряда:

Децилем называется структурная переменная, делящая распределение на 10 равных частей по числу единиц в совокупности. Децилей 9, а децильных групп 10. Децили определяются по формулам, аналогичным формуле для расчета медианы и квартилей.

 

В целом общая формула для расчета квантилей в интервальном ряду такова:

 – порядковый номер квантиля

 – размерность квантиля (на сколько частей эти квартили делят совокупность)

 – нижняя граница квантильного интервала

 – ширина квантильного интервала

 - накопленная частота предквантильного интервала

Для дискретного ряда номер квантиля можно найти по формуле:

Примеры решения задач

Пример 1

(дискретный ранжированный ряд)

В результате исследований установлен среднемесячный доход жильцов одного подъезда:

1.5

1.8

2

2.5

2.8

2.8

2.8

3.0

3.6

3.8

3.9

4

5.8

5.9

6

6

6

6.8

7

7

Определите:

Модальный и медианный доход, квартили и децили дохода.

Решение

Имеем уже ранжированный ряд - значения дохода жильцов распределены по возрастанию.

Мода - наиболее часто встречающееся значение. В данном случае имеем ряд с двумя модами.

 и

 

Медиана - такое значение признака, которое делит упорядоченное множество данных пополам.

Квартили - значения признака в ранжированном ряду, выбранные таким образом, что 25% единиц совокупности будут меньше величины ; 25% единиц будут заключены между  и ;  25% - между  и ; остальные 25% превосходят .

Дицили делят ряд на 10 равных частей:

На сайте можно заказать решение задач, контрольных, самостоятельных, домашних работ (возможно срочное решение). Для этого вам нужно только связаться со мной:

Телеграм (+7 968 849-45-98)
ВКонтакте
WhatsApp (+7 968 849-45-98)

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.


Пример 2

(интервальный ряд)

Для определения среднего размера вклада в кредитном учреждении были получены следующие данные:

Размер вклада, тыс.р. до 10.0 10.0-16.0 16.0-22.0 22.0-28.0 28.0-34.0 Свыше 34.0
Удельный вес вкладов, % 5.0 8.0 15.0 22.0 30.0 20.0

Рассчитайте  структурные средние (моду, медиану, квартили).

Решение

Вычислим моду размера вклада:

Мода - варианта, которой соответствует наибольшая частота.

Мода вычисляется по формуле:

   - начало модального интервала

    - величина интервала

   - частота модального интервала

   - частота интервала, предшествующего модальному

   - частота интервала, следующего за модальным

 

Таким образом,  наибольшее количество вкладов имеют размер 30,7 тыс.р.

 

Медиана - варианта, находящаяся в середине ряда распределения.

Расчет медианы производится по формуле:

   -начало (нижняя граница) медианного интервала

    -величина интервала

  -сумма всех частот ряда

   -частота медианного интервала

-сумма накопленных частот вариантов до медианного

Таким образом, половина вкладов имеет размер до 28 тыс.р., другая половина - более 28 тыс.р.

 

Вычислим квартили:

 

Таким образом 25% вкладов меньше 20,8 тыс.р., 25% вкладов лежат в интервале от 20,8 тыс.р. до 28 тыс.р., 25% лежат в интервале от 28 тыс.р. до 33 тыс.р., 25% больше величины в 33 тыс.р.


Пример 3

Постройте графики для вариационного ряда. На графике покажите моду, медиану, среднюю, квартили.

Возраст детей (лет) Число детей (доли)
0-3 0.15
3-6 0.2
6-9 0.4
9-12 0.2
12-15 0.05

Решение

Вычислим среднюю : Для этого просуммируем произведения середин интервалов и соответствующих частот, и полученную сумму разделим на сумму частот.

Вычисление моды интервального ряда на графике

Построим гистограмму.

Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным. Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс.

Абсцисса точки пересечения этих прямых и будет модой распределения

 

Гистограмма

Image1

По гистограмме получаем, что

Вычисление медианы и квартилей интервального ряда на графике

Построим кумулятивную кривую частот (график накопленных частот)

0-3 3-6 6-9 9-12 12-15
0.15 0.35 0.75 0.95 1

Кумулятивная кривая частот

Adobe Systems

На получившимся графике накопленных частот из последней получившейся точки (в нашем примере) проведем линию перпендикулярную к оси  она так же является максимальной высотой. Поделим ее на 4 части. Через полученные точки строим параллельную оси  линии которая должна пересекать высоту к оси  и кумуляту. От места пересечения кумуляты опускаем перпендикуляры. Получившиеся точки есть квартили и медиана (квартиль при ).

Вывод к задаче

Таким образом средний возраст детей 6,9 лет. Наибольшее количество детей имеют возраст 7,5 лет. Четверть детей младше 4,5 лет, а самая старшая четверть детей старше 9,1 лет. Половина детей имеет возраст менее 7,3 лет, другая половина – более 7,3 лет.