Задачи по статистике с решением – Медиана и мода
Решение задач по теме статистическое распределение
Задача 1. По данным Росстата численность занятых в экономике по возрасту в 2015 году
Найдите медиану, первый и третий квартили, первый и девятый децили. Объясните их содержание.
Возраст, лет |
До 19 |
20-24 |
25-29 |
30-34 |
35-39 |
40-44 |
45-49 |
50-54 |
55-59 |
60-72 |
Всего |
% к общей численности занятых в экономике |
1,5% |
9,2% |
11,5% |
11,6% |
15,3% |
17% |
15,4% |
10,7% |
3,6% |
4,2% |
100% |
Накопленные частоты |
1,5 |
10,7 |
22,2 |
33,8 |
49,1 |
66,1 |
81,5 |
92,2 |
95,8 |
100 |
|
Середина интервала |
17 |
22 |
27 |
32 |
37 |
42 |
47 |
52 |
57 |
62 |
|
произведение середины интервала на частость |
25,5 |
202,4 |
310,5 |
371,2 |
566,1 |
714 |
723,8 |
556,4 |
205,2 |
260,4 |
3936 |
Решение:
Рассчитаем средний возраст, т.е. среднюю величину по формуле средней арифметической взвешенной.
=
=(1,5*17+9,2*22+11,5*27+11,6*32+15,3*37+17*42+15,4*47+10,7*52+3,6*57+4,2*62)/100=(25,5+202,4+310,5+371,2+566,1+714+723,8+556,4+205,2+260,4)/100=3935,5/100=39.4 (лет).
Далее рассчитаем моду и медиану.
Мода (Мо) – это самое часто встречающееся значение варьирующего признака в вариационном ряду. Для дискретного ряда мода равна значению с самой большой частотой. Для интервального ряда начинают с нахождения модального интервала. Он выбирается по наибольшей частоте. Мода рассчитывается:
где: Xo - нижняя граница модального интервала;
i - размер модального интервала;
- частота модального интервала;
- частота интервала, предыдущего модальному;
- частота интервала, следующего за модальным;
Решение
У нас интервальный ряд. Модальный интервал определяется по наибольшей частоте, наибольшая частота у нас 17, которая соответствует модальном интервалу 40-44. Найдем моду по формуле.
Мо= 40+4*(17-3)/((17-3)+(17-4))=42,07.
Далее найдем медиану.
Медиана (Me) - это середина. Для расчета значения медианы в дискретном ряду находят середину совокупности, т.е. полусумму частот, и смотрят, какое значение соответствует середине совокупности. При нахождении медианы интервального ряда выбирают медианный интервал, интервал выбирают по накопленным частотам, смотрят, когда впервые накопленная частота превысит середину совокупности, данный интервал и будет медианным.
Для вычисления медианы применяется формула:
где: X Me - нижняя граница медианного интервала;
i - размер медианного интервала;
- накопленная частота интервала, предыдущего медианному;
- частота медианного интервала;
Решение
У нас интервальный ряд. Медианный интервал определяется по накопленной частоте, мы должны определить, когда впервые накопленная частота превысит середину совокупности. Середина совокупности у нас 50. Впервые накопленная частота превысила середину совокупности в интервале от 40 до 44, что соответствует накопленной частоте 66,1 и частоте 17. Накопленная частота интервала, предшествующего модальному у нас равна 49,1.
Найдем медиану по формуле.
Ме=40+4*(1/2*100-49.1)/17=40,21.
Квантили распределения
Согласно условию Интервалы группировок равны. Размер интервала равен 4. Поэтому первый квартиль лежит в интервале от 30 до 34, в котором сумма накопленных частот впервые равна четверти объема совокупности (более 25) . Третий квартиль – находится в интервале от 45-49, то есть когда сумма накопленных частот впервые больше 3/4 (более 75).
Первый дециль расположен в интервале от 20 до 24, в котором сумма накопленных частот впервые превышает 1/10 объема совокупности (более 10), девятый дециль находится в интервале от 50 до 54, т.е. когда сумма накопленных частот впервые превышает 9/10 объема совокупности (более 90).
первый квартиль |
30,97 |
более 25 |
третий квартиль |
47,31 |
более 75 |
первый дециль |
23,70 |
более 10 |
десятый дециль |
53,18 |
более 90 |
Задача 2. По данным Росстата на начало 2015 года количество студентов различных форм обучения государственных и муниципальных высших образовательных учреждений распределялось так: очная – 647,3 тыс. человек; очно-заочная (вечерняя) – 48,6 тыс. человек; заочная – 606,7 тыс. человек; экстернат – 27,0 тыс. человек. Проведите частотный анализ распределения и сделайте выводы. Замените групповые частоты частостями, найдите накопленные (кумулятивные) частоты.
Решение задачи
Накопленные частоты находятся путем суммирования f частот. Процент студентов в общем количестве рассчитывается исходя из нахождения доли в 100%, расчет приводится в таблице.
Форма обучения |
Количество студентов |
Процент студентов в общем количестве |
Накопленные частоты |
очная |
647,3 |
48,7% (647,3*100%/1329,6) |
647,3 |
очно-заочная (вечерняя) |
48,6 |
3,7% (48,6*100%/1329,6) |
695,9 (647,3+48,6) |
заочная |
606,7 |
45,6% (606,7*100%/1329,6) |
1302,6 (695,9+606,7) |
экстернат |
27 |
2,0% (606,7*100%/1329,6) |
1329,6 (1302,6+27) |
итого |
1329,6 |
100% |
|
Задача 3. По результатам летней экзаменационной сессии одного курса студентов получено данное распределение оценок по баллам:
Балл оценки знаний студентов (xi) |
2 |
3 |
4 |
5 |
Итого |
Количество оценок, полученных студентами (fi) |
6 |
75 |
120 |
99 |
300 |
xi * fi |
12 |
225 |
480 |
495 |
1212 |
Найдите: Средний балл оценки знаний студентов
Модальный балл успеваемости и медианное значение балла
Сделайте выводы о характере данного распределения
Средний балл оценки знаний студентов можно рассчитать по формуле средней арифметической взвешенной.
=(2*6+3*75+4*120+5*99)/300=4,04 (балла).
Рассчитаем моду и медиану. Моду можно найти по наибольшей частоте, а наибольшая частота у нас 120, т.е. Мода = 4.
А медиану можно найти по накопленной частоте, когда впервые накопленная частота превысит середину совокупности, т.е. превысит 150.
Для балла «2» накопленная частота равна частоте и равна 6 и это меньше середины совокупности. Для балла «3» накопленная частота равна 81 (75+6) и это меньше середины совокупности. Для балла «4» накопленная частота равна 201 (81+120) и это больше середины совокупности. Т.е. Медиана равна 4.
Можно сделать вывод, что в данной задаче распределение симметричное.
Похожие материалы |