Статистика.
Учебный курс по математике 11 кл.
Целью
изучения данного раздела является формирование представлений о математике как
универсальном языке науки, средстве моделирования явлений и процессов,
представлений об идеях и методах математики, овладение математическими знаниями
и умениями, необходимыми для изучения и понимания некоторых разделов
естественнонаучных дисциплин, воспитание средствами математики культуры
личности, понимания значимости математики для общественного прогресса.
Примерная
программа по математике, составленная на основе федерального компонента
государственного стандарта среднего (полного) общего образования на базовом
уровне ориентирует на следующее содержание данного раздела:
Табличное
и графическое представление данных. Числовые характеристики рядов данных.
На
изучение данного раздела программа предусматривает 2 часа. Но жизнь требует от
выпускников умения использовать приобретенные знания и умения в практической
деятельности и повседневной жизни для анализа реальных числовых данных,
представленных в виде диаграмм и графиков, а также для анализа информации
статистического характера. Поэтому по возможности за счет факультативных часов
можно расширить их представления о статистике.
Статистика.
Понравилась
фраза П. В. Семенова «Статистика – дизайн информации». Дизайн, как известно, -
оформление. Так вот, в наше время при огромном потоке информации встает
проблема ее оформления: систематизации, оценке большого количества результатов,
наглядного оформления и т.д. Представьте результаты, состоящие не из 50 данных,
а из 5000 или из миллионов различных чисел. Например, число и размеры вкладов в
Сбербанке России за текущий год или данные о производительности труда на
предприятиях какой-нибудь отрасли по всей стране, результаты голосования по
всем избирательным пунктам и т.п. Единственный разумный выход – каким-то
образом преобразовать первоначальные данные, получить сравнительно небольшое
количество характеристик начальной информации и в дальнейшем оперировать именно
с этими, как правило, численными характеристиками. Это и призвана сделать
статистика.
Слово «статистика» происходит от латинского status (состояние, положение вещей) и в современном русском языке
используется в следующих значениях:
1. Статистика – это научное направление (комплекс наук), объединяющее
принципы и методы работы с числовыми данными, характеризующими массовые
явления. Оно включает в себя математическую статистику, общую теорию статистики
и целый ряд отраслевых статистик ( статистика промышленности, статистика финансов,
статистика народонаселения и др.)
2. Статистика – это отрасль практической деятельности, направленной на
сбор, обработку, анализ статистических данных ( например, есть органы
государственной статистики).
3. Статистика – это совокупность статистических данных, характеризующих
какое-нибудь явление или процесс (например, статистика рождаемости и смертности
в России, статистика успеваемости учащихся и т.д.).
4. Статистика – это любая функция от результатов наблюдений (например,
среднее арифметическое есть статистика).
Мы
будем знакомиться с элементами статистики как научного направления. Одна из
основных задач ее – надлежащая обработка информации. Конечно, у статистики есть
много других задач: получение и хранение информации, выработка различных
прогнозов, оценка их достоверности и т.д. Но ни одна из этих целей не достижима
без обработки данных.
Числовые
данные о массовых явлениях получаются в результате наблюдения за совокупностями
тех или иных явлений и измерения значений наблюдаемых признаков – свойств, которыми
обладают явления и объекты, входящие в совокупность. Например, при
демографических исследованиях статистическая совокупность представляет собой
все население города, региона или страны, наблюдаемые признаки – это свойства
людей, из которых состоит совокупность (пол, возраст, национальность, уровень
доходов и т.д.). При биологических исследованиях совокупностью может быть
партия семян, помещенных в особые условия, а наблюдаемые признаки – всхожесть,
размеры.
Особенностью статистических исследований является то,
что статистические совокупности, как правило, состоят из огромного числа
единиц. Это делает практически невозможным сплошное обследование совокупности.
Возникает задача: как выявить важнейшие закономерности, присущие всей
статистической совокупности, не обследуя каждый элемент этой совокупности, а
только какую-то часть этих элементов? Например, как узнать до выборов, сколько
людей проголосуют за кандидата, не опрашивая каждого будущего избирателя? Как
узнать, каков процент брака в продукции завода, выпускающего сотни тысяч
изделий, не проверяя каждое изделие?
Основной задачей статистики является выявление и
исследование общих закономерностей, присущих совокупностям, состоящим из
большого числа элементов. Эти закономерности обычно проявляются не как точный
закон, а как общая тенденция, с колебаниями и отклонениями от нее в свойствах
отдельных элементов.
Основным методом статистики является выборочный метод.
Он основан на законе больших чисел, сформулированном и доказанном в теории
вероятностей. Суть выборочного метода заключается в следующем.
В связи с практической невозможностью измерить значение
наблюдаемого признака у каждого элемента совокупности, из этой совокупности
выбирают некоторое количество элементов для обследования. Сколько нужно выбрать
элементов и как их выбирать – эти вопросы также решает статистика,
разрабатывает соответствующие правила. Выбранные элементы составляют выборку;
количество элементов в выборке называют объемом выборки.
Совокупность, из которой сделана выборка, называют генеральной совокупностью.
Если выборка сформирована по правилам статистики, то ее называют
репрезентативной (представительной – она «представляет» всю совокупность,
правильно отражает ее основные черты). Пример:
Является ли выборка репрезентативной, если при изучении
времени, которое затрачивают на выполнение уроков восьмиклассники:
1) опрашивали только девочек
2) опрос проводили только по четвергам
3) опрашивали только учащихся гимназий и лицеев?
Во-первых,
можно сначала разобрать вопрос о том, что является генеральной совокупностью
(все учащиеся 8классов города, возможно, страны), объемом выборки будет число
имеющихся ответов.
На
вопрос о репрезентативности во всех трех случаях следует ответить отрицательно:
1) у девочек свои особенности, а мальчиков не спрашивали
2) время на приготовление уроков зависит от расписания, на пятницу,
возможно,
мало уроков
3) в особых учреждениях свои особенности
Табличное и графическое
представление данных
Статистическая
информация – это числовые данные о массовых явлениях, это значения наблюдаемых
признаков объектов, составляющих статистическую совокупность, которые получены
в результате статистического наблюдения. Таким образом, источником
статистической информации является реальный опыт, эксперимент, наблюдение, измерение,
проводимые над реальными объектами и явлениями окружающего нас мира. Статистика
начинается с реальных данных реального опыта; этим она отличается от теории
вероятностей, которая изучает математические модели реальных явлений и имеет
дело лишь с мысленными (воображаемыми) экспериментами.
Статистическая информация о результатах наблюдений и
экспериментов может быть зарегистрирована и представлена в различных формах.
Простейшей из них является запись результатов в порядке их появления – запись в
ряд:
Х1, Х2, Х3,
…, Хn
называется
простым статистическим рядом. Отдельные значения Хn ,составляющие этот ряд, называют вариантами. Количество вариант в ряду
называют объемом ряда или объемом выборки.
Обратимся
к примеру:
При
изучении учебной нагрузки учащихся попросили 20 восьмиклассников отметить
время, которое они затратили в определенный день на выполнение домашних
заданий. Получили следующие данные:
2,7;2,5;3,1;1,6;1,8;3,1;2,9;2,7;1,5;4,3;2,7;1,5;3,1;2,5;1,5;2,5;2,8;1,5;3,4;2,8
–вот простой статистический ряд. 2,7 – варианта,2,5 – варианта . . . Объем
данной выборки 20.
Запись
статистической информации в форме простого ряда имеет два существенных
недостатка: громоздкость и труднообозримость.
Второй
недостаток устраняют простейшей обработкой ряда: упорядочивают ряд, располагая
варианты в порядке их возрастания:
1,5;1,5;1,5;1,5;!,6;1,8;2,5;2,5;2,5;2,7;2,7;…
Полученный
ряд называют вариационным рядом или упорядоченным.
Первый
недостаток (громоздкость) тоже легко устраняется: будем записывать только
значения встречающихся вариант, а под каждым значением будем писать число.
Варианта
|
1,5
|
1,6
|
1,8
|
2,5
|
2,7
|
2,8
|
2,9
|
3,1
|
3,4
|
4,3
|
Кратность варианты
|
4
|
1
|
1
|
3
|
3
|
2
|
1
|
3
|
1
|
1
|
Мы
получили таблицу распределения выборки. Если сложить все кратности, то
получится количество всех произведенных при выборке измерений (в данном случае
20). Однако, кратность это не совсем тот показатель который нам бы хотелось
иметь. Нас больше интересует то, какую часть составляет кратность данной
варианты от объема выборки.
Такую
величину называют частотой варианты
Кратность варианты
Частота
варианты = --------------------------------
Объем выборки
Если
же значений вариант очень много и они редко повторяются, то для «свертывания»
Ряда
строят так называемый интервальный ряд: весь диапазон наблюдаемых значений
признака разбивают на небольшое число частичных интервалов, и посчитывают
количество вариант исходного ряда, попадающих в каждый частичный интервал.
Наша
таблица будет выглядеть тогда таким образом
Время выполнения
|
1-2 часа
|
2-3 часа
|
3-4 часа
|
4-5 часов
|
Кратность
|
6
|
9
|
4
|
1
|
частота
|
6/20
|
9/20
|
4\20
|
1\20
|
Частоты в %
|
30
|
45
|
20
|
5
|
В
данную таблицу включены строки «частота» и «частота в %». Следует отметить, что
в литературе по статистике нет единой, общепринятой терминологии. В некоторых
изданиях кратности называют частотами. Здесь используется терминология в
соответствии с авторами А. Г. Мордковичем и П. В. Семеновым.
Наряду
с табличной формой представления статистических данных, широко используется
графическая форма. Таблицы образуют «мостик», по которому от выборок данных
можно перейти к функциям и их графикам.
Отложим
по оси абсцисс значения из первой строки таблицы распределения, а по оси
ординат – значения из ее второй строки. Построим соответствующие точки в
координатной плоскости. Получим графическое изображение имеющейся информации –
график распределения выборки. Часто, построенные точки для наглядности
соединяют отрезками. То же самое можно сделать, заменив вторую строку таблицы
распределения ее третьей строкой. Получится график распределения частот
выборки. Термин «график распределения частот выборки» часто заменяют более
кратким – многоугольник частот или полигон частот. Собственно, poligon и переводится как «многоугольник».
Распределение
интервальных рядов на диаграммах называют гистограммами.
Числовые характеристики
статистических рядов
Нередко
возникает необходимость сравнивать между собой две или несколько совокупностей
статистических данных. Поскольку сравнение производится по какому-то
определенному свойству, то для проведения сравнения нужны показатели,
характеризующие то или иное свойство совокупности данных одним числом. Такие
показатели в статистике получили наименование числовых характеристик.
Простейшими
числовыми характеристиками являются характеристики положения (среднее значение,
мода, медиана) и характеристики рассеивания (размах, выборочная дисперсия,
выборочное среднее квадратичное отклонение).
Среднее значение ряда
наблюдений – это центр рассеивания наблюдаемых
значений, это расчетное значение, сумма отклонений всех вариант от которого
равна нулю.
Среднее
значение ряда находят по формулам среднего арифметического.
Следующей
числовой характеристикой статистических рядов является мода. Мода –
это значение вариант, встречающееся в ряду чаще других. (в нашем примере о
времени приготовления уроков модой является 1,5 часа, т.к. встречается 4раза).
Статистический ряд может иметь одну, две или несколько мод, может не иметь
моды.
Медиана
– это срединное в вариационном ряду значение варианты. ( В нашем ряду
четное
число членов ряда, поэтому медианой будет являться число, равное (х10 +
х11):2
Простейшей
характеристикой рассеивания является размах :
А= х max - x min
Выборочная дисперсия D
выб (Х) есть среднее значение
квадратов отклонений всех вариант от среднего значения ряда
Дисперсия имеет размерность квадрата наблюдаемой
величины, поэтому на практике широко используется еще один показатель
рассеивания – среднее квадратичное отклонение.
Гистограммы распределения большого объема информации
Гистограммы
особенно незаменимы в случаях, когда ряд данных состоит из очень большого количества чисел
(сотни тысячи и
т. п)
Если
ширина столбцов гистограммы достаточно мала, а основания столбцов в объединении дают
некоторый промежуток,
то сама гистограмма похожа на график некоторой непрерывной функции заданной на этом
промежутке. Иногда такую функцию прямо и называют выравнивающей функцией. Например, на рисунке приведена
гистограмма роста женщин, построенная по выборке, в которой было 1375 женщин.
Оказывается, что такому
же закону распределения подчиняется распределение и горошин по размеру, и новорожденных младенцев по весу, и
частиц газа по скоростям движения, и огромное количество других явлений
окружающего нас
мира. Подобно тому как графики всех парабол получаются с помощью преобразований из
одной-единственной параболы у = х2, так и все эти кривые
распределения получаются из одной-единственной кривой. Ее называют кривой
нормального распределения или, в честь немецкого математика Карла
Гаусса,
гауссовой кривой — она изображена на рисунке.
Эта «колоколообразная» кривая симметрична относительно оси ординат
и имеет единственный максимум. Площадь части плоскости, ограниченной гауссовой
кривой и осью Ох равна единице. Ее «ветви» очень быстро
приближаются к оси абсцисс: если найти площадь «под гауссовой кривой» на отрезке [-3; 3],
то получится более 0,99, т. е. больше 99% всей площади. Для гауссовой
кривой выбрано специальное обозначение у = Аналитически
она задается весьма сложно.
Для практического использования эта «страшная» формула не
нужна. Для значений этой функции составлены подробные числовые таблицы. Они
приведены в приложении.
Иллюстрацией нормального закона распределения может
служить следующий пример.
Пассажиры
метро бегут по переходу, выходящему на
середину станции. Бегут они на поезд, стоящий напротив выхода из перехода. Платформа,
у которой стоит поезд, равномерно
разделена колоннами.
Ясно,
что большинство пассажиров войдет в средние вагоны, а по мере удаления
вагонов от центра количество садящихся в них людей будет уменьшаться.
Распределение пассажиров по вагонам снова напоминает нормальное, или
гауссово, распределение.
В этом месте мы
сделаем остановку и вернемся к этому вопросу в разделе «Теория вероятностей»,
чтобы установить связь между вероятностями случайных событий и
экспериментальными статистическими данными. Осталось только добавить, что при
большом числе независимых повторений одного и того же опыта в неизменных
условиях частота появления определенного случайного события практически
совпадает с некоторым постоянным числом. Это явление называют статистической
устойчивостью, а такое число называют статистической вероятностью этого
события. Явление статистической устойчивости соединяет реально проводимые
испытания с теоретическими моделями этих испытаний.
Примеры.
С 1.Выборка состоит из всех букв, входящих в двустишие «...
Это дерево - сосна, И судьба сосны ясна...».
а) Выпишите ряд данных выборки.
б) Найдите объем выборки.
в) Определите кратность и частоту варианты «о».
г) Какова наибольшая процентная частота вариант выборки?
Решение.
а) Ряд данных выборки (значения вариант }):
а, б, в, д, е, и, н, о, р, с, т,
у, ь, ы, э, я.
б) Объем выборки - это общее число букв в двустишии: п = 30.
в) Кратность варианты «о» равна 4, частота варианты равна
г) Наибольшую процентную частоту имеет варианта «с»; ее кратность 6,
частота , процентная частота 20%
Ответ: а) 16 букв; б) 30; в) 4 и ; г) 20%
С 2. При выборочной переписи населения в 20 квартирах были
получены следующие сведения о годах рождения их жильцов (первые две
цифры 1 и 9 не пишем):
30,
56, 98, 77, 93, 31, 61, 80, 87, 52,
56,
32, 87, 73, 93, 81, 57, 52, 61, 87,
90,
92, 85, 87, 70, 61, 93, 87, 52, 53,
40,
56, 48, 51, 61, 87, 88, 90, 52, 60,
22,
34, 48, 52, 88, 87, 91, 62, 63, 87,
39,
40, 52, 87, 99, 91, 87, 65, 61, 55.
а) Каков общий ряд данных этого измерения?
б) Составьте ряд данных.
в) Найдите кратность и частоту вариант 61 и 87.
г) Составьте таблицу кратностей,
разбив данные на интервалы
по годам: № 1 от 22 до 30; № 2 от 31
до 40; № 3 от 41 до 50; № 4 от
51 до 60; № 5 от 61 до 70; № 6 от 71
до 80; № 7 от 81 до 90; № 8 от
91 до 99.
Решение.
а)
Общий ряд данных - целые числа от 0 до 99.
б) Ряд данных выборки:
22, 30, 31, 32, 34, 39, 40, 48, 51, 52, 53, 55, 56, 57,
60, 61, 62, 63, 55, 70, 73, 77, 80, 81, 85, 87, 88, 90, 91, 92, 93, 98,
99.
в) Варианта «61» имеет кратность 5 и частоту (в
выборке всего содержится n=60 чисел); варианта «87»имеет
кратность 10 и частоту
г) Таблица кратностей интервального ряда
Варианты
|
22-30
|
31-40
|
41-50
|
51-60
|
61-70
|
71-80
|
81-90
|
91-99
|
Кратности вариант
|
2
|
6
|
2
|
14
|
9
|
3
|
16
|
8
|
Ответ:
а) целые числа от 0 до 99; б) ряд из 33 значений; в) 5 и;
г) таблица.
С 3. Ниже показана среднесуточная
переработка сахара (в тыс. ц) заводами сахарной промышленности некоторого региона:
12,0; 13,6; 14,7;
18,9; 17,3; 16,1;
20,1; 16,9; 19,1;
18,4; 17,8; 15,6;
20,8; 19,7; 18,9;
19,0; 16,1; 15,8.
Представьте эти
данные в виде интервального ряда с интервалами длиной в три единицы. Найдите,
сколько сахара в среднем перерабатывал в сутки завод региона:
а) заменив каждый
интервал его серединой;
б) используя заданный
ряд.
В каком случае
средняя выработка найдена точнее?
Решение.
1)
Находим размах
А = хmax - хт1п = 20,8 - 12 = 8,8; при заданной
ширине частичного интервала h = 3, все значения войдут в 3
интервала; получаем таблицу распределения:
Среднесуточная
переработка 19-15
15-18
18-21
_______сахара
(тыс, ц)_________________________________________
Частота
3
7
8
2) Найдем среднее
значение суточной переработки сахара:
а) по интервальному
ряду:
б) по исходным
данным: сумму всех значений (310,8) разделим на количество наблюдений п = 18,
получаем:
Средняя выработка
найдена точнее во втором случае, то есть по всем 18 исходным данным. Это
объясняется тем, что при вычислениях по интервальному ряду вместо
действительно наблюдавшихся значений мы берем условную величину - середину выбранного
нами частичного интервала. Например, вместо значений 12, 13,6 и 14,7, входящих
в первый интервал, мы берем 13,5; 13,5 и 13,5 (сумма трех действительных
значений 40,3, а трех условных - 40,5, появляется ошибка).
1;
I Ответ: 1) таблица распределения; 2) 17,33; 17,27.
С 4. 60 девятиклассников проверили на скорость
чтения (количество слов за минуту чтения). Полученные данные сгруппировали
по пяти участкам: № 1 - [91; 100]; № 2 - [101; ПО]; № 3 - [111; 120]; № 4 - [121; 130]; № 5 -
[131; 140]. Получилась такая гистограмма
кратностей:
Приблизительно
оцените: а) размах; б) моду; в) среднее арифметическое выборки;
г) объясните, почему ответы лишь приблизительные.
Решение.
По
гистограмме находим:
а) Размах А 140-91
= 49 (правая граница последнего, правого интервала минус левая граница
первого, левого интервала).
б) Мода (середина интервала,
которому соответствует наибольшая кратность).
в) Среднее значение находим, заменив варианты серединами частичных интервалов:
г) Полученные значения являются
лишь приблизительными потому, что
вместо действительных значений вариант при вычислениях использовались условные величины - границы и
середины частичных интервалов, то есть величины, не наблюдавшиеся на
опыте, а принятые нами для удобства
представления данных.
Ответ: а) ≈49; б) ≈ 125,5; в) ≈ 117,17.
С 5. При переписи населения данные о возрасте (полном
количестве лет) жильцов некоторого дома оказались следующими:
34,31,2,
8,48,40, 20, 15,12,21,20,0,68, 39,35,16,13,9,4,72,74,75, 45,44,23, 18,
88,60,54,30, 32, 11,10,5,57,53,56,24, 2,1, 60,59, 34, 30,9, 7,43,42,19, 1,
36,37,14,13,9,62,58,19,39, 35, 12, 8,40,25,3, 33,34, 8,7,4,
28,0,41,29,21,1,31,27,6,3, 70,56,67,25,24,2.
Разбить
приведенные выше данные по классам. Представить распределение данных по классам в виде полигона частот.
Решение.
Исходные данные содержат 86 значений; хmin = 0, xmax= 88. Разобьем
данные на k = 9 классов
(интервалов) шириной h =10 каждый; в случае
попадания значений на границу интервалов условимся относить такие
значения к правому интервалу. Получаем таблицу
распределения:
X
|
0 - 10
|
10 - 20
|
20 – 30
|
30 - 40
|
40 - 50
|
50 - 60
|
60 - 70
|
70 - 80
|
80 - 90
|
M
|
22
|
12
|
12
|
15
|
8
|
7
|
5
|
4
|
1
|
Строим
полигон частот по серединам частичных интервалов (классов).
Ответ:
1) таблица распределения; 2) полигон частот.
С 6. В таблице показано распределение
призывников района по росту:
6.Рост, см
|
Частота
|
Рост, см
|
Частота
|
155 – 160
160 -165
165 – 170
170 - 175
|
6
10
28
36
|
175 – 180
180 – 185
185 -190
190 - 195
|
48
26
16
8
|
Постройте
гистограмму, характеризующую распределение призывников по росту.
Решение.
С 7. На гистограмме представлены данные о
распределении рабочих цеха по возрастным группам:
Пользуясь
гистограммой, найдите:
а)
число рабочих цеха в возрасте от 18 до 23 лет
б)
возрастную группу, к которой относится наибольшее число рабочих;
г)
общее число рабочих цеха.
Решение.
а)
Рабочих в возрасте от 18 до 23 лет – 12 человек ( высота первого столбика
гистограммы).
б)
Наибольшее число рабочих относится к возрастной группе от 33 до 38 лет (самый
высокий столбик).
в)
Общее число рабочих цеха находим как сумму высот всех столбиков диаграммы:
12+14+20+22+18+16+12+4=118
чел.
Ответ: 12 человек,33-38 человек, 118 человек.
С 8. В вашем (или в соседнем) классе
соберите данные о днях рождения учеников.
а)
Разбейте общий ряд данных на три участка: №1 – [1;10], №2 – [11;20], №3 –
[21;31], и составьте таблицу распределения частот.
б) Постройте
соответствующую гистограмму.
в) Рассмотрите шесть участков: № 1 -
[1; 5], № 2 - [6; 10], ….,№ 6 - [26; 31], и
составьте таблицу распределения частот.
г) Постройте
соответствующую гистограмму.
Решение.
а)
Результаты опроса 28 учащихся сведены в таблицу:
Интервал
значений вариант
|
№1
1 - 10
|
№2
11 - 20
|
№3
21 - 31
|
Кратность
|
10
|
9
|
9
|
Частота
|
|
|
|
Частота (%)
|
35,5
|
32,5
|
32,5
|
(Процентная
частота участка № 2 округлена с усилением, чтобы сумма частот была 100%)
б)
в)
Таблица распределения частот для 6 участков:
Интервал
значений вариант
|
№1
1 - 5
|
№2
6 - 10
|
№3
11 - 15
|
№4
16 - 20
|
№5
21 - 25
|
№6
26 - 31
|
Кратность
|
7
|
3
|
4
|
5
|
4
|
5
|
Частота (100%)
|
25,0
|
10,7
|
14,3
|
17,9
|
14,3
|
17,8
|
( Частота для участка №6 округлена без усиления, чтобы сумма частот была 100%)
г)
С 9. У 25 девятиклассников спросили, сколько в
среднем часов в день они смотрят телевизор. Вот что получилось:
ТВ в день (ч)
|
0
|
1
|
2
|
3
|
4
|
Число
школьников
|
1
|
9
|
10
|
4
|
1
|
Определите:
а) размах; б) моду; в) среднее арифметическое выборки; г) постройте
многоугольник частот, и укажите на нем данные из пунктов а) – в).
Решение.
а)
Размах А = хmax –xmin= 4 – 0 =4 (ч)
б)
Мода (ч)
в)
Среднее арифметическое
Ответ:
а) 4; б) 2; в) 1,8; г) полигон частот.
С 10. Найти размах, моду и медиану совокупности значений
некоторой случайной величины X:
1)1, 1, 2, 2, 2, 3, 5, 5, 6, 6, 6,
9;
2)-4, -2,
-2, -1, 0, 2, 2, 2, 2, 5, 7.
Построить
полигон частот значений величины X. Указать размах и моду
совокупности.
Решение.
1)
Ряд упорядочен, п = 12. Размах А = 9-1 = 8; моды: МО 1
= 2, МО 2 = 6. Медиана
2)Ряд
упорядочен; n =1. Размах А = 7 –(-4)= 11; мода Мо = 2.
Медиана Ме = х6=2
Ответ: а) 8; 2 и 6;4;
б) 11; 2; 2.
С 11. Рассмотреть в качестве генеральной
совокупности все население большого города. В таблице указана цель статистического
обследования населения и то, каким образом составлялась выборка из генеральной
совокупности. Попытаться объяснить, почему составленную выборку нельзя считать
репрезентативной.
Номер
задания
|
Цель обследования
|
Выборка
|
1.
|
Выявление
читательских интересов
|
1) Дети старшей группы детского
сада;
2)
курсанты роты военного училища;
3)
члены одной семьи.
|
2.
|
Выявление
любимых мелодий (песен)
|
- 1) 100 учащихся музыкальной
школы;
2) 100 человек, случайным образом
остановленных и опрошенных поздно вечером на улице города.
|
3.
|
Определение
числа больных гриппом в городе в пик эпидемии
|
1) 100 случайным образом
выбранных пациентов терапевтических кабинетов поликлиник города;
2) жильцы одного подъезда
двухэтажного дома.
|
4.
|
Определение наиболее ходовых размеров джинсов
|
1) Все студенты хореографического
училища;
2)члены секции сумо.
|
5.
|
Определение
среднего уровня доходов населения
|
1) Жильцы подъезда одного
пятиэтажного дома;
2)
300 случайным образом выбранных жильцов студенческого общежития;
3)
все жители коттеджного района города.
|
6.
|
Определение количества домашних кошек и собак, приходящегося на душу
населения в городе
|
1)Жильцы одного подъезда
двухэтажного дома;
2) жильцы многоквартирного
дома, заселенного одинокими престарелыми людьми.
|
Решение.
В
порядке номеров заданий:
1)
Первые две выборки - очень специфические группы населения, а третья - слишком
малая выборка.
2)
Первая выборка - специфическая группа населения; вторая время опроса также делает круг опрошенных
очень специфическим
3)
Первая выборка — специфическая группа населения (опрашивают только больных);
вторая выборка - выбрана фактически одна точка в городе.
4)
Первая выборка - малый охват населения, одна точка в городе; вторая и третья -
опрос специфических групп населения.
5)
Обе выборки - опрос специфических групп населения, отличающихся стройностью и
легкостью (хореографическое училище) или грузностью и большими размерами
(секция сумо).
6)
Первая выборка — малый охват населения в одной точке города; вторая выборка -
опрос специфической группы населения (одинокие старики любят кошек и собак).
Ответ:
см. в тексте
решения.
С
12. Деталь по
плану должна весить 431 г. Контроль при взвешивании 2000 деталей дал такие
результаты:
Вес (г)
|
427
|
428
|
429
|
430
|
431
|
432
|
433
|
434
|
435
|
Число деталей
|
40
|
80
|
220
|
360
|
610
|
430
|
200
|
40
|
20
|
а)
Составьте таблицу распределения частот в процентах.
б)
Постройте многоугольник частот (для удобства из всех вариант вычтите по 431).
в)'Похоже
ли распределение на нормальное распределение? г) Каков процент деталей, вес
которых отличается от планового не более чем на два грамма?
Решение.
а)
Таблица распределения частот в процентах:
Вес (г)
|
427
|
428
|
429
|
430
|
431
|
432
|
433
|
434
|
435
|
Процентная
частота (%)
|
2,0
|
4,0
|
11,0
|
18,0
|
30,0
|
21,5
|
10,0
|
2,0
|
1,0
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
б) Многоугольник
частот:
в)
Распределение похоже на нормальное.
г)
Процент деталей, вес которых отличается от планового не более чем на 2 грамма,
равен:
11,0
+ 18,0 + 30,5 + 21,5 + 10,0 = 100 % - (2,0 + 4,0 + 2,0 + 1,0) = = 100%-9,0% =
91%.
Ответ:
а) таблица, б)
полигон; в) да; г) 91 %.
Практическая
работа.
На
основании опроса 50 случайным образом выбранных старшеклассников школы
составить таблицу и полигон частот роста (в см) – отдельно для девочек и
мальчиков. Убедиться в близости распределения частот рассматриваемых величин к
нормальному.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.