Добавить материал и получить бесплатное свидетельство о публикации в СМИ
Эл. №ФС77-60625 от 20.01.2015
Инфоурок / Другое / Другие методич. материалы / Лабораторная работа по теории вероятностей и математической статистике

Лабораторная работа по теории вероятностей и математической статистике



57 вебинаров для учителей на разные темы
ПЕРЕЙТИ к бесплатному просмотру
(заказ свидетельства о просмотре - только до 11 декабря)


  • Другое

Поделитесь материалом с коллегами:

Лабораторная работа № 1

Обработка статистических данных



Цель: Научиться основным методам обработки данных, представленных выборкой. Изучить графические представления данных.



Теоретические сведения


Пусть изучается некоторая случайная величина X, над которой проводится ряд независимых испытаний. В каждом из этих испытаний СВ X принимает то или иное значение.

Пусть значение hello_html_53de31e1.gif случайная величина приняла hello_html_m3ea74cc4.gif раз, значение hello_html_867c83c.gifhello_html_m651eb51f.gif раз, …, значение hello_html_m612a61a8.gifhello_html_c531c85.gif раз. При этом hello_html_m630b8ee3.gif, где n – объем выборки.

Наблюдаемые значения hello_html_c81feb2.gif называют вариантами, а последовательность вариант, записанных в порядке возрастания – вариационным рядом.

Операция расположения значений в порядке возрастания называется ранжированием статистических данных.

Числа наблюдений hello_html_m231184bd.gif, показывающие сколько раз встречаются варианты hello_html_4e68f99e.gif в ряде наблюдений называются частотами.

Отношение частот к объему выборки называются относительными частотами (или частостями):

hello_html_f25c964.gif

Статистическим распределением выборки (или статистическим рядом) называют перечень вариант и соответствующих им частот или относительных частот.

Статистическое распределение частот задается в виде таблицы, первая строка которой содержит варианты hello_html_4e68f99e.gif, а вторая соответствующие им частоты hello_html_m231184bd.gif (или относительные частоты hello_html_14a1fd14.gif).

hello_html_4e68f99e.gif

hello_html_53de31e1.gif

hello_html_867c83c.gif

hello_html_m612a61a8.gif

hello_html_m231184bd.gif

hello_html_m3ea74cc4.gif

hello_html_m651eb51f.gif

hello_html_c531c85.gif

hello_html_14a1fd14.gif

hello_html_14a1fd14.gif

hello_html_14a1fd14.gif

hello_html_14a1fd14.gif

В случае, когда число значений случайной величины X (признака) достаточно велико или признак является непрерывным (т.е. СВ X может принять любые значения из некоторого интервала), то составляют интервальный статистический ряд. В первую строку таблицы статистического распределения вписывают частичные промежутки hello_html_90a3bf0.gif, которые берут обычно одинаковыми по длине hello_html_1421fc67.gif. Для определения величины интервала можно использовать формулу Стерджеса:

hello_html_2b42031b.gif

За начало первого интервала рекомендуется брать величину hello_html_475e3948.gif. Во вторую строку интервального статистического ряда записывают количество наблюдений hello_html_m231184bd.gifhello_html_7e3b0e17.gif попавших в соответствующий интервал.

Эмпирической функцией распределения (функцией распределения выборки) называют функцию hello_html_388752c6.gif, определяющую для каждого значения x относительную частоту события hello_html_m52966216.gif:

hello_html_15f4a789.gif

Для определения значений эмпирической функции распределения можно использовать равенство:

hello_html_2a12f8b3.gif

Полигоном частот называют ломанную линию, отрезки которой соединяют точки hello_html_440ad25b.gif, hello_html_7cdf5d94.gif, …, hello_html_m770e89d0.gif. Для построения полигона частот по оси абсцисс откладывают варианты hello_html_4e68f99e.gif, а на оси ординат – соответствующие им частоты hello_html_m231184bd.gif.

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки hello_html_e52b14e.gif, hello_html_11e79342.gif, …, hello_html_m74655986.gif. Для построения полигона относительных частот по оси абсцисс откладывают варианты hello_html_4e68f99e.gif, а на оси ординат – соответствующие им относительные частоты hello_html_14a1fd14.gif.

В случае непрерывного признака целесообразно строить гистограмму частот, для чего интервал, в котором заключены все наблюдаемые значения, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала hello_html_m231184bd.gif – сумму частот вариант, попавших в i-й интервал.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению hello_html_mb5ba9e4.gif (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а высоты равны отношению hello_html_mb5ba9e4.gif . Площадь i-го частичного прямоугольника равна hello_html_m6fec258e.gif – сумме частот вариант i-го интервала, следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Выборочным средним hello_html_m37e7508b.gif называется среднее арифметическое всех значений выборки:

hello_html_m648ab8e0.gif или hello_html_2b024c20.gif

В случае интервального статистического ряда в качестве hello_html_4e68f99e.gif берут середины его интервалов, а в качестве hello_html_m231184bd.gif – соответствующие им частоты.

Выборочной дисперсией hello_html_764876cf.gif называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней hello_html_m37e7508b.gif:

hello_html_59b47405.gif или hello_html_m4e9dde25.gif

Выборочная дисперсия может также быть определена по формуле

hello_html_c7c0c34.gif

Выборочное среднее квадратическое отклонение определяется по формуле:

hello_html_m6a7d54bd.gif

Выборочное среднее квадратическое отклонение измеряется в тех же единицах, что и изучаемый признак

Исправленной выборочной дисперсией называется величина hello_html_47a77ff.gif, определяемая равенством:

hello_html_m1a13df95.gif, т.е. hello_html_m32356d83.gif

Исправленным выборочным квадратическим отклонением называется величина S, определяемая равенством:

hello_html_166bd3f8.gif

Для непрерывно распределенного признака формулы для выборочных средних будут теми же самыми, но за значения hello_html_m2377fa56.gif следует выбирать середины промежутков hello_html_90a3bf0.gif, т.е. hello_html_4bc35e43.gif.

Размахом вариации (выборки) называется число

hello_html_22698a30.gif

где hello_html_79c59a5.gif – наибольший вариант ряда, hello_html_bd2af9.gif – наименьший вариант ряда.

Модой hello_html_m50a11f51.gif вариационного ряда называется вариант, имеющий наибольшую частоту.

Медианой hello_html_fac6bf3.gif вариационного ряда называется значение признака, приходящееся на середину ряда.

Если ряд имеет четное количество членов, т.е. hello_html_59866dd4.gif, то hello_html_69e60f14.gif. Если имеет нечетное количество членов ряда, т.е. hello_html_m84d2a3e.gif, то hello_html_m7120e09d.gif.


Пример: Дана выборка числа проданных автомобилей торговой фирмой за 25 недель:

14, 18, 16, 21, 12, 19, 27, 19, 15, 20, 27, 29, 22, 28, 19, 17, 18, 24, 23, 22, 19, 20, 23, 21, 19

Построить: вариационный ряд, дискретный статистический ряд, интервальный статистический ряд, полигон, гистограммы и кумулятивную кривую, найти числовые характеристики.

Решение:

  1. Запустите Microsoft Excel.

  2. Введите в ячейку А1 - Данные

  3. Введите в первый столбец (А2:А25) исходные данные

hello_html_19a28679.png

  1. В ячейку B1 введите Ранж. данные

  2. Выделите диапазон и скопируйте в ячейки В2:В25

  3. Выполните сортировку массива данных в ячейках В2:В25 по возрастанию.

hello_html_8bc3612.png

  1. Подготовьте таблицу по образцу:

hello_html_65fc45d5.png

  1. Чтобы определить объем выборки, используем функцию СЧЁТ(), которая подсчитывает количество ячеек в диапазоне, содержащих числа. В ячейку Е2 введите формулу

=СЧЁТ(B2:B26)

  1. Чтобы подсчитать, сколько раз каждое значение встречается в выборке будем использовать функцию СЧЁТЕСЛИ(диапазон;критерий), которая подсчитывает количество ячеек в диапазоне, удовлетворяющих критерию. В ячейку Е5 введите формулу

=СЧЁТЕСЛИ($B$2:$B$26;E4)

  1. Скопируйте формулу в ячейки F5:S5 с помощью автозаполнения

hello_html_m584b4d4f.png

  1. Для определения относительных частот в ячейку Е6 введите формулу

=E5/$E$2

  1. Скопируйте формулу в ячейки F6:S6 с помощью автозаполнения

hello_html_m69e9e61a.png

  1. Дополните таблицу по образцу:

hello_html_548b08a6.png

  1. В ячейку Е10 введите формулу для определения максимального значения:

=МАКС(B2:B26)

  1. В ячейку Е12 введите формулу для определения минимального значения:

=МИН(B2:B26)

  1. В ячейку Е14 введите формулу для определения количества интервалов hello_html_651f4862.gif, округлив полученное число до большего по модулю целого числа

=ОКРУГЛВВЕРХ(1+LOG(E2;2);0)

  1. В ячейку Е16 введите формулу для определения длины интервала hello_html_72e1f77b.gif

=(E10-E12)/E14

  1. Дополните таблицу по образцу

hello_html_776d7707.png

  1. Ячейки I9:I15 содержат левые границы интервалов, а ячейки J9:J15 содержат правые границы интервалов. Заполните ячейки по образцу:

hello_html_m5373aabc.png

  1. Для заполнения столбца Частоты будем использовать функцию ЧАСТОТА(массив_данных;массив_интервалов), которая вычисляет частоту появления значений в интервале значений и возвращает массив чисел. Для этого в ячейку К9 введите формулу

=ЧАСТОТА(B2:B26;J9:J15)

  1. Выделите диапазон К9:К15, начиная с ячейки К9, нажмите функциональную клавишу на клавиатуре F2 (для перехода в режим редактирования ячейки) и нажмите комбинацию клавиш Ctrl+Shift+Enter.

  2. Для построения кумулятивной кривой необходимо подсчитать накопленные частоты. Для этого дополните таблицу по образцу:

hello_html_655ccc30.png

  1. В ячейку L9 введите формулу

=K9

  1. В ячейку L10 введите формулу

=L9+K10

  1. Скопируйте формулу из ячейки L10 в ячейки L11:L15:

hello_html_m1931635c.png

  1. Дополните таблицу по образцу:

hello_html_m6b20ba2e.png

  1. Для вычисления выборочного среднего введите в ячейку Е20 формулу

=СРЗНАЧ(B2:B26)

  1. Для вычисления выборочной дисперсии введите в ячейку Е22 формулу

=ДИСП(B2:B26)

  1. Для вычисления выборочного среднего квадратического отклонения введите в ячейку Е24 формулу

=КОРЕНЬ(E22)

  1. Для вычисления размаха вариации введите в ячейку H20 формулу

=E10-E12

  1. Для вычисления моды введите в ячейку H22 формулу

=МОДА(B2:B26)

  1. Для вычисления медианы введите в ячейку H24 формулу

=МЕДИАНА(B2:B26)

  1. Для построения полигона частот выделите диапазон D4:S5 перейдите на вкладку Вставка в группе Диаграмма раскройте кнопку-список и выберите нужный тип диаграммы

hello_html_m5e0d020a.png

Получим

hello_html_m5e0d020a.png


  1. Для построения гистограммы частот выделите диапазон К8:К15 перейдите на вкладку Вставка в группе Диаграмма раскройте кнопку-список и выберите нужный тип Гистограмма:

hello_html_2be72cb.png

  1. Для построения гистограммы частот выделите диапазон L8:L15 перейдите на вкладку Вставка в группе Диаграмма раскройте кнопку-список и выберите нужный тип График:

hello_html_52eaf9e5.png

Самостоятельная работа

Дана выборка выручки магазина за последние 30 дней. Построить: вариационный ряд, дискретный статистический ряд, интервальный статистический ряд, полигон, гистограммы и кумулятивную кривую, найти числовые характеристики.

Вариант

Выборка

1.

18

19

21

18

16

19

18

16

17

18

15

22

18

17

22

14

19

16

14

14

22

14

21

18

16

12

19

18

18

15

2.

22

23

23

22

21

20

21

18

16

22

18

25

13

23

17

24

21

17

19

27

26

25

21

26

19

24

20

18

23

18

3.

37

32

29

32

28

32

33

35

30

36

32

28

34

32

32

27

32

38

38

32

29

30

39

39

31

30

31

39

29

33

4.

46

43

36

44

39

47

41

47

41

50

50

49

41

40

50

45

46

47

44

48

46

48

46

51

41

47

51

52

40

47

5.

72

74

69

71

73

68

73

77

76

77

76

76

76

64

65

75

70

75

71

69

72

69

78

72

67

72

81

75

72

69

6.

52

51

46

43

50

50

53

57

48

55

56

45

55

51

55

41

54

60

52

52

59

49

51

50

47

49

57

54

54

42

7.

44

44

46

45

49

44

47

47

36

37

35

40

35

39

41

34

38

42

44

42

35

43

45

39

33

39

45

47

41

45

8.

59

60

65

50

55

64

66

63

55

62

60

58

67

58

65

63

59

57

65

56

66

59

59

60

61

65

59

50

64

63

9.

55

71

66

74

71

70

68

76

75

73

65

75

73

70

67

59

63

68

65

65

81

69

64

57

58

68

70

71

71

71

10.

65

72

69

68

62

71

74

74

70

67

76

73

79

77

70

65

70

66

75

66

74

75

84

87

71

69

67

67

75

60

11.

68

63

72

62

58

77

67

67

71

72

75

73

70

66

73

70

69

78

73

64

71

69

73

71

71

68

65

66

69

74

12.

18

19

21

18

16

19

18

16

17

18

15

22

18

17

22

14

19

16

14

14

22

14

21

18

16

12

19

18

18

15

13.

31

33

21

34

27

29

17

31

15

25

30

33

16

14

35

29

19

25

15

35

35

14

24

34

24

32

26

20

21

36

14.

57

70

52

73

56

55

63

67

52

74

54

53

67

66

52

68

67

58

51

51

73

61

56

58

65

63

70

54

58

58

15.

31

12

29

31

27

22

17

24

30

11

19

18

11

26

23

18

22

14

28

17

14

26

16

28

24

24

24

28

29

14





57 вебинаров для учителей на разные темы
ПЕРЕЙТИ к бесплатному просмотру
(заказ свидетельства о просмотре - только до 11 декабря)


Автор
Дата добавления 24.10.2015
Раздел Другое
Подраздел Другие методич. материалы
Просмотров393
Номер материала ДВ-093100
Получить свидетельство о публикации

Включите уведомления прямо сейчас и мы сразу сообщим Вам о важных новостях. Не волнуйтесь, мы будем отправлять только самое главное.
Специальное предложение
Вверх