Решение 1. Лабораторная работа №1 Парная линейная регрессия
Линейное уравнение
регрессии имеет вид y = bx + a. Оценочное уравнение регрессии будет иметь вид y = bx
+ a + ε, где ei – наблюдаемые значения ошибок εi, a и b соответственно
оценки параметров α и β регрессионной модели, следует найти. Метод наименьших
квадратов дает наилучшие оценки параметров уравнения регрессии.
Выполняются определенные
предпосылки относительно случайного члена (ε) и независимой переменной (x). Формально
критерий МНК можно записать так: S = ∑(yi - y*i)2 → min.
Система нормальных
уравнений.
A*n + b·∑x = ∑y
a·∑x + b·∑x2 = ∑y*x
Для
расчета параметров регрессии
построим расчетную таблицу.
x
|
y
|
x2
|
y2
|
x*y
|
2
|
3
|
4
|
9
|
6
|
5
|
6
|
25
|
36
|
30
|
3
|
4
|
9
|
16
|
12
|
7
|
6
|
49
|
36
|
42
|
2
|
4
|
4
|
16
|
8
|
6
|
8
|
36
|
64
|
48
|
4
|
6
|
16
|
36
|
24
|
9
|
9
|
81
|
81
|
81
|
8
|
9
|
64
|
81
|
72
|
4
|
5
|
16
|
25
|
20
|
50
|
60
|
304
|
400
|
343
|
Для
наших данных система уравнений имеет вид 10a + 50·b = 60
50·a + 304·b = 343
Домножим уравнение системы на получим систему,
решим методом алгебраического сложения.
-50a -250 b = -300
50*a + 304*b = 343
Получаем:
54*b = 43
Откуда b = 0.7963
Теперь найдем коэффициент «a» из уравнения (1):
10a + 50*b = 60
10a + 50*0.7963 = 60
10a = 20.185
a = 2.0185
Получаем эмпирические коэффициенты регрессии:
b = 0.7963,
a = 2.0185
Уравнение регрессии:
y = 0.7963
x + 2.0185
Выборочные
средние.
Выборочные
дисперсии:
Среднеквадратическое
отклонение
Коэффициент корреляции b можно находить по
формуле, не решая систему непосредственно:
Ковариация.
Рассчитываем показатель показателем является
выборочный линейный коэффициент корреляции, рассчитывается по формуле:
Линейный коэффициент корреляции принимает
значения от –1 до +1.
Критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5:
умеренная;
0.5 < rxy < 0.7:
заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма
высокая.
Коэффициент линейной парной корреляции может
быть определен через коэффициент регрессии b:
Линейное уравнение регрессии имеет вид y =
0.796 x + 2.019
Коэффициент регрессии b = 0.796 показывает
среднее изменение результативного показателя с повышением и понижением
величины фактора х на единицу измерения. С увеличением на 1 единицу y
повышается в среднем на 0.796.
Коэффициент a = 2.019 формально показывает
прогнозируемый уровень у, х=0 находится близко с выборочными значениями. Но х=0
находится далеко от выборочных значений х, то буквальная интерпретация может
привести к неверным результатам, линия регрессии довольно точно описывает
значения наблюдаемой выборки, нет гарантий, будет при экстраполяции влево или
вправо.
Подставив в уравнение регрессии соответствующие
значения х, можно определить выровненные значения результативного показателя
y(x) для каждого наблюдения. Связь между у и х определяет знак коэффициента
регрессии b.
Вариант 6
По
21 региону страны изучается зависимость розничной продажи телевизоров, у от
среднедушевых денежных доходов в месяц, х: Номер региона Среднедушевой денежный
доход в месяц, тыс. руб., х Розничная продажа телевизоров, тыс. шт.,
Решение.
Построим поле корреляции.
Расположение точек на
диаграмме дает нам право предположить, что переменные связаны линейной
зависимостью. Рассчитаем выборочные коэффициенты корреляции. Для проведем
промежуточные вычисления, по формулам (и поместим результаты вычислений в
таблицу:
Номер региона
|
x
|
y
|
xy
|
x
2
|
y
2
|
1
|
2
|
28
|
56
|
4
|
784
|
2
|
2,4
|
21,3
|
51,12
|
5,76
|
453,69
|
3
|
2,1
|
21
|
44,1
|
4,41
|
441
|
4
|
2,6
|
23,3
|
60,58
|
6,76
|
542,89
|
5
|
1,7
|
15,8
|
26,86
|
2,89
|
249,64
|
6
|
2,5
|
21,9
|
54,75
|
6,25
|
479,61
|
7
|
2,4
|
20
|
48
|
5,76
|
400
|
8
|
2,6
|
22
|
57,2
|
6,76
|
484
|
9
|
2,8
|
23,9
|
66,92
|
7,84
|
571,21
|
10
|
2,6
|
26
|
67,6
|
6,76
|
676
|
11
|
2,6
|
24,6
|
63,96
|
6,76
|
605,16
|
12
|
2,5
|
21
|
52,5
|
6,25
|
441
|
13
|
2,9
|
27
|
78,3
|
8,41
|
729
|
14
|
2,6
|
21
|
54,6
|
6,76
|
441
|
15
|
2,2
|
24
|
52,8
|
4,84
|
576
|
16
|
2,6
|
24
|
62,4
|
6,76
|
576
|
17
|
3,3
|
31,9
|
105,27
|
10,89
|
1017,61
|
18
|
3,9
|
33
|
128,7
|
15,21
|
1089
|
19
|
4
|
35,4
|
141,6
|
16
|
1253,16
|
20
|
3,7
|
34
|
125,8
|
13,69
|
1156
|
21
|
3,4
|
31
|
105,4
|
11,56
|
961
|
Сумма
|
57,4
|
530,1
|
1504,46
|
164,32
|
13926,97
|
Составляем систему
уравнений:
и решаем по формулам
Крамера:
Тогда, согласно теореме
Крамера,
2. Получаем уравнение
регрессии:
Ý=4.81+7.54x
Величина коэффициента
регрессии b =7.54 означает, что увеличение среднедушевого месячного дохода на
1 тыс. руб. приведет к увеличение объема розничной продажи в среднем на 7 540
телевизоров. Коэффициент α в случае не имеет содержательной интерпретации.
3. Нанесем
построенную линию регрессии на диаграмму.
Для этого
рассчитаем значения Ý, Ï=1,21по формуле:
Ý1=4,81+7,54
X
Результаты вычислений
запишем в таблицу:
Номер региона
|
X
|
Y
|
Ý
|
1
|
2
|
28
|
19,76
|
2
|
2,4
|
21,3
|
22,75
|
3
|
2,1
|
21
|
20,51
|
4
|
2,6
|
23,3
|
24,25
|
5
|
1,7
|
15,8
|
17,52
|
6
|
2,5
|
21,9
|
23,50
|
7
|
2,4
|
20
|
22,75
|
8
|
2,6
|
22
|
24,25
|
9
|
2,8
|
23,9
|
25,74
|
10
|
2,6
|
26
|
24,25
|
11
|
2,6
|
24,6
|
24,25
|
12
|
2,5
|
21
|
23,50
|
13
|
2,9
|
27
|
26,49
|
14
|
2,6
|
21
|
24,25
|
15
|
2,2
|
24
|
21,26
|
16
|
2,6
|
24
|
24,25
|
17
|
3,3
|
31,9
|
29,48
|
18
|
3,9
|
33
|
33,96
|
19
|
4
|
35,4
|
34,71
|
20
|
3,7
|
34
|
32,47
|
21
|
3,4
|
31
|
30,23
|
Наносим на диаграмму точки
из последнего столбца таблицы (Линия регрессии):
4. Для оценки тесноты
линейной зависимости рассчитаем коэффициент детерминации. Для этого необходимо
провести ряд дополнительных вычислений.
Прежде всего, найдем выборочное
среднее Ý по формуле:
Теперь произведем
расчет остальных вспомогательных величин:
Номер региона
|
X
|
Y
|
Ý
|
Y-Ý
|
(Y-Ý)2
|
Y-Ý
|
(Y-Ý)2
|
1
|
2
|
28
|
19,76
|
8,24
|
67,89
|
2,76
|
7,60
|
2
|
2,4
|
21,3
|
22,75
|
-1,45
|
2,11
|
-3,94
|
15,55
|
3
|
2,1
|
21
|
20,51
|
0,49
|
0,24
|
-4,24
|
18,00
|
4
|
2,6
|
23,3
|
24,25
|
-0,95
|
0,90
|
-1,94
|
3,77
|
5
|
1,7
|
15,8
|
17,52
|
-1,72
|
2,95
|
-9,44
|
89,17
|
6
|
2,5
|
21,9
|
23,50
|
-1,60
|
2,56
|
-3,34
|
11,17
|
7
|
2,4
|
20
|
22,75
|
-2,75
|
7,57
|
-5,24
|
27,49
|
8
|
2,6
|
22
|
24,25
|
-2,25
|
5,04
|
-3,24
|
10,52
|
9
|
2,8
|
23,9
|
25,74
|
-1,84
|
3,39
|
-1,34
|
1,80
|
10
|
2,6
|
26
|
24,25
|
1,75
|
3,08
|
0,76
|
0,57
|
11
|
2,6
|
24,6
|
24,25
|
0,35
|
0,13
|
-0,64
|
0,41
|
12
|
2,5
|
21
|
23,50
|
-2,50
|
6,24
|
-4,24
|
18,00
|
13
|
2,9
|
27
|
26,49
|
0,51
|
0,26
|
1,76
|
3,09
|
14
|
2,6
|
21
|
24,25
|
-3,25
|
10,54
|
-4,24
|
18,00
|
15
|
2,2
|
24
|
21,26
|
2,74
|
7,53
|
-1,24
|
1,54
|
16
|
2,6
|
24
|
24,25
|
-0,25
|
0,06
|
-1,24
|
1,54
|
17
|
3,3
|
31,9
|
29,48
|
2,42
|
5,86
|
6,66
|
44,32
|
18
|
3,9
|
33
|
33,96
|
-0,96
|
0,93
|
7,76
|
60,17
|
19
|
4
|
35,4
|
34,71
|
0,69
|
0,47
|
10,16
|
103,17
|
20
|
3,7
|
34
|
32,47
|
1,53
|
2,34
|
8,76
|
76,69
|
21
|
3,4
|
31
|
30,23
|
0,77
|
0,60
|
5,76
|
33,14
|
Сумма
|
57,4
|
530,1
|
|
|
130,68
|
|
545,73
|
Для вычисления
коэффициента детерминации воспользуемся формулой: R2
=1-130.68 =0.75
548
Значение коэффициента
детерминации позволяет сделать предварительный вывод у нас имеются основания
использовать модель линейной регрессии в задаче, поскольку. R1
£(0.49$1
5. Нанесем теперь уравнение
регрессии на диаграмму, используя специальные средства Excel («Добавить
линию тренда»).
Линия регрессии, построенная нами ранее,
совпала с данной линией регрессии. Нетрудно убедиться, что уравнение регрессии
и коэффициент детерминации тоже совпадают с полученными ранее вручную.
6.
Найдем теперь среднюю ошибку аппроксимации для оценки погрешности модели. Для
этого нам потребуется вычислить еще ряд промежуточных величин:
Номер региона
|
x
|
y
|
Ý
|
y-Ý
|
y-Ý
y
|
1
|
2
|
28
|
19,76
|
8,24
|
0,29
|
2
|
2,4
|
21,3
|
22,75
|
-1,45
|
0,07
|
3
|
2,1
|
21
|
20,51
|
0,49
|
0,02
|
4
|
2,6
|
23,3
|
24,25
|
-0,95
|
0,04
|
5
|
1,7
|
15,8
|
17,52
|
-1,72
|
0,11
|
6
|
2,5
|
21,9
|
23,50
|
-1,60
|
0,07
|
7
|
2,4
|
20
|
22,75
|
-2,75
|
0,14
|
8
|
2,6
|
22
|
24,25
|
-2,25
|
0,10
|
9
|
2,8
|
23,9
|
25,74
|
-1,84
|
0,08
|
10
|
2,6
|
26
|
24,25
|
1,75
|
0,07
|
11
|
2,6
|
24,6
|
24,25
|
0,35
|
0,01
|
12
|
2,5
|
21
|
23,50
|
-2,50
|
0,12
|
13
|
2,9
|
27
|
26,49
|
0,51
|
0,02
|
14
|
2,6
|
21
|
24,25
|
-3,25
|
0,15
|
15
|
2,2
|
24
|
21,26
|
2,74
|
0,11
|
16
|
2,6
|
24
|
24,25
|
-0,25
|
0,01
|
17
|
3,3
|
31,9
|
29,48
|
2,42
|
0,08
|
18
|
3,9
|
33
|
33,96
|
-0,97
|
0,03
|
19
|
4
|
35,4
|
34,71
|
0,69
|
0,02
|
20
|
3,7
|
34
|
32,47
|
1,53
|
0,05
|
21
|
3,4
|
31
|
30,23
|
0,77
|
0,02
|
Просуммируем теперь
элементы последнего столбца и разделим полученную сумму на 21 – общее
количество исходных данных:
0.29+0.07+0.02
=0.0771
21
Итак, средняя ошибка
аппроксимации A=0.0771*100%=7.71% Величина ошибки оказалась около 8%, что говорит
о небольшой погрешности построенной модели. Данную модель, с учетом неплохих
характеристик ее качества, вполне можно использовать для прогноза – одной из
основных целей эконометрического анализа.
7. Рассчитаем значение
фактора, построить прогноз. Для этого необходимо вычислить выборочное среднее
значение по формуле:
.Для
нашей задачи среднее значение среднедушевого месячного дохода:
Рассчитаем теперь значение.
Подставим теперь полученное значение фактора
x=3.003b уравнение регрессии и найдем
прогнозируемое значение:
.
+Таким образом, если
среднедушевой месячный доход в некотором регионе составит 3 003 руб.,
количество продаваемых телевизоров составит в среднем 27 450 шт. в месяц.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.