Курсовая работа по теот.вер. и МС (19 вариант) / 19 Вар/Hermes_19.doc
Оглавление
Теоретическая часть.
Статистическое описание и выборочные характеристики двумерного случайного вектора.
Линейная регрессия.
получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;
проверить статистические гипотезы о параметрах модели;
проверить достаточно ли хорошо модель согласуется с результатами наблюдений.
Однофакторный дисперсионный анализ.
Практическая часть.
Пусть , - выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.
Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.
Выборочная линейная регрессия на по выборке , определяется уравнением
Выборочные средние находятся по формулам
.
Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:
Отсюда
Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам
Аналогично определяется выборочная линейная регрессия на :
коэффициенты и которой находятся по формулам
Для контроля правильности расчетов используют соотношение
Прямые регрессии пересекутся в точке .
В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид
Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .
Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют «разброс» относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:
где - случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.
Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,
Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :
Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:
Величина , определяемая выражением
называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
которое записывается в виде
,
где
Величина называется суммой квадратов, обусловленной регрессией.
Полезной характеристикой линейной регрессии является коэффициент детерминации , вычисляемый по формуле
Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.
В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:
.
Пусть результаты наблюдений составляют независимых выборок, полученных нормально распределенных генеральных совокупностей, которые имеют различные средние и равные дисперсии . Проверяется гипотеза о равенстве средних На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае нас интересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку.
Пусть обозначает -й элемент -й выборки, -выборочное среднее -й выборки, т.е.
;
- общее выборочное среднее, т.е.
где -общее число наблюдений,
Общая сумма квадратов отклонений от общего среднего может быть представлена так:
Это основное тождество дисперсионного анализа. Запишем его в виде
где -общая сумма квадратов отклонений наблюдений от общего среднего, - сумма квадратов отклонений выборочных средних от общего среднего , - сумма квадратов отклонений наблюдений от выборочных средних.
Данное тождество легко проверяется, если учесть, что
и
в силу определения и
Если верна гипотеза : , то статистики и независимы и имеют распределение с и степенями свободы. Следовательно, статистики и являются несмещенными оценками дисперсии . Значительное превышение величины над значением величины можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с и степенями свободы, т.е.
Эта статистика используется для проверки гипотезы : . Гипотеза не противоречит результатам наблюдений, если выборочное значение статистики меньше квантили . В этом случае и являются несмещенными оценками параметров и . Если то гипотеза отклоняется и следует считать, что среди средних имеется хотя бы два не равных друг другу.
X
Y
ΔX2
ΔY2
X2
Y2
XY
(X+Y)2
ei
Qe
10,63
10,96
0,4050
0,7811
112,9969
120,1216
116,5048
466,1281
0,3872
0,1499
10,03
10,90
0,0013
0,6786
100,6009
118,8100
109,3270
438,0649
0,7954
0,6327
10,77
12,76
0,6028
7,2028
115,9929
162,8176
137,4252
553,6609
2,0779
4,3178
9,38
8,60
0,3765
2,1792
87,9844
73,9600
80,6680
323,2804
-0,9974
0,9948
9,66
10,23
0,1113
0,0237
93,3156
104,6529
98,8218
395,6121
0,4141
0,1715
9,00
10,04
0,9872
0,0013
81,0000
100,8016
90,3600
362,5216
0,7392
0,5464
10,76
10,29
0,5874
0,0457
115,7776
105,8841
110,7204
443,1025
-0,3843
0,1477
10,56
10,65
0,3208
0,3292
111,5136
113,4225
112,4640
449,8641
0,1318
0,0174
9,51
7,49
0,2339
6,6884
90,4401
56,1001
71,2299
289,0000
-2,2088
4,8789
9,54
9,83
0,2058
0,0606
91,0116
96,6289
93,7782
375,1969
0,1078
0,0116
10,44
9,67
0,1993
0,1650
108,9936
93,5089
100,9548
404,4121
-0,7546
0,5693
9,65
9,26
0,1181
0,6662
93,1225
85,7476
89,3590
357,5881
-0,5481
0,3004
8,31
8,35
2,8345
2,9798
69,0561
69,7225
69,3885
277,5556
-0,4124
0,1701
9,28
8,46
0,5092
2,6121
86,1184
71,5716
78,5088
314,7076
-1,0593
1,1222
9,68
9,03
0,0983
1,0945
93,7024
81,5409
87,4104
350,0641
-0,8015
0,6424
9,66
9,73
0,1113
0,1199
93,3156
94,6729
93,9918
375,9721
-0,0859
0,0074
9,52
8,37
0,2243
2,9111
90,6304
70,0569
79,6824
320,0521
-1,3366
1,7866
11,23
10,25
1,5287
0,0302
126,1129
105,0625
115,1075
461,3904
-0,7910
0,6257
11,04
10,04
1,0950
0,0013
121,8816
100,8016
110,8416
444,3664
-0,8528
0,7272
10,04
9,41
0,0022
0,4438
100,8016
88,5481
94,4764
378,3025
-0,7024
0,4934
10,33
10,68
0,1132
0,3646
106,7089
114,0624
110,3244
441,4201
0,3413
0,1165
10,33
10,78
0,1132
0,4953
106,7089
116,2084
111,3574
445,6321
0,4413
0,1947
9,01
9,43
0,9675
0,4176
81,1801
88,9249
84,9643
340,0336
0,1214
0,0147
9,29
9,91
0,4951
0,0276
86,3041
98,2081
92,0639
368,6400
0,3829
0,1466
10,60
9,59
0,3677
0,2364
112,3600
91,9681
101,6540
407,6361
-0,9594
0,9205
10,49
10,17
0,2464
0,0088
110,0401
103,4289
106,6833
426,8356
-0,2936
0,0862
9,75
11,06
0,0593
0,9679
95,0625
122,3236
107,8350
433,0561
1,1739
1,3780
9,54
8,32
0,2058
3,0842
91,0116
69,2224
79,3728
318,9796
-1,4022
1,9663
10,21
9,90
0,0468
0,0310
104,2441
98,0100
101,0790
404,4121
-0,3451
0,1191
11,14
11,51
1,3142
2,0558
124,0996
132,4801
128,2214
513,0225
0,5392
0,2907
10,45
9,52
0,2083
0,3094
109,2025
90,6304
99,4840
398,8009
-0,9124
0,8324
10,22
9,64
0,0513
0,1903
104,4484
92,9296
98,5208
394,4196
-0,6129
0,3756
10,84
11,78
0,7164
2,9029
117,5056
138,7684
127,6952
511,6644
1,0433
1,0885
10,60
11,61
0,3677
2,3525
112,3600
134,7921
123,0660
493,2841
1,0606
1,1249
9,17
8,49
0,6783
2,5160
84,0889
72,0801
77,8533
311,8756
-0,9435
0,8902
9,85
10,70
0,0206
0,3891
97,0225
114,4900
105,3950
422,3025
0,7359
0,5415
8,75
10,20
1,5465
0,0153
76,5625
104,0400
89,2500
359,1025
1,0942
1,1974
10,70
9,90
0,4990
0,0310
114,4900
98,0100
105,9300
424,3600
-0,7274
0,5292
9,39
11,15
0,3643
1,1530
88,1721
124,3225
104,6985
421,8916
1,5448
2,3865
8,75
10,36
1,5465
0,0805
76,5625
107,3296
90,6500
365,1921
1,2542
1,5731
9,22
9,44
0,5985
0,4048
85,0084
89,1136
87,0368
348,1956
-0,0325
0,0011
9,36
10,83
0,4014
0,5682
87,6096
117,2889
101,3688
407,6361
1,2482
1,5581
10,98
11,61
0,9730
2,3525
120,5604
134,7921
127,4778
510,3081
0,7641
0,5838
9,94
9,14
0,0029
0,8765
98,8036
83,5396
90,8516
364,0464
-0,8944
0,7999
12,12
11,42
4,5216
1,8058
146,8944
130,4164
138,4104
554,1316
-0,3155
0,0996
11,60
12,19
2,5805
4,4682
134,5600
148,5961
141,4040
565,9641
0,8602
0,7400
10,22
10,20
0,0513
0,0153
104,4484
104,0400
104,2440
416,9764
-0,0529
0,0028
10,16
10,40
0,0277
