Курсовая
 

Московский Институт Электронной Техники

(Технический университет)

Курсовая работа

По теории вероятностей и математической статистике.

Выполнила: Черепкова Ю.В.

Гр. ЭКТ-23

Проверила: Ремарова Т.Л.

Москва, 2004г.

План.

1)Данные.

2)Теоретическая часть.

3)Практическая часть.

4)Сравнение результатов

Вводимые данные:

Х

Y

Остатки

16,89

18,52

-0,4125

17,63

19,96

0,4650

17,11

18,84

-0,2597

17,16

18,89

-0,2477

17,23

18,94

-0,2509

17,16

20,14

1,0023

15,92

18,25

0,0548

18,37

19,55

-0,5074

18,98

21,23

0,7089

16,64

18,74

-0,0025

18,33

20,86

0,8330

19,95

21,11

-0,1483

18,21

19,91

-0,0258

16,41

17,74

-0,8277

17,19

19,37

0,2095

17,26

17,94

-1,2737

16,17

17,86

-0,5253

15,85

18,36

0,2180

16,37

19,63

1,0927

17,66

19,76

0,2422

16,32

18,28

-0,2193

17,31

18,91

-0,3417

15,31

17,80

0,0684

17,51

18,38

-1,0238

18,33

20,64

0,6130

16,14

18,96

0,5975

16,09

18,36

0,0355

18,17

19,86

-0,0454

15,04

16,69

-0,8364

17,71

19,59

0,0342

17,35

19,86

0,5779

18,00

19,93

0,1538

18,33

20,28

0,2530

18,39

19,72

-0,3526

15,37

18,21

0,4328

17,35

19,61

0,3279

16,04

17,91

-0,3764

17,51

19,16

-0,2438

18,00

19,49

-0,2862

15,60

18,25

0,2980

19,04

20,33

-0,2367

18,46

19,34

-0,7858

17,09

18,94

-0,1445

17,08

18,97

-0,1069

17,20

19,81

0,6419

17,58

18,70

-0,7570

15,52

17,85

-0,0412

16,18

18,72

0,3271

17,36

20,23

0,9403

16,24

18,59

0,1515

Теоретическая часть.

Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X

y=β*0 *1x и X на Y x=β*0 *1y.

Сначала вычислим суммы

∑xi , ∑yi ,∑x2i ,∑y2i , ∑xiyi ,∑ (xi+yi)2

Для контроля правильности вычислений используется тождество

∑ (xi+yi)2= ∑x2i + 2 ∑xiyi + ∑y2i

Выборочные средние находятся по формулам

x**1,0=(1/n) ∑xi , y**0,1=(1/n) ∑yi . (1)

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :

Qx=∑(xi - x*)2=∑x2i - (∑x)2i/n , (2)

Qy=∑(yi - y*)2=∑y2i - (∑y)2i/n , (3)

Qxy=∑(xi - x*)(yi - y*)=∑xiyi - (∑x i)(∑yi )/n , (4)

Отсюда

D*x= (1/n) Qx , D*y= (1/n) Qy ,

R=(μ*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)

Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением

y=β*0 *1x= y* + r (D*x / D*y ) (x - x*)

Коэффициенты β*0 и β*1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам

β1*=[n ∑ xiyi - (∑x i)(∑yi )]/(n ∑x2i - (∑xi)2 ) = Qxy / Qx (6)

β0* = y*- β1*x* (7)

Аналогично определяется выборочная линейная регрессия X на Y :

x=β*0 *1y = x* + r (D*x / D*y ) (y - y*)

β1*=[n ∑ xiyi - (∑x i)(∑yi )]/(n ∑y2i - (∑yi)2 ) = Qxy / Qy (8)

β0*= x*- β*1y* (9)

Для контроля правильности расчетов используют соотношение

1*β1*)1/2= r (10)

Прямые

y=β*0 *1x , x=β*0 *1y

Пересекаются в точке с координатами (x*, y* )

Функция y=β*0 *1x

Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями ŷi*0 *1x называются остатками и обозначаются ei :

ei = yi - ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)

Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле

S2=∑ e2i /(n-2)=1/(n-2) ∑[ yi - (β*0 *1xi)]2=Qe/(n-2) (12)

Величина Qe определяемая выражением

Qe = ∑ e2i=∑ (yi - ŷ i) (13)

Называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

∑ (yi - y*i)2 = ∑ (ŷi - y*i )2 + ∑ (yi - ŷi) 2 (14)

Которое записывается в виде

Qy = Qr + Qe , где

Qy= ∑ (yi - y*i)2= ∑ (y2i - n*y*i) ,

Qr =∑ (ŷi - y*i )2*1 Qxy2*1 Qx= Q2xy/ Qx (15)

Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.

Полезной характеристокой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле

R2= Qr / Qy =1 - (Qe / Qy) (16)

Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=y* , которая объсняется выборочной регрессией . Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями ŷi , предсказываемыми регрессией , т.е.

R= p*yŷ= ryŷ

В случае линейной регрессии Y на x (одной независимой переменной x) между коэффициентом R и выборочным коэффициентом корреляции rxy имеется следующее соотношение :

rxy = ( знак β*1 ) R .

Однофакторный дисперсионный анализ.

Пусть результаты наблюдений составляют l независимых выборок ( групп ), полученных из l нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние m1 , m2 , ..... , ml и равные дисперсии σ2. Проверяется гипотеза о равенстве средних H0 m1= m2 = ..... =ml. На практике такая задача возникает при исследованиии влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае на синтересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку ( гипотеза H0 ) . При l=2 для проверки гипотезы H0 используется известные критерии значимости. Если l>2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный анализ, суть которого состоит в следующем.

Пусть xik обозначает i-й элемент k-й выборки , i = 1,2,......,n , k = 1,2,......,n , x*k-выборочное среднее k-й выборки, т.е.

x*k=(1/nk) ∑ xik = (1/n) x ..k ,

k*- общее выборочное среднее, т.е.

x*=∑∑ xik = (1/n) x . . ,

где n - общее число наблюдений, n= ∑ nk

Общая сумма квадратов отклонений наблюдений от общего среднего x* может быть предтавлена так :

∑∑ ( xik - x*)2=∑ nk ( x*k - x*)2+∑∑ ( xik - x*k)2 (17)

Это основное тождество дисперсионного анализа. Запишем его в виде

Q=Q1+Q2 (18)

Где Q- общая сумма квадратов отклонений наблюдений от общего среднего, Q1 - сумма квадратов отклонений выборочных средних x*k от общего среднего x* (между группами), Q2-сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).

Тождество (1) легко проверяется , если воспользоваться очевидным равенством

( xik - x*)= [( x*k - x*)+ ( xik - x*k)]

и учесть, что

∑∑ ( xik - x*k) ( x*k - x*)=0

в силу определения средних x*k и x*

Если верна гипотеза H0: m1= m2 = .....= ml, то статистики Q1/σ2 и Q22 независимы и имеют распределение χ2 с l-1 и n-l степенями свободы. Следовательно, статистики S21= Q1/(l-1) и S22= Q2/(n-l) являются несмещенными оценками неизвесной дисперсии σ2. Оценка S21 характеризует рассеяние групповых средних, а оценка S22-рассеяние внутри групп, которое обусловленно случайными вариациями результатов наблюдений. Значительное превышение величины S21 над значением величины S22 можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с l-1 и n-l степенями свободы, т.е.

S21/S22= Q1/(l-1)Q2/(n-l)=F(l-1,n-l)

Статистика используется для проверки гипотезы H0: m1= m2 = .....= ml. Гипотеза H0 не противоречит результатам наблюдений, если выборочное значение Fв статистики меньше квантили F1-α(l-1,n-l) , т.е. если Fв< F1-α(l-1,n-l). В этом случае x* и Q2/(n-l) являются несмещенными оценками параметров m и σ2 .Если Fв< F1-α(l-1,n-l), то гипотеза H0 отклоняется и следует считать, что среди средних m1, m2 , ....., ml имеется хотя бы два не равных друг другу.