Курсовая работа по теот.вер. и МС (26 вариант) / 26 вар/тервер в-26.doc
Московский Институт Электронной Техники
(Технический университет)
Курсовая работа
По теории вероятностей и математической статистике.
Выполнила: Черепкова Ю.В.
Гр. ЭКТ-23
Проверила: Ремарова Т.Л.
Москва, 2004г.
План.
1)Данные.
2)Теоретическая часть.
3)Практическая часть.
4)Сравнение результатов
Вводимые данные:
Х | Y | Остатки |
16,89 | 18,52 | -0,4125 |
17,63 | 19,96 | 0,4650 |
17,11 | 18,84 | -0,2597 |
17,16 | 18,89 | -0,2477 |
17,23 | 18,94 | -0,2509 |
17,16 | 20,14 | 1,0023 |
15,92 | 18,25 | 0,0548 |
18,37 | 19,55 | -0,5074 |
18,98 | 21,23 | 0,7089 |
16,64 | 18,74 | -0,0025 |
18,33 | 20,86 | 0,8330 |
19,95 | 21,11 | -0,1483 |
18,21 | 19,91 | -0,0258 |
16,41 | 17,74 | -0,8277 |
17,19 | 19,37 | 0,2095 |
17,26 | 17,94 | -1,2737 |
16,17 | 17,86 | -0,5253 |
15,85 | 18,36 | 0,2180 |
16,37 | 19,63 | 1,0927 |
17,66 | 19,76 | 0,2422 |
16,32 | 18,28 | -0,2193 |
17,31 | 18,91 | -0,3417 |
15,31 | 17,80 | 0,0684 |
17,51 | 18,38 | -1,0238 |
18,33 | 20,64 | 0,6130 |
16,14 | 18,96 | 0,5975 |
16,09 | 18,36 | 0,0355 |
18,17 | 19,86 | -0,0454 |
15,04 | 16,69 | -0,8364 |
17,71 | 19,59 | 0,0342 |
17,35 | 19,86 | 0,5779 |
18,00 | 19,93 | 0,1538 |
18,33 | 20,28 | 0,2530 |
18,39 | 19,72 | -0,3526 |
15,37 | 18,21 | 0,4328 |
17,35 | 19,61 | 0,3279 |
16,04 | 17,91 | -0,3764 |
17,51 | 19,16 | -0,2438 |
18,00 | 19,49 | -0,2862 |
15,60 | 18,25 | 0,2980 |
19,04 | 20,33 | -0,2367 |
18,46 | 19,34 | -0,7858 |
17,09 | 18,94 | -0,1445 |
17,08 | 18,97 | -0,1069 |
17,20 | 19,81 | 0,6419 |
17,58 | 18,70 | -0,7570 |
15,52 | 17,85 | -0,0412 |
16,18 | 18,72 | 0,3271 |
17,36 | 20,23 | 0,9403 |
16,24 | 18,59 | 0,1515 |
Теоретическая часть.
Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X
y=β*0 +β*1x и X на Y x=β*′0 +β*′1y.
Сначала вычислим суммы
∑xi , ∑yi ,∑x2i ,∑y2i , ∑xiyi ,∑ (xi+yi)2
Для контроля правильности вычислений используется тождество
∑ (xi+yi)2= ∑x2i + 2 ∑xiyi + ∑y2i
Выборочные средние находятся по формулам
x*=α*1,0=(1/n) ∑xi , y*=α*0,1=(1/n) ∑yi . (1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :
Qx=∑(xi - x*)2=∑x2i - (∑x)2i/n , (2)
Qy=∑(yi - y*)2=∑y2i - (∑y)2i/n , (3)
Qxy=∑(xi - x*)(yi - y*)=∑xiyi - (∑x i)(∑yi )/n , (4)
Отсюда
D*x= (1/n) Qx , D*y= (1/n) Qy ,
R=(μ*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением
y=β*0 +β*1x= y* + r (D*x / D*y ) (x - x*)
Коэффициенты β*0 и β*1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
β1*=[n ∑ xiyi - (∑x i)(∑yi )]/(n ∑x2i - (∑xi)2 ) = Qxy / Qx (6)
β0* = y*- β1*x* (7)
Аналогично определяется выборочная линейная регрессия X на Y :
x=β*′0 +β*′1y = x* + r (D*x / D*y ) (y - y*)
β1*′=[n ∑ xiyi - (∑x i)(∑yi )]/(n ∑y2i - (∑yi)2 ) = Qxy / Qy (8)
β0*′= x*- β*′1y* (9)
Для контроля правильности расчетов используют соотношение
(β1*β1*′)1/2= r (10)
Прямые
y=β*0 +β*1x , x=β*′0 +β*′1y
Пересекаются в точке с координатами (x*, y* )
Функция y=β*0 +β*1x
Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями ŷi=β*0 +β*1x называются остатками и обозначаются ei :
ei = yi - ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле
S2=∑ e2i /(n-2)=1/(n-2) ∑[ yi - (β*0 +β*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe = ∑ e2i=∑ (yi - ŷ i) (13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
∑ (yi - y*i)2 = ∑ (ŷi - y*i )2 + ∑ (yi - ŷi) 2 (14)
Которое записывается в виде
Qy = Qr + Qe , где
Qy= ∑ (yi - y*i)2= ∑ (y2i - n*y*i) ,
Qr =∑ (ŷi - y*i )2=β*1 Qxy=β2*1 Qx= Q2xy/ Qx (15)
Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.
Полезной характеристокой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле
R2= Qr / Qy =1 - (Qe / Qy) (16)
Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=y* , которая объсняется выборочной регрессией . Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями ŷi , предсказываемыми регрессией , т.е.
R= p*yŷ= ryŷ
В случае линейной регрессии Y на x (одной независимой переменной x) между коэффициентом R и выборочным коэффициентом корреляции rxy имеется следующее соотношение :
rxy = ( знак β*1 ) R .
Однофакторный дисперсионный анализ.
Пусть результаты наблюдений составляют l независимых выборок ( групп ), полученных из l нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние m1 , m2 , ..... , ml и равные дисперсии σ2. Проверяется гипотеза о равенстве средних H0 m1= m2 = ..... =ml. На практике такая задача возникает при исследованиии влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае на синтересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку ( гипотеза H0 ) . При l=2 для проверки гипотезы H0 используется известные критерии значимости. Если l>2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный анализ, суть которого состоит в следующем.
Пусть xik обозначает i-й элемент k-й выборки , i = 1,2,......,n , k = 1,2,......,n , x*k-выборочное среднее k-й выборки, т.е.
x*k=(1/nk) ∑ xik = (1/n) x ..k ,
k*- общее выборочное среднее, т.е.
x*=∑∑ xik = (1/n) x . . ,
где n - общее число наблюдений, n= ∑ nk
Общая сумма квадратов отклонений наблюдений от общего среднего x* может быть предтавлена так :
∑∑ ( xik - x*)2=∑ nk ( x*k - x*)2+∑∑ ( xik - x*k)2 (17)
Это основное тождество дисперсионного анализа. Запишем его в виде
Q=Q1+Q2 (18)
Где Q- общая сумма квадратов отклонений наблюдений от общего среднего, Q1 - сумма квадратов отклонений выборочных средних x*k от общего среднего x* (между группами), Q2-сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).
Тождество (1) легко проверяется , если воспользоваться очевидным равенством
( xik - x*)= [( x*k - x*)+ ( xik - x*k)]
и учесть, что
∑∑ ( xik - x*k) ( x*k - x*)=0
в силу определения средних x*k и x*
Если верна гипотеза H0: m1= m2 = .....= ml, то статистики Q1/σ2 и Q2/σ2 независимы и имеют распределение χ2 с l-1 и n-l степенями свободы. Следовательно, статистики S21= Q1/(l-1) и S22= Q2/(n-l) являются несмещенными оценками неизвесной дисперсии σ2. Оценка S21 характеризует рассеяние групповых средних, а оценка S22-рассеяние внутри групп, которое обусловленно случайными вариациями результатов наблюдений. Значительное превышение величины S21 над значением величины S22 можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с l-1 и n-l степенями свободы, т.е.
S21/S22= Q1/(l-1)Q2/(n-l)=F(l-1,n-l)
Статистика используется для проверки гипотезы H0: m1= m2 = .....= ml. Гипотеза H0 не противоречит результатам наблюдений, если выборочное значение Fв статистики меньше квантили F1-α(l-1,n-l) , т.е. если Fв< F1-α(l-1,n-l). В этом случае x* и Q2/(n-l) являются несмещенными оценками параметров m и σ2 .Если Fв< F1-α(l-1,n-l), то гипотеза H0 отклоняется и следует считать, что среди средних m1, m2 , ....., ml имеется хотя бы два не равных друг другу.
