Математическая статистика. Основные понятия
Download 478.23 Kb. Pdf ko'rish
|
kr-11
- Bu sahifa navigatsiya:
- Статистические гипотезы
- Критерий Пирсона
3
методы сбора, систематизации, обработки результатов наблюдений массовых случайных явлений. Любое множество, подлежащее изучению в статистике, называется генеральной совокупностью. Любое подмножество генеральной совокупности называется выё боркой. Количество элементов в генеральной совокупности или в
называется объемом. Элементы выборки могут
характеризоваться числами, отражающими какой-либо признак изучаемого объекта. Эти числа называются вариантами, так как от выборки к выборке эти значения меняются.
Первым шагом в обработке полученных данных является составление статистического или вариационного ряда.
порядке возрастания и указаны соответствующие им частоты.
Для графического изображения статистического ряда частот служит ломаная в прямоугольной декартовой системе координат с вершинами в точках i i n x , - называемая полигоном частот, или ломаная с вершинами в точках
n n x i i , - называемая полигоном относительных частот. Здесь i x - возможные значения вариант, i n - частота, т. е. количество появления i варианты, n - объем выборки. При большом объеме выборки ее элементы объединяются в группы (разряды), представляя результаты опытов в виде сгруппированного статистического ряда. Для этого интервал, содержащий все элементы выборки, разбивается на k непересекающихся интервалов, обычно одинаковой длины l .
Для графического изображения сгруппированной выборки служит ступенчатая фигура из прямоугольников, называемая гистограммой. Для построения гистограммы на оси ox откладываются интервалы длины l , которые служат основаниями прямоугольников, а их высоты определяются отношением
, если мы строим гистограмму частот, или l n n i , если мы строим гистограмму относительных частот.
Пример 1. а) Дан статистический ряд. Требуется построить полигон относительных частот. б) Дан сгруппированный статистический ряд. Требуется построить гистограмму относительных частот. а)
i x
значения вариант 15
16 17
18 19
i n
частоты 1 5 6 5 3
4
б) границы
интервалов 10-20 20-30 30-40 40-50 50-60
частоты 1 2 7 18
12
Решение. а) Для построения полигона частот найдем относительные частоты по формуле n n i , где
20 3 5 6 5 1 5 1
i n n . Результат запишем в таблицу i x 15
16 17
18 19
i n 1 5 6 5 3 20 n n i
1/20=0,05 5/20=0,25 6/20=0,3 5/20=0,25 3/20=0,15
Строим ломаную с координатами
n n x i i , (рис. 1). n n i
x
Рис. 1
неодинаковым.
б) Для построения гистограммы относительных частот найдем относительные частоты по формуле n n i , высоты прямоугольников по
формуле nl n h i , где 40 12 18 7 2 1 1 n i i n n , 10 l . Величина h характеризует плотность попадания вариант в i-ый интервал. Результаты удобно записать в таблицу.
0,05 15
16 17
18 19
0,15 5
1
i x x
10 - 20 20 - 30 30 - 40
40 - 50 50 - 60
i n
1 2 7 18 12 40
n i
1/40 = 0,025
2/40 = 0,05 7/40 = 0,175
18/40 = 0,45 12/40 = 0,3
n i
0,025/10 = 0,0025 0,05/10 = 0,005 0,175/10 = 0,0175 0,45/10 = 0,045 0,3/10 = 0,03
Строим гистограмму (рис. 2).
x
Рис. 2 Статистические гипотезы
Во многих случаях результаты наблюдений используются для проверки предположений (гипотез) относительно тех или иных свойств распределения генеральной совокупности. В частности, такого рода задачи возникают при сравнении различных технологических процессов или методов обработки по определенным измеряемым признакам, например, по
точности, производительности и т. д.
Пусть
X
наблюдаемая дискретная или непрерывная случайная величина.
параметров или вида распределения случайной величины X .
Основной или нулевой гипотезой 0
называют выдвинутую гипотезу, а гипотезу 1
, ей противоречащую конкурирующей или альтернативной. Правило, по которому принимается решение принять или отклонить гипотезу 0
называют статистическим критерием K . Обычно
статистические критерии выражаются числами, которые вычисляются по вариантам выборки, или находятся теоретически. Значение критерия, найденное на основе выборки наблюдений случайной величины
, называют 0,045 0,005
10 20
30 40
50 60
6
в K . Значение критерия, которое находится по таблице, называется теоретическим и обозначается T K .
Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, считаются достоверными. Этот принцип можно реализовать следующим образом. Перед анализом выборки фиксируется некоторая малая вероятность , называемая уровнем значимости, и равная вероятности отвергнуть правильную 0
вероятность принять правильную 0
. Уровень значимости определяет размер «критической области». Критическая область k V те значения критерия K , при которых гипотезу 0
заданного уровня значимости, называется критерием значимости.
Таким образом, проверка значимости статистической гипотезы при помощи критерия значимости может быть разбита на следующие этапы: 1) сформулировать проверяемую ( 0
1
2) назначить уровень значимости ; 3) выбрать статистический критерий; 4) определить теоретическое ( T K ) и выборочное ( в K ) значения критерия; 5) определить критическую область k V ; 6) принять статистическое решение: если в K k V , то гипотезу 0 H принять, т. е. считать, что гипотеза 0
, то отклонить гипотезу 0 H как не согласующуюся с результатами наблюдений.
2
(хи-квадрат)
Этот критерий был введен английским математиком К. Пирсоном (1857 – 1936). Критерий служит для проверки гипотезы о виде распределения случайной величины X .
Итак, пусть имеется сгруппированный статистический ряд, разбитый на k интервалов, где k - заранее выбранное число, i n - число вариант, попадающих в i интервал, n - объем выборки,
i i x X x P p 1 -
вероятность попадания случайной величины X в
i - ый интервал при выбранном законе распределения случайной величины.
При этих условиях Пирсон предложил в качестве критерия K
рассмотреть случайную величину
k i i i i np np n 1 2 2 , ( i n - случайные величины). (1) Он доказал, что 2
распределения и определяется функцией плотности 7
2 1 2 2 /
2 2 1 r r r r e u u r Г u , 0 u
(2) где r - число степеней свободы, определяемое по формуле 1
k r , здесь
m - число параметров гипотетического закона распределения, подлежащих определению по опытным данным.
График функции плотности u r имеет вид (рис. 3):
u r
u
Рис. 3 Критерий 2
выборочное значение критерия Пирсона
k i i i i в np np n 1 2 2 , ( i n - выборочные частоты). По таблице критических точек распределения 2
уровню значимости и числу степеней свободы r находят теоретическое значение критерия Пирсона 2
.
Если значение 2
окажется больше или равно 2 T , то гипотезу отвергают. Если же 2
меньше 2 T , то гипотезу принимают и считают ее не противоречащей опытным данным.
При использовании критерия хи-квадрат рекомендуем промежуточные результаты заносить в таблицу:
i i x x , 1 i n i p i np i i np n
2 i i np n
i i np np n 2 1 0 , x x
1 n 1
1
1 1 np n
2 1 1
n
1 2 1 1 np np n
- - - - - - k k x x , 1
n k p
np
k np n
2 k k np n
k k np np n 2
8
них было 5-10 наблюдений. Интервалы, содержащие мало наблюдений, рекомендуется объединять с соседними.
Пример 2. Даны результаты наблюдений некоторой случайной величины X . Проверить гипотезу о ее нормальном распределении. интервалы
3,5-4,5
4,5-5,5 5,5-6,5
6,5-7,5 7,5-8,5
8,5-9,5 число
вариант 6 13 25 16
11 9
Решение. 1. Построим гистограмму относительных частот (рис. 4), данные для ее построения занесем в таблицу ( 80
i n n , длина интервалов 1
).
i i x x , 1 (4)
3,5-4,5 (5)
4,5-5,5 (6)
5,5-6,5 (7)
6,5-7,5 (8)
7,5-8,5 (9)
8,5-9,5 i n 6 13 25 16
11 9
n i
075 , 0 80 6
1625 , 0 80 13 3125
, 0 80 25
2 , 0 80 16 1375
, 0 80 11
11125 , 0 80 9 nl n h i
0,075 0,1625
0,3125 0,2
0,1375 0,1125
x
Рис. 4 2. По виду гистограммы можно предположить, что наблюдаемая случайная величина имеет нормальное распределение - 2 , a N . Функция плотности 0,3125 3,5 4,5 6,5 7,5 8,5 9,5 5,5
0 График функции плотности 0,075
9 вероятности нормального распределения имеет вид 2 2 2 2 1 a x e x f , где
параметры a и неизвестны. В качестве значений параметров распределения возьмем их оценки, полученные на основе опытных данных. Оценкой параметра a является величина n n x n x n x n x n x k k k i i i ... 1 2 2 1 1 1 __ ,
(3) оценкой параметра 2 является величина
i n i i n x x n s 2 1 __ 2 1 1 .
(4) В обеих формулах i x - середина i -го интервала.
5 , 6 9 9 11 8 16 7 25 6 13 5 6 4 80 1 1 6 1 __
i i n x n x
25 ) 5 , 6 6 ( 13 ) 5 , 6 5 ( 6 ) 5 , 6 4 (( 79 1 1 1 2 2 2 6 1 2 __ 2 i i i n x x n s
4 , 1 97 , 1
97 , 1 ) 9 ) 5 , 6 8 ( 11 ) 5 , 6 7 ( 2 2
.
имеет функцию плотности вероятности
97 , 1 2 ) 5 , 6 ( 2 2 4 , 1 1 ) ( x e x f
(5) Ее график построим на том же чертеже, что и гистограмму (рис. 4). Для построения достаточно найти точки максимума 5 , 6 max
x , 28 , 0 97 , 1 4 , 0 4 , 0 max s y и точки перегиба 4 ,
5 , 6 s x x пер , 17 , 0 97 , 1 24 , 0 24 , 0
y пер . Затем эти точки следует соединить плавной линией, учитывая форму кривой нормального распределения. (рис. 4). 3. Зададимся уровнем значимости, например, 05 ,
. Для получения надежных выводов на основе критерия хи-квадрат нужно объединить первый интервал, содержащий мало наблюдений, со вторым интервалом. Тогда имеем всего 5
k интервалов. Определим
, 2 , 2 3 5 1
k r ( r – число степеней свободы, m – число неизвестных параметров). Итак, 99 , 5 2
; 05 , 0 2
4. Вычислим k i i i i в np np n 1 2 2 . Для этого сначала вычислим вероятности, попадания исследуемой случайной величины в каждый интервал, согласно 10
гипотезе. В случае нормального распределения они вычисляются по формуле:
s x x s x x x X x P p i i i i i 1 1
. Тогда
22 , 0 97 , 1 5 , 6 5 , 3 97 , 1 5 , 6 5 , 5 5 , 5 5 , 3
X P ,
26 , 0 97 , 1 5 , 6 5 , 5 97 , 1 5 , 6 5 , 6 5 , 6 5 , 5
X P , где x – функция Лапласа, значения которой приведены в прил. 2. Аналогично 16 , 0 5 , 7 5 , 6 x P , 16 , 0 5 , 8 5 , 7
P ,
06 , 0 5 , 9 5 , 8
x P . Вычисления 2 удобно вести, фиксируя промежуточные результаты в таблице. i n i p i np i i np n
2 i i np n
i i np np n 2 19
0,22 17,6
1,4 1,96
0,11 25
0,26 20,8
4,2 17,64
0,85 16
0,26 20,8
4,8 23,06
1,11 11
0,16 12,8
1,8 3,24
0,25 9 0,08 4,8 4,2
17,64 3,89
21 , 6 2 в . Величина 2 в равна сумме значений в последнем столбце таблицы. 5. Сравним 2
и
2 T : 99 , 5 21 , 6 2 2
в . Таким образом, при выбранном уровне значимости
2
принадлежит критической области k V , а значит гипотезу о нормальном распределении следует отвергнуть. Следует отметить, что вероятность того, что мы ошибаемся, меньше 0,05.
Пример 3. Результаты наблюдений случайной величины представлены в виде статистического ряда.
0 1 2 3 4 и более
n 54
27 14
5 0 100 1
n i n n
Решение. 1. Построим полигон относительных частот n n i - ломаную линию с вершинами в точках n n x i i , , рис. 5 (на рис. сплошная линия). 11
p n n i
,
x
Рис. 5
2. По виду полигона частот можно выдвинуть предположение, что изучаемая случайная величина имеет пуассоновский закон распределения, т. е.
k k X P k ! Так как в законе Пуассона параметр равен математическому ожиданию, а его оценкой является величина __
k n i i n n x x 1 __ ,
7 , 0 100 0 4 3 3 14 2 27 1 54 , 0 __
, и изучаемая случайная величина имеет закон распределения
! 7 , 0 7 , 0 k e p k X P k k ,
(6) где 3 , 2 , 1 , 0 k . 3. Зададимся уровнем значимости, например, 05 , 0 . Последние 2 разряда, содержащие мало наблюдений (нужно 5-10), можно объединить. Определим
r T , 2
2 1 1 4 1 m k r , итак
99 , 5 2 ;
05 , 0 2
(прил. 1). 4. Вычислим k i i i i в np np n 1 2 2 . Для этого сначала вычислим вероятности k p для каждого из четырех интервалов: 5
0 ! 0 7 , 0 5 , 0 0 0
p , 35 , 0 ! 1 7 , 0 7 , 0 1 1 e p , 12 , 0 ! 2 7 , 0 7 , 0 2 2 e p , 03 , 0 12 , 0 35 , 0 5 , 0 1 1 2 1 3 p p p .
Используя полученные вероятности, построим ломаную с вершинами в точках
i p x ,
. На рис. 5 эта ломаная показана пунктирной линией. Вычисление 2
оформляем в виде таблицы.
1 2 3 4 0,1 0,2
0,3 0,4
Полигон относительных частот 0,54
12
i n i p i np i i np n
2 i i np n
i i np np n 2 54
0,5 50 5 , 0 100
54-50=4 16 4 2
32 , 0 50 16 27
0,35 35
-8 64
1,83 14
0,12 12
2 4 0,33 5 0,03
3 2 4 1,33 Величина 2
равна сумме величин в последнем столбце таблицы, т. е. 2 в =3,18. 5. Сравним 2
и
2 T . 2 в =3,18< 2 T =5,99. Таким образом, 2 в в критическую область не входит. Делаем вывод: гипотеза опытным данным не противоречит.
Download 478.23 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling