Порядковые статистики – это члены вариационного ряда, который получается, если элементы выборки x1, x2,…, xn расположить в порядке неубывания:
х(1)<x(2)<…<x(k)<…<x(n) (здесь < - знак "меньше или равно").
Пример 1. Для выборки x1 = 1, x2 = 7, x3 = 4, x4 = 2, x5 = 8, x6 = 0, x7 =5, x8 = 7 вариационный ряд имеет вид 0, 1, 2, 4, 5, 7, 7, 8, т.е. х(1) = 0 = x6, х(2) = 1 = x1, х(3) = 2 = x4, х(4) = 4 = x3, х(5) = 5 = x7, х(6) = х(7) = 7 = x2 = x8, x(8 ) = 8 = x5.
В вариационном ряду элемент x(k) называется k-той порядковой статистикой.
Ранг - это номер элемента выборки в вариационном ряду. Обозначим ri ранг элемента выборки xi. Для данных примера 1 r1 = 2, r3 = 4, r4 = 3, r5 = 8, r6 = 1, r7 = 5. Ранги r2 и r8 рассчитываются несколько сложнее, поскольку в исходной выборке x2 = x8. Элементы x2 = x8 занимают 6 и 7 место в вариационном ряду, поэтому им ставят в соответствие ранги, равные среднему арифметическому занимаемых ими мест, т.е. (6+7)/2 = 6,5. Итак, r2 = r8 = 6,5. Ранги, соответствующие совпадающим элементам выборки, называют связанными.
Теперь о коэффициенте ранговой корреляции Спирмена. Пусть заданы k пар чисел (x1, y1), (x2, y2), (x3, y3), ..., (xk, yk). Пусть x1, x2,, ..., xk - совокупность первых элементов этих пар, а r1, r2, ..., rk - их ранги (т.е. ri - ранг xi среди x1, x2, ..., xk). Пусть y1, y2,, ..., yk - совокупность вторых элементов этих пар, а s1, s2, ..., sk - их ранги. Тогда коэффициент ранговой корреляции Спирмена - это обычный коэффициент линейной парной корреляции (Пирсона) для пар рангов (ri, si), i = 1, 2, ..., k. Т.е. коэффициент кореляции Пирсона рассчитывается не для исходных пар чисел (x1, y1), (x2, y2), (x3, y3), ..., (xk, yk), а для пар их рангов (ri, si), i = 1, 2, ..., k. Если иксы и игреки одинаково упорядочены. то коэффициент раноговой корреляции Спирмена равен 1.
|