Главная > Обработка сигналов, моделирование > Проверка статистических гипотез
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7. Ранговые критерии

Одной из основных задач статистики является задача проверки по двум выборкам гипотезы о равенстве их распределений. Типичным примером служит задача сравнения некоторого способа обработки со стандартным (контрольным), где проверяется гипотеза об отсутствии преимуществ этого способа при альтернативе его более благотворного действия. Этот пример рассматривался в главах 4 и 5 в предположениях нормальности; соответствующий критерий основывался на -статистике Стьюдента. Было также показано, что в тех случаях, когда предположение о приближенной нормальности допустимо, но не может быть проверено, приходят к замене -критерия его аналогом (основанным на перестановках), который, в свою очередь, может быть аппроксимирован первоначальным -критерием.

Ниже мы будем рассматривать эту проблему, отказавшись по крайней мере на время от всяких предположений относительно даже приближенной формы рассматриваемых распределений, предполагая только, что они непрерывны. Результаты наблюдений в таком случае образуют две выборки из распределений с непрерывными функциями распределения Задача состоит в том, чтобы проверить гипотезу

Если предположить, что эффект обработки аддитивен, то альтернативы имеют вид Мы рассмотрим здесь более общий случай, в котором эффект обработки может зависеть

и от значения у (так что А есть неотрицательная функция от Тогда гипотеза будет проверяться при односторонней альтернативе, что величины У стохастически больше величин X, т. е. при альтернативе

Альтернативный эксперимент, который проводится для выяснения эффективности обработки, состоит в сравнении пар предметов, группирующихся по парам так, чтобы исключить расхождения, не являющиеся следствием обработки. Один член каждой пары выбирается случайным образом для обработки, тогда как другой служит для контроля. Если предположения (см. раздел 4 главы 5) о нормальности распределений отбрасываются и пары предметов рассматриваются как один элемент выборки, то предполагается, что распределения независимых наблюдений описываются двумерной непрерывной функцией распределения Гипотеза отсутствия эффекта обработки эквивалентна тогда предположению, что функция распределения симметрична относительно линии

Другая основная проблема, которая возникает во многих случаях, касается зависимости или независимости двух случайных величин. В частности, если —выборка из двумерного распределения то может представить интерес проверка гипотезы

т. е. гипотезы, что независимы; для случая нормального распределения эта задача рассматривалась в разделе 9 главы 5. В качестве интересной альтернативы можно рассмотреть, к примеру, гипотезу о том, что положительно зависимы (см. раздел 11 главы 5). Альтернативная формулировка возникает, когда значения х не являются случайными, а выбираются заранее, до эксперимента. Пусть выбраны значения и пусть обозначает распределение при заданном предполагается, что независимы и их функции распределения непрерывны. Гипотеза независимости У от х тогда заключается в том, что

в то вемя как альтернативная гипотеза положительной зависимости состоит в стохастическом их возрастании с ростом

В этих и других подобных задачах инвариантность редуцирует исходные данные так, что истинные значения наблюдений становятся несущественными и сохраняются только некоторые отношения порядка между различными группами переменных.

Тем не менее оказывается возможным таким образом проверить исследуемые гипотезы, а получаемые этим способом критерии часто имеют мощность, близкую к мощности стандартных нормальных критериев. Мы сейчас проведем эту редукцию для четырех рассмотренных выше проблем.

В случае двух выборок задача проверки гипотезы при альтернативе остается инвариантной относительно группы всех преобразований

таких, что функции непрерывны и строго возрастают. Это утверждение следует из того факта, что указанные преобразования сохраняют непрерывность распределений и свойства величин оставаться одинаково распределенными или одной быть стохастически больше другой. Как видно из примера 3 (в других обозначениях), максимальным инвариантом относительно группы является множество рангов

величин рассматриваемых как элементы одной выборки. Поскольку распределение симметрично относительно первых и последних переменных для всех распределений то множеством достаточных статистик для является множество рангов величин без учета индексов Эти статистики можно представить в виде упорядоченных рангов величин X и У:

А поскольку каждое из этих множеств определяется другим, то достаточно рассматривать только одну из этих статистик. Тем самым каждый инвариантный критерий является ранговым критерием, т. е. зависит только от рангов наблюдений, например, от

Чтобы получить подобную же редукцию для гипотезы сделаем сначала преобразование Пары величин снова образуют выборку из непрерывного двумерного распределения. Тогда проверяемая гипотеза состоит в том, что это распределение симметрично относительно оси в то время как при альтернативе это распределение сдвинуто в положительном направлении оси Задача проверки этих гипотез не изменится, если все подвергнуть одному и тому же взаимно однозначному преобразованию где имеет самое большее конечное число точек разрыва. Максимальным инвариантом относительно этой группы [см. задачу 2 (II)] будет функция

Случайные величины имеют непрерывную одномерную функцию распределения и гипотеза ее симметрии относительно начала координат

проверяется при альтернативе, что распределение сдвинуто в положительном направлении оси Эта задача инвариантна относительно группы всех преобразований

таких, что непрерывна, нечетна и строго возрастает. Пусть , где Обозначим ранги величин среди абсолютных значений ранги величин преобразование сохраняет знак каждого наблюдения и, следовательно, в частности, числа тип. Поскольку непрерывная, строго возрастающая функция от она оставляет инвариантным порядок абсолютных величин и, тем самым, ранги Покажем, что эти функции являются максимальными инвариантами. Пусть два множества точек с и теми же самыми Существует непрерывная, строго возрастающая функция, определенная на положительной оси, такая, что Если определить для отрицательных посредством соотношения то такая функция будет принадлежать и тогда для всех что и надо было показать. Как и в предыдущей задаче, достаточность позволяет совершить дальнейшую редукцию данных к упорядоченным рангам Эта редукция сохраняет информацию о рангах абсолютных значений независимо от того, являются ли результаты наблюдений положительными или отрицательными но она не сохраняет информации о том, с каким значением, положительным или отрицательным, связываются ранги.

Ситуация очень похожа и в случае гипотез Задача проверки независимости в двумерном распределении при альтернативной гипотезе о положительной зависимости не изменяется, если подвергнуть преобразованиям таким, что непрерывны и строго возрастают. Относительно этого преобразования максимальными инвариантами являются ранги величин среди X и ранги величин среди У. Совместное распределение величин симметрично относительно этих пар, каковы бы ни были распределения Отсюда следует, что достаточной статистикой является где

перестановка величин и где, следовательно, есть ранг величины У, связанной с наименьшим значением

Гипотеза о том, что одинаково распределены, проверяется при альтернативе состоящей в том, что стохастически возрастают с ростом Эта проблема инвариантна относительно группы преобразований где функция непрерывна и строго убывает. Максимальным инвариантом здесь является множество рангов величин

Некоторые инвариантные критерии для проверки гипотез будут рассмотрены в следующих двух разделах. Соответствующие результаты, относящиеся к гипотезам даны в задачах 39—41.

<< Предыдущий параграф Следующий параграф >>
Оглавление