Главная > Обработка сигналов, моделирование > Проверка статистических гипотез
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3. Критерии однородности

Полученный в предыдущем разделе РНМ инвариантный критерий для проверки равенства средних значений двух нормальных распределений с общей дисперсией оказывается также РНМ несмещенным (см. раздел 3 главы 5). Однако если число сравниваемых совокупностей больше 2, то РНМ несмещенный критерий не существует и принцип инвариантности приводит к новому результату. Пусть независимы и распределены по законам соответственно. Рассмотрим гипотезу

Она возникает, например, при сравнении нескольких способов обработки, процессов, условий, размещений и т. п. с целью выяснить, влияют ли различия между ними на интересующий нас исход Более общим образом, она возникает каждый раз в любой ситуации, связанной с одинарной классификацией исходов, т. е. такой, где разбиение на классы производится по значениям одного признака.

Гипотеза Н является линейной определяемым соотношениями при

с представляемым прямой, на которой координат равны между собой. Мы имеем

где следовательно, Итак,

так что Используя формулу (15) статистики мы получаем критерий

Параметр нецентральности равен

с

Суммы квадратов как в числителе, так и в знаменателе (18) допускают три близкие между собой интерпретации:

I) как две компоненты разложения полной суммы квадратов отклонений от общего среднего («полной изменчивости»)

на а) сумму квадратов отклонений каждой величины от соответствующего группового среднего значения («изменчивость внутри групп») и б) сумму квадратов отклонений групповых средних от общего среднего («изменчивость между группами»);

(II) как основу сравнения двух источников изменчивости (по критерию

(III) как оценки для их математических ожиданий (см. задачу 9). Это разбиение полной изменчивости вместе с указанными интерпретациями компонент дает пример дисперсионного анализа, который к более сложным проблемам будет применен в последующих разделах.

Мы оставим теперь на время схему линейных гипотез и обратимся к гипотезе равенства дисперсий в случае, когда величины распределены по законам несмещенный критерий для этой гипотезы был найден в разделе 3 главы 5 в предположении но он не существует при (см., например, задачу 6 главы 4). К сожалению,

в этой задаче нет и группы, для которой существовал бы РНМ инвариантный критерий. Тем не менее, чтобы получить критерий, мы используем асимптотический метод, который при достаточно больших сводит задачу, по сути дела, к проверке равенства средних.

Удобно сначала редуцировать совокупность результатов наблюдений, заменив ее достаточными статистиками

остается инвариантной относительно преобразований которые в пространстве достаточных статистик индуцируют преобразования Максимальным инвариантом относительно этой группы служит совокупность величин Каждая статистика является суммой квадратов независимых нормально распределенных величин с нулевыми средними и дисперсиями Из центральной предельной теоремы вытекает, что при больших величина

распределена приблизительно по закону . Такая аппроксимация для наших целей неудобна, так как неизвестные параметры входят не только в среднее значение, но и в дисперсию предельного распределения.

Эту трудность можно преодолеть с помощью подходящего преобразования, стабилизирующего дисперсию. Подобные преобразования могут быть получены из следующих соображений. Пусть последовательность действительных статистик, такая, что имеет предельное распределение Тогда для любой непрерывно дифференцируемой функции предельное распределение нормально со средним нуль и дисперсией Следовательно, в предположении, что производная от пропорциональна эта дисперсия не зависит от .

Применим сказанное к рассматриваемому случаю, полагая В качестве преобразования берем Здесь производная пропорциональна . Тогда предельное распределение для

будет нормальным со средним нуль и дисперсией 2, так что при больших случайные величины распределены приблизительно по законам

Теперь проблема сводится к проверке равенства средних значений 5 независимых случайных величин имеющих распределение где известны. В частном случае, когда все равны друг другу, дисперсии равны между собой и асимптотическая проблема становится простым вариантом (простым в том смысле, что дисперсии известны) задачи, рассмотренной в начале раздела. Гипотеза инвариантна относительно добавления одной и той же константы к каждой из величин и относительно ортогональных преобразований гиперплоскостей, перпендикулярных прямой линии инвариантной критической областью будет

где общее значение дисперсий и С определяется из уравнения

В более общем случае неравных проблема сводится к линейной гипотезе с известной дисперсией посредством преобразования и РНМ инвариантный относительно подходящей группы линейных преобразований критерий отвергает гипотезу, когда

(см. задачу 10), где С опять определяется равенством (20). Эта критическая область инвариантная при проверке гипотезы относительно предельного распределения, может рассматриваться как обладающая этим свойством асимптотически при проверке первоначальной гипотезы

Этот же метод может быть применен для проверки однородности нескольких биномиальных или пуассоновских распределений. Подробности указаны в задаче 11.

В применениях принципа инвариантности важно быть уверенным в том, что предполагаемая симметрия действительно имеет место. Например, при проверке равенства средних значений нормальных совокупностей все параметрические точки с одним и тем же значением отождествляются вследствие принципа инвариантности. Это уместно только в предположении, что такие альтернативы можно рассматривать как одинаково удаленные от проверяемой гипотезы. В частности, должно быть несущественным, как получилось данное значение за счет нескольких небольших слагаемых или за счет одного большого. Ситуации, где напротив, существенно обнаружить большие индивидуальные отклонения, не обладают требуемой симметрией, и критерий, основанный на (18), не обязан более быть оптимальным.

В подобных ситуациях обычно привлекают процедуры более общие, чем проверка отдельной гипотезы. Сравнивая несколько совокупностей или способов обработки, мы, как правило, желали бы не только определить, одинаковы ли они, но, в случае отклонения гипотезы — также упорядочить их или как-то сгруппировать, или, по крайней мере, выделить из них лучшие. Предположим для простоты, что объемы выборок равны при Естественная процедура, приводящая к группировке значений состоит в объявлении различными при где Гипотеза равенства всех средних принимается в этом случае, если

Если отвергается, то считают, что для всех пар для которых Уровень значимости здесь равен вероятности объявления какой-либо из разностей № значимой, в то время как в действительности все величины равны друг другу. Левая часть (22) называется стьюдентовым размахом выборочных средних.

Аналогичный подход возможен при сравнении нескольких дисперсий. Предположим снова, что объемы выборок равны и

что классификация осуществляется по принципу: если если если ни одно из этих неравенств не выполняется. Полная гипотеза принимается в этом случае, когда

Критерии, основанные на стьюдентовом размахе и на максимуме -отношений, не обладают, как кажется, никакими оптимальными свойствами, если их рассматривать как критерии для гипотез соответственно. Однако они обладают свойствами оптимальности, если их рассматривать как решение проблемы об упорядочении средних или дисперсий (при допущении «ничьих»).

<< Предыдущий параграф Следующий параграф >>
Оглавление