Главная > Обработка сигналов, моделирование > Проверка статистических гипотез
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ГЛАВА 3. РАВНОМЕРНО НАИБОЛЕЕ МОЩНЫЕ КРИТЕРИИ

1. Постановка проблемы

Мы начинаем теперь изучение статистических проблем, теория которых была разработана в наибольшей степени, а именно проблем проверки гипотез. Как видно из самого названия, при этом хотят выяснить, верна или неверна какая-либо данная гипотеза. Выбор здесь производится только между двумя решениями: принятием или отклонением гипотезы. Решающая процедура в таких проблемах называется критерием гипотезы, о которой идет речь.

Решение должно быть основано на значениях некоторой случайной величины о которой известно, что ее распределение принадлежит данному классу Мы предположим, что если бы было известно, то можно было бы сказать — верна гипотеза или нет. Соответственно, распределения класса могут быть разделены на две группы: для одной из групп гипотеза верна, а для другой — нет. Эти группы будут обозначаться буквами а соответствующие им подмножества буквами и так что Математически гипотеза эквивалентна утверждению, что принадлежит . Поэтому удобно отождествить гипотезу и это утверждение и обозначать ее также буквой . Аналогично мы называем распределения из К альтернативными к , так что К есть класс альтернатив.

Обозначим решения, состоящие в принятии или отклонении , буквами соответственно. Нерандомизированная процедура проверки гипотезы приписывает каждому возможному значению х случайной величины X одно из двух решений. Тем самым выборочное пространство делится на два взаимно дополнительных множества Если X попадает в гипотеза принимается, в других случаях она отвергается. Множество называется областью принятия гипотезы, а множество областью отклонения или критической областью,

В процессе проверки можно или прийти к правильному решению, или совершить одну из двух ошибок: отвергнуть гипотезу, когда она верна (ошибка первого рода), или принять гипотезу, когда она неверна (ошибка второго рода). Последствия этих ошибок часто оказываются совершенно различными. Например, если проверяется наличие некоторого заболевания, то неправильное заключение о необходимости лечения может создать пациенту неудобства. С другой стороны, неудача в попытке обнаружить имеющееся заболевание может привести к смерти пациента.

Желательно провести проверку таким образом, чтобы свести к минимуму вероятности обоих типов ошибок. К сожалению, когда число испытаний задано, мы не можем управлять обеими вероятностями ошибок одновременно. Обычно задают границу для вероятности отклонения , когда она верна, и при этом условии стремятся минимизировать вероятность другой ошибки. Иными словами, выбирают число а между 0 и 1 (называемое уровнем значимости) и налагают условие

При этом условии желательно сделать минимальной для или, что то же самое, сделать максимальной

Хотя обычно из (1) вытекает, что

удобно для левой части (3) ввести специальное название: ее называют размером критерия или критической области.

Принимая условие (1), мы ограничиваемся, следовательно, критериями, размер которых не превосходит заданного уровня значимости. Вероятность (2), рассматриваемая как функция называется мощностью критерия при альтернативе 0. Рассматриваемая как функция вероятность (2) называется функцией мощности критерия и обозначается

Обычно выбор уровня значимости а до некоторой степени произволен, поскольку в большинстве ситуаций нет точной границы для «разрешенной» вероятности ошибки первого рода. Стало обычным выбирать для а одно из стандартных значений, таких как 0,005, 0,01, 0,05. Эта стандартизация имеет некоторые преимущества, так как она позволяет сократить объем таблиц, используемых при проведении различных испытаний. Никакой другой специальной причины для выбора именно этих значений нет. Действительно, выбирая уровень значимости, необходимо

также обращать внимание на мощность критерия при альтернативных гипотезах. Если мощность оказывается слишком малой, то может оказаться желательным использование значений а, превосходящих обычные, например 0,1 или 0,2.

Другое обстоятельство, которое часто влияет на выбор уровня значимости — это наше отношение к гипотезе до проведения эксперимента. Если мы твердо верим в истинность гипотезы, то потребуются убедительные свидетельства против нее для того, чтобы мы отказались от своей уверенности; соответственно уровень значимости будет выбран весьма низким (низкий уровень значимости приводит к тому, что гипотеза отвергается при таких комбинациях результатов наблюдений, полная вероятность которых при нашей гипотезе мала, так что появление этих результатов крайне неправдоподобно при справедливости ).

В приложениях мы обычно сталкиваемся с семействами вложенных друг в друга критических областей. В этих случаях полезно определять не только то, что гипотеза принимается или отвергается с данным уровнем значимости, но и указывать для каждого х наименьший уровень значимости критический уровень, при котором гипотеза отвергается для данного результата наблюдения. Это число дает представление о том, сколь сильно данные наблюдений противоречат гипотезе (или ее подкрепляют), и делают возможным для других прийти к заключению, соответствующему выбранному ими уровню значимости (см. задачу 7 и в главе 4 задачу 2).

Рассмотрим теперь структуру рандомизированного критерия. При любом х такой критерий приводит к выбору между двумя решениями — принятием или отклонением гипотезы, и этот выбор осуществляется с зависящими от х вероятностями, которые будут обозначаться соответственно. Если X принимает значение х, то производится случайный эксперимент с двумя возможными исходами: вероятности которых равны Если эксперимент заканчивается исходом то гипотеза отвергается, а в противном случае принимается. Рандомизированный критерий, таким образом, полностью характеризуется функцией критической функцией, при всех х. Если принимает только значения 0 и 1, то мы возвращаемся к случаю нерандомизированного критерия. Множество точек, в которых совпадает в этом случае с критической областью, так что для нерандомизированного критерия является индикатором (характеристической функцией) критической области.

Если X распределена по закону и используется критическая функция то вероятность отвергнуть гипотезу равна

т. е. равна условной вероятности отклонения гипотезы при данном х, проинтегрированной по распределению Задача состоит в выборе такого чтобы сделать мощность

максимальной при условии

Но здесь возникает та же самая трудность, с которой мы уже встречались в общих рассуждениях главы 1. Как правило, критерий, максимизирующий мощность при какой-либо определенной альтернативе класса зависит от этой альтернативы. Поэтому необходимы дополнительные соображения о том, что следует понимать под оптимальной процедурой. Имеется одно важное исключение: если класс К содержит ровно одно распределение, т. е. мы имеем дело с одной альтернативной гипотезой, то проблема целиком определяется соотношениями (4) и (5), и с математической точки зрения сводится к максимизации некоторого интеграла при некоторых определенных ограничениях. Теория для этого случая и ее статистические приложения составляют основное содержание настоящей главы. В некоторых случаях может, конечно, оказаться, что один и тот же критерий максимизирует мощность для всех альтернатив из К (даже если их много). Примеры таких равномерно наиболее мощных критериев будут указаны в разделах 3 и 7.

В данной выше формулировке задачу можно рассматривать, как специальный случай общей проблемы решения с двумя типами потерь. Соответственно двум типам ошибок мы вводим две компоненты функции потерь

и

При таком определении проблема проверки гипотезы, как она сформулирована выше, равносильна минимизации при ограничении

Формально введенные функции потерь вообще говоря, не будут совпадать с истинными потерями. Потеря,

возникающая при ошибочном принятии гипотезы, может не быть одной и той же для всех альтернатив: чем больше отличается альтернатива от основной гипотезы, тем более серьезны последствия такой ошибки. Как было указано ранее, мы намеренно уклонились от большей детализации, требуемой этой критикой. Предпочтительнее основывать теорию на простых и интуитивно привлекательных понятиях ошибок первого и второго рода. Впоследствии мы увидим, что по крайней мере некоторые из результатов остаются верными и в более сложной обстановке.

<< Предыдущий параграф Следующий параграф >>
Оглавление