Главная > Обработка сигналов, моделирование > Проверка статистических гипотез
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3. Рандомизация. Выбор эксперимента

Данное выше описание решающего правила в некоторых отношениях остается слишком узким. Мы предполагали, что каждому возможному значению случайных величин соответствует ровно одно решение. Вместо этого удобно допустить выбор одного из нескольких решений в соответствии с заданными вероятностями или, более общим образом, в соответствии с некоторым распределением вероятностей на пространстве решений. Это распределение зависит, конечно, от наблюденного значения х. Один из способов описания такой рандомизированной процедуры состоит в том, что задаются нерандомизированная процедура, зависящая от X, и случайная величина У, значения которой

лежат в пространстве решений и условное распределение которой при данном х не зависит от 0.

Хотя интуитивно может показаться, что такая дополнительная рандомизация не имеет значения, это допущение большей свободы выбора не может нанести вреда. Если интуитивные сомнения будут правильны, то окажется, что оптимальные процедуры всегда имеют нерандомизированный характер. В действительности введение рандомизированных процедур создает важное математическое упрощение: расширение класса функций риска делает его выпуклым. К тому же, существуют проблемы, в которых некоторые характеристики функции риска (например, ее максимум) могут быть лучше использованы, если допустить и рандомизированные процедуры.

Другое предположение, которое молчаливо до сих пор принималось, состоит в том, что был выбран определенный план эксперимента. Поэтому известно, какие именно наблюдения будут произведены. Однако статистические рассмотрения, связанные с планированием эксперимента, нисколько не менее важны, чем касающиеся анализа этого эксперимента. В частности, еще до того, как предпринято исследование, необходимо решить, сколько наблюдений должно быть произведено, учитывая, что потери от неправильных решений не должны быть чрезмерными. Часто оказывается, что требуемый объем выборки зависит от неизвестного распределения и, следовательно, не может быть фиксирован заранее. Вместо этого объем определяется в зависимости от наблюдений, и решение о продолжении эксперимента принимается последовательно на каждом его шаге на основе имеющихся к этому моменту результатов наблюдений.

Пример 5. Допустим, что по выборке из нормального распределения желают оценить среднее значение Здесь функция риска для оценки (например, математическое ожидание квадрата ее отклонения от 5) зависит от о. При больших о выборка содержит мало информации в том смысле, что два распределения и с фиксированной разностью становятся неразличимыми при вследствие этого риск стремится к бесконечности. Наоборот, риск стремится к нулю при так как в этом случае среднее почти точно известно. Таким образом, число наблюдений, необходимое для поддержания риска на заданном уровне, неизвестно. Однако после того как произведено некоторое количество наблюдений, возможно оценить следовательно, определить число требуемых дополнительно наблюдений.

Пример 6. Пусть относительно последовательности испытаний с постоянной вероятностью успеха желают выяснить, какое из двух неравенств или верно. Как правило, мы будем быстро приходить к решению, если близко к 0 или 1, когда практически все наблюдения приводят к одному и тому же результату. В то же время для промежуточных значении потребуется выборка большего объема. Это различие может частично уравновешиваться тем обстоятельством, что для промежуточных значений потери, возникающие из-за неправильного решения, предположительно менее серьезны, чем для значений, близких к краям.

Пример 7. Возможность последовательного определения объема выборки важна не только потому, что распределения имеют большую или меньшую информационную ценность, но и потому, что это же самое верно для результатов наблюдений. Рассмотрим, например, выборку из равномерного на интервале распределения, и пусть задача состоит в оценке 0. Здесь нет различия в количестве информации, доставляемой различными распределениями Однако по выборке можно почти точно определить 0, если достаточно близок к единице; если же близок к нулю, то вся выборка дает информацию нисколько не большую, чем одно наблюдение. Снова необходимый объем выборки должен определяться последовательно.

Определение надлежащего размера выборки представляет собою, за исключением простейших ситуаций, лишь одну из сторон задачи планирования эксперимента. Вообще говоря, мы должны решить не только вопрос о числе наблюдений, но и то, какого они должны быть типа. Формально все эти вопросы можно включить в общую проблему решения, как она описана в начале этого раздела. С этой целью X интерпретируется как множество всех наблюдаемых случайных величин; вводятся понятия решения о продолжении и решения об остановке эксперимента на различных этапах; определяется (в случае продолжения), какого типа величину следует наблюдать на следующем шаге; наконец, стоимость наблюдений включается в функцию потерь. Однако, несмотря на эту формальную возможность, отыскание оптимального плана эксперимента в конкретных ситуациях представляет собою обычно задачу более трудную, чем отыскание оптимального решающего правила для данного эксперимента. Эта задача решена лишь в небольшом числе случаев. Здесь в первую очередь мы будем заниматься проблемой в том виде, в котором она предстает перед нами после того, как эксперимент выбран, и только в нескольких случаях мы постараемся сравнить различные планы эксперимента.

<< Предыдущий параграф Следующий параграф >>
Оглавление