Главная > Обработка сигналов, моделирование > Оптимальные статистические решения
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ЧАСТЬ IV. ПОСЛЕДОВАТЕЛЬНЫЕ РЕШЕНИЯ

Глава 12. ПОСЛЕДОВАТЕЛЬНЫЙ ВЫБОР

§ 12.1. Эффект последовательного выбора

В этой главе мы рассмотрим статистические задачи решения, в которых статистик производит поочередно наблюдения над некоторым распределением, зависящим от неизвестного параметра После каждого наблюдения он может оценить информацию о полученную на основе наблюдений которые были проведены к настоящему моменту времени, и решить, окончить процесс выбора или произвести следующее наблюдение Получаемая таким образом выборка называется последовательной выборкой.

Рассмотрим задачу статистического решения, в которой каждое наблюдение стоит некоторую фиксированную сумму, и предположим, что статистик может проводить наблюдения последовательно, делая после каждого наблюдения вывод о том, следует ли ему принять решение без дальнейшего выбора или же отложить принятие решения и провести очередное наблюдение. Как правило, найдутся процедура выбора и решающая функция с общим риском, меньшим, чем риск всякой процедуры, при которой статистик должен задать некоторый фиксированный объем выборки заранее, до проведения наблюдений. В некоторых задачах, однако, цену наблюдения в случае, когда наблюдения производятся поочередно, назначают более высокую, чем в случае, когда все наблюдения производятся одновременно. В других задачах (нетривиальные примеры которых будут даны в дальнейшем) статистик не получает выигрыша от последовательного выбора, даже если цена наблюдения одна и та же в обоих случаях.

В качестве примера, когда последовательный выбор дает выигрыш, рассмотрим задачу, в которой статистик должен решить, приобретать ему или нет некоторую партию изделий. Предположим, что он может распознавать дефектные изделия и что за осмотр каждого изделия надо платить некоторую сумму. Допустим, далее, что, зная эту сумму, свою функцию потерь и априорное распределение, статистик решает извлечь из партии

случайную выборку объемом в 50 изделий и приобретать всю партию в том и только в том случае, когда число дефектных изделий в этой выборке окажется не большим 8. Однако если наблюдения в выборке производятся и оплачиваются последовательно (т. е. по одному), то статистик может найти процедуру, дающую тот же результат, что и предыдущая, но с меньшими затратами. Более точно, пусть наблюдения проводятся по одному и процесс выбора прекращается, как только либо число наблюденных дефектных изделий достигло 8, либо число наблюденных годных изделий стало равным 42. Весьма вероятно, что какое-нибудь из этих событий произойдет прежде, чем будут проверены все 50 изделий. В первом случае статистик решает не покупать партию, во втором — покупать. Его решение всегда будет согласовываться с решением, основанным на всех 50 наблюдениях.

Для дальнейшей иллюстрации преимуществ последовательного выбора мы довольно подробно рассмотрим следующую задачу статистического решения. Пусть множества состоят каждое из двух точек. Предположим, что функция потерь имеет вид

Допустим, далее, что каждое из наблюдений представляет собой дискретную случайную величину с задаваемой следующим образом:

Здесь а — заданное число, Другими словами, X принимает лишь значения 1, 2 и 3. Вероятность того, что положительна, только когда вероятность того, что положительна лишь при и вероятность события одинакова при обоих значениях

Предположим, наконец, что цена наблюдения равна с и априорное распределение таково:

В силу симметрии задачи можно считать, что

Вычислим сначала риск, отвечающий процедуре с фиксированным числом наблюдений Из (1) видно, что после наблюдения X апостериорная вероятность события равна 1, если равна 0, если и равна (т. е. априорной вероятности) при Таким образом, специфика задачи состоит в следующем. После каждого наблюдения либо значение становится известным в точности, либо распределение остается

таким же, каким оно было до наблюдения. Из вида функции потерь в этой задаче следует, что при средний ущерб для байесовского решения равен Если же или то риск для байесовского решения равен 0. Таким образом, для байесовского решения, построенного по наблюдениям средний ущерб равен если для всех наблюдений и равен 0, если значение хотя бы одного наблюдения отлично от 3.

Независимо от того, или вероятность того, что для всех равна Отсюда видно, что общий риск (включающий в себя стоимость выборки) оптимальной процедуры, основанной на наблюдениях, равен

Предположим, что так что хотя бы одно наблюдение проводить имеет смысл. Оптимальное значение величины можно приближенно вычислить, если рассматривать в (2) как непрерывную переменную и для определения точки минимума продифференцировать функцию Тогда получим

В дальнейшем мы будем считать, что натуральное доставляющее минимум функции задаваемой равенством (2).

Если статистик имеет возможность проводить наблюдений последовательно, то он может уменьшить общий риск за счет прекращения наблюдений в момент, когда значение наблюдения впервые стало отличным от 3. Другими словами, ему придется проводить все наблюдений только тогда, когда при . При такой последовательной процедуре апостериорное распределение в случае окончания выбора то же самое, что и для процедуры с фиксированным объемом выборки; поэтому совпадают и средние ущербы. Однако число наблюдений есть теперь случайная величина. Из (1) следует, что распределение не зависит от того, или Поэтому

Значение можно найти следующим образом:

Общий риск для последовательной процедуры удовлетворяет соотношению

Из (6) и приближенного выражения (3) для получаем теперь

Сделанное выше допущение о том, что равносильно условию положительности выражения в квадратных скобках в правой части (8).

Мы можем, наконец, рассмотреть процедуру последовательного выбора, при которой статистик, не ограничивая сверху числа наблюдений, проводит их до того момента, пока не появится наблюдение со значением, отличным от 3. При такой процедуре в момент окончания выбора статистик может принять решение, средний ущерб которого равен 0. Следовательно, общий риск такой процедуры будет равен где случайное число произведенных наблюдений.

Для нашей процедуры

и, значит,

Сравнение выражений (10), и (8) показывает, что общий риск для этой последовательной процедуры меньше, чем для всех других, рассмотренных выше. Следует отметить, однако, что эта процедура может потребовать числа наблюдений, большего (и много большего) Поэтому ее приемлемость существенным образом зависит от предположения о постоянстве цены наблюдения. При этом предположении можно показать, что эта процедура оптимальна в классе всех возможных процедур решения и выбора, т. е. что общий риск для этой процедуры меньше, чем для всех остальных.

Мы предположили, что стоит сделать хотя бы одно наблюдение Если то значение уже определено и, согласно оптимальной процедуре, следует прекратить выбор и принять надлежащее решение из Если же то апостериорное распределение совпадает с априорным. Поэтому в отношении решения о целесообразности проведения дальнейших наблюдений положение статистика то же самое, что и перед началом выбора. Таким образом, Основа имеет исходное распределение и статистик

по-прежнему может совершать неограниченное число наблюдений, стоимостью с каждое. Статистик уже истратил сумму с на первое наблюдение, и эту сумму никак нельзя компенсировать, независимо от того, продолжать наблюдения или прекратить их. Следовательно, этот факт не влияет на текущее решение и статистик должен сравнить риск от немедленного принятия какого-либо решения из без дальнейшего выбора, с общим риском, отвечающим продолжению наблюдений. Опять-таки уже использовавшееся предположение о том, что стоит сделать хотя бы одно наблюдение, показывает, что выбор следует продолжать. Повторение этих рассуждений приводит к выводу о том, что оптимальная процедура предписывает статистику продолжать выбор, пока значение каждого наблюдения равно 3, и остановиться в первый момент, когда будет получено значение, отличное от 3.

Поскольку число наблюдений при такой процедуре может быть весьма велико, статистик может истратить большую сумму на наблюдения, в то время как максимум того, что он может потерять вследствие принятия неправильного решения, есть сравнительно небольшая сумма Конечно, вероятность того, что ему потребуется много наблюдений, мала. Тем не менее в случае неудачи, когда каждое из многих наблюдений подряд дает значение 3, оптимальная стратегия советует забыть об уже истраченных на наблюдения деньгах и продолжать выбор в надежде, что судьба изменится.

Предположение о постоянстве цены наблюдения с тесно связано с представлением о том, что средства статистика настолько велики, что он может уплатить за наблюдения сколь угодно большую сумму. В практических ситуациях, однако, средства статистика ограничены. В случае необходимости он может учесть это обстоятельство, считая, что стоимость наблюдений меняется. Если статистик может уплатить за наблюдения общую сумму, не большую, чем естественным представляется предположение о том, что цена каждого из первых наблюдений равна с, а цена каждого последующего наблюдения бесконечна.

Дальнейшие замечания и ссылки на литературу. Исследование статистических задач с последовательным выбором было начато Вальдом (1947). В дальнейшем он включил случай последовательного выбора в свою общую теорию статистических решений [Вальд (1950)]. Подробный анализ задач такого рода дан Блекуэллом и Гиршиком (1954). Широкий класс задач последовательного решения, называемых задачами динамического программирования, был указан и изучен Беллманом (1957а). Обширную библиографию по применению последовательных методов в статистике составил Джексон (1960). Некоторые специальные вопросы, связанные с этой тематикой, рассмотрены в монографии Уэзерилла (1966).

<< Предыдущий параграф Следующий параграф >>
Оглавление