Главная > Обработка сигналов, моделирование > Оптимальные статистические решения
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 13.6. Выбор с отбрасыванием из нормального распределения с неизвестным средним

Пусть из нормального распределения с неизвестным средним и заданной мерой точности извлекается последовательная повторная выборка без ограничения общности можно считать, что мера точности равна 1. Как обычно, предположим, что априорное распределение параметра нормальное. Тогда апостериорное распределение на каждом шаге выбора также нормальное. Статистик должен найти правило остановки, максимизирующее средний выигрыш

В этом параграфе мы допустим, что оптимальное правило остановки существует и средний выигрыш при оптимальном правиле остановки конечен. Это предположение будет обосновано

в § 13.9, где мы покажем, что оно верно для последовательных повторных выборок из распределений, зависящих от неизвестного параметра, если дисперсия общего маргинального распределения каждого наблюдения конечна. Ясно, что в рассматриваемой здесь задаче выбора из нормального распределения это последнее условие выполнено. Если дисперсия априорного распределения равна то дисперсией маргинального распределения каждого наблюдения будет

В этом и следующем параграфах мы будем писать для обозначения того факта, что случайная величина нормально распределена со средним и мерой точности

На каждом шаге процесса выбора информация статистика характеризуется тройкой где значение последнего наблюдения, ацит - среднее и мера точности текущего апостериорного распределения параметра Таким образом, если процесс выбора заканчивается, представляет собой выигрыш статистика без учета стоимости проведенных наблюдений. Как мы уже замечали, сумма, истраченная на наблюдения, не влияет на решение статистика о том, продолжать или нет процесс выбора. Из теоремы 1 § 9.5 следует, что если и проводится очередное наблюдение, значение которого есть х, то апостериорное распределение нормальное: где

Следовательно, после очередного наблюдения, тройка переходит в тройку Далее, из упр. 23 к гл. 11 видно, что если то для маргинального распределения очередного наблюдения X имеем

Обозначим через средний выигрыш без учета стоимости проведенных наблюдений при оптимальном продолжении из состояния На этом шаге статистик может либо прекратить выбор и получить выигрыш либо, заплатив цену с, сделать очередное наблюдение и затем продолжать все оптимальным образом. Из предыдущих рассуждений и принципа оптимальности ясно, что если то V удовлетворяет следующему функциональному уравнению:

Далее, для каждой тройки и всякой постоянной к выполнено такое условие инвариантности функции V:

Это соотношение вытекает из того факта, что уменьшение на величину равносильно переходу к новым случайным величинам , другими словами, равносильно

уменьшению каждого последующего наблюдения на k. Действительно, если мы вычтем к из выигрыша отвечающего окончанию выбора, то, очевидно, выигрыш всякой процедуры, начинающейся из точки уменьшится таким же образом, откуда и следует справедливость соотношения (3).

Из (3) видно, что на каждом шаге процесса выбора можно, произведя сдвиг, перейти к случаю В связи с этим положим Функция удовлетворяет функциональному уравнению из следующей леммы.

Лемма 1. Если случайная величина то для любых значений

Доказательство. В силу соотношений (1) — (3) и определения имеем

Так как то Если положить

то случайная величина будет иметь распределение, указанное в условии леммы. Значит, (4) является следствием (5).

Пусть для каждого значения случайная величина имеет распределение, указанное в лемме 1, а определено равенством

Хотя явный вид функции а еще не определен нами, результат леммы 1 позволяет получить следующее описание оптимальной процедуры.

Теорема 1. Согласно оптимальной процедуре, в точке процесс выбора должен быть окончен с выигрышем если в противном случае выбор должен продолжаться. Среднее значение выигрыша при оптимальной процедуре есть

Мера точности распределения параметра возрастает на 1 с каждым наблюдением. Следовательно, если задана мера точности априорного распределения, то оптимальная процедура будет определена, если найти значения последовательности а (то Основное рекуррентное соотношение, определяющее эту последовательность, приводится в

следующей лемме. Фигурирующая там функция задается формулой

Лемма 2. Для всякого значения положим Тогда

Доказательство. Из (6) и (4) вытекает, что

Если теперь использовать соотношения (3) § 13.4 и (3) § 11.9, то получим

Отсюда с учетом соотношения (17) § 12.6 выводим (7).

Из (7) видно, что

Таким образом, всю последовательность а можно получить, исходя из любого ее члена. Мы установим теперь дальнейшие свойства функции а и получим некоторые аппроксимационные формулы для значений а

Здесь полезно вернуться к соотношениям (4) и (7) и вывести их другим образом. Рассмотрим задачу выбора с отбрасыванием, в которой статистик последовательно наблюдает независимые случайные величины с ценой с единиц за наблюдение. Предположим, что случайные величины в этой последовательности по-прежнему независимы, но распределены уже не одинаково. Пусть при

В этой задаче состояние статистика после наблюдения значений можно охарактеризовать парой где значение последнего наблюдения характеризует число проведенных наблюдений. Обозначим опять через средний выигрыш без учета стоимости уже проведенных наблюдений при оптимальной процедуре, начинающейся из точки Если проводится очередное наблюдение то состояние переходит в имеет то же распределение, что и случайная величина из леммы 1. Отсюда видно, что оптимальный средний выигрыш в этой задаче также удовлетворяет функциональному уравнению (4). Далее, если задается формулой (6), то снова является оптимальным

средним выигрышем в классе всех процедур, требующих проведения хотя бы одного наблюдения, и имеет вид (7). Эта интерпретация функции как выигрыша во вспомогательной задаче об оптимальной остановке приводит к следующей теореме.

Теорема 2. Функция а является непрерывной и строго возрастающей функцией от Далее, если то же, что в лемме 2, то

и

Доказательство. Мы осветим здесь лишь интуитивные идеи доказательства, однако строгое доказательство идет тем же путем.

Пусть каждое из наблюдений в указанной выше вспомогательной задаче об оптимальной остановке имеет среднее 0 и меру точности Тогда эта задача относится к классу проблем, рассмотренных в § 13.5. Согласно формуле (3) § 13.5, максимальный средний выигрыш равен

Можно показать (упр. 17), что у при всякой фиксированной цене с есть возрастающая функция от

Из (11) видно, что в нашей вспомогательной задаче об оптимальной остановке меры точности наблюдений различны, причем мера точности для возрастает вместе с Так как мера точности для равна средний выигрыш оптимальной процедуры больше, нежели средний выигрыш получающийся при замене меры точности дальнейших наблюдений на меру точности Неравенство (12) следует поэтому из (14).

Далее, так как мера точности наблюдения является убывающей функцией от аналогичные рассуждения показывают, что средний выигрыш оптимальной процедуры есть возрастающая функция от

Соотношение (13) можно получить следующим образом. Если во вспомогательной задаче очень велико, то мера точности каждого наблюдения немного больше 1. Из соотношения (3) § 13.5 следует, что если бы каждая мера точности равнялась в точности 1, то средний выигрыш оптимальной процедуры был бы равен Теперь понятно что фактический средний выигрыш оптимальной процедуры может быть сделан сколь угодно близким к за счет выбора достаточно большого значения

Соотношение (13) является по существу выражением факта непрерывности функции а при Можно показать также, что функция а непрерывна в каждой точке но мы не будем вдаваться здесь в детали.

Обозначим правую часть неравенства (12) через Функция а о служит нижней границей для функции а. Так как является возрастающей функцией от то из упр. 17 следует, что возрастающая функция от Далее, поскольку при то из определения выводим

Функция а о обладает теми же свойствами, что и она непрерывна и монотонно возрастает до того же самого предельного значения (15). Таким образом, представляется разумной аппроксимацией для при больших значениях Приближение для оптимальной процедуры можно теперь получить с помощью теоремы 1, заменив на

Так как при то процедура, соответствующая этой замене, может закончиться раньше, чем оптимальная процедура, но никогда не потребует продолжения выбора, если этого не требует оптимальная процедура.

Дальнейшие подробности относительно этой задачи и задачи, рассматриваемой в следующем параграфе, см. в работе Де Гроот (1968).

<< Предыдущий параграф Следующий параграф >>
Оглавление