Главная > Обработка сигналов, моделирование > Проверка статистических гипотез
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8. Классификации по подчиненности («гнездовые» классификации)

Теория предыдущего раздела неприменима даже в столь простой ситуации, как одинарная классификация с неравными численностями различных классов (см. задачу 22). Однако принцип несмещенности может быть распространен на важный случай «гнездовых» (иерархических) классификаций с равными численностями классов. Характер этого обобщения легко понять, если провести его для случая двух факторов. Случай большего числа факторов охватывается по индукции.

Возвращаясь к примеру с партиями какого-либо продукта, допустим, что одной партии сырья достаточно для производства нескольких партий окончательного продукта. Пусть экспериментальный материал состоит из партий, причем каждая из а партий сырья идет на изготовление партий продукта. И пусть из каждой партии взята выборка объема Тогда формула (41) принимает вид

где обозначает эффект, связанный с партией сырья, партией окончательного продукта, полученного из этой партии сырья, единицей, выбранной из последней партии. Все эти величины предполагаются независимыми и распределенными нормально с нулевыми средними значениями и дисперсиями, равными соответственно Основная часть доказательства по индукции состоит в указании ортогонального перехода к величинам совместная плотность которых,

с точностью до постоянного множителя, равна

Прежде всего, при каждых существует ортогональное преобразование величин такое, что

Как и в случае простой классификации, величины зависят только от независимы между собой и распределены нормально с нулевым средним и дисперсией и не зависят от . С другой стороны, величины имеют ту же структуру, что величины в одинарной классификации

где и где дисперсии и равны соответственно. Эти величины могут быть, следовательно, преобразованы в величины совместная плотность которых задается формулой (42) с заменой на Полагая при мы видим, что совместная плотность величин определяется выражением (47).

На основе формулы (47) можно проверить гипотезы Ну которые устанавливают, что одна или другая из классификаций меньше влияет на исход испытаний. Пусть

Чтобы получить критерий для кажется соблазнительной попытка исключить с помощью инвариантности относительно умножения величин на произвольную постоянную. Однако эти преобразования не оставляют выражение (47) инвариантным, так как они не всегда сохраняют тот факт, что является наименьшей из трех дисперсий: Вместо этого мы рассмотрим задачу с точки зрения несмещенности. Для любого несмещенного критерия гипотезы вероятность отклонения равна а каждый раз как в частности, это имеет место, если дисперсии равны

и где любое фиксированное число и Теми же приемами, что и в главе 4, можно показать, что условная вероятность отклонения гипотезы при данном должна быть равна а для почти всех значений При фиксированном совместное распределение оставшихся величин имеет такую же форму, как (42), после удаления . РНМ несмещенный условный критерий при данном имеет критическую область

Так как не зависят от то константа определяется тем условием, что при статистика имеет распределение т. е., в частности, не зависит от 5. Критерий (48) является, очевидно, несмещенным и, следовательно, РНМ несмещенным.

В применении к совершенно аналогичные рассуждения показывают, что РНМ несмещенный критерий имеет критическую область

где определяется тем условием, что при статистика имеет распределение

Остается выразить статистики в терминах величин Из соответствующих выражений для одинарной классификации получаем

и

Следовательно,

Из выражений для этих статистик в терминах величин видно, что их математические ожидания равны Поэтому разложение

служит основой для анализа дисперсий

давая оценки для компонент дисперсии и для некоторых отношений этих компонент.

Двойные классификации по подчиненности могут встречаться в форме смешанных моделей. Предположим, возвращаясь к предыдущим иллюстрациям, что фирма производит продукцию на нескольких заводах. Пусть обозначает эффект завода (эта величина будет постоянной, так как при повторении эксперимента заводы не меняются), эффект партий, индивидуальный эффект. Тогда наблюдения имеют следующую структуру:

Вместо полного приведения величин X к канонической форме в терминах величин здесь удобнее осуществить редукцию к величинам У (так что ) и первое из двух преобразований, переводящих Обозначим так полученные величины Они удовлетворяют соотношениям при и

где определяются по (50). С точностью до константы совместная плотность величин равна

Отсюда ясно видно отличие задачи проверки гипотез о малости эффектов отдельных заводов

и задачи проверки аналогичной гипотезы для эффектов партий: Первые две гипотезы включаются в модель I (линейная гипотеза). Как и прежде, из несмещенности вытекает, что условная вероятность отклонения при равна почти всюду величине а. При фиксированном гипотеза проверяется как линейная гипотеза и РНМ инвариантный условный критерий при условии имеет критическую область (48) с Константа снова не зависит от и найденный критерий является РНМ в классе всех критериев, как несмещенных, так и инвариантных. Критерий с аналогичным свойством существует и для гипотезы Его критическая область имеет вид

где С определяется с помощью нецентрального -распределения (а не из центрального -распределения как раньше; см. задачу 5).

С другой стороны, гипотеза относится, по существу, к модели II. Она инвариантна относительно добавления произвольной постоянной к каждой из величин При этом преобразовании максимальный инвариант образует суммы Задача сводится, таким образом, по структуре к чистой модели II с одинарной классификацией. Критерий, как и раньше, определяется по (49). Он является и РНМ инвариантным, и РНМ несмещенным.

Смешанная модель с двумя факторами, которые взаимодействуют, будет рассмотрена в примере 11.

<< Предыдущий параграф Следующий параграф >>
Оглавление