Главная > Обработка сигналов, моделирование > Проверка статистических гипотез
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6. Проверка независимости в 2x2 таблицах

Задача о том, независимо ли распределение некоторых рактеристик в данной совокупности, обсуждалась в разделе 4 главы 2 (пример 4). При этом предполагалось, что частные вероятности известны. Мы видели, что лучше всего информирующей среди выборок объема является та,

которая взята из самой редкой из четырех разновидностей Пусть это будет, например, А Тогда задача сводится к проверке гипотезы относительно биномиального распределения

В более типичной ситуации, когда неизвестны, выборка только из одной категории, скажем не может служить основой для различения гипотезы и ее альтернатив. Это следует из того факта, что число элементов выборки, обладающих свойством имеет биномиальное распределение с вероятностью успеха совершенно неизвестной как в случае, когда гипотеза верна, так и в противоположном случае. Гипотеза может быть, однако, проверена, если выборка берется из двух категорий: (или Возьмем, например, последний случай. Если объемы выборок равны то числа элементов этих выборок, обладающих свойством будут независимыми случайными величинами с биномиальными распределениями соответственно. Здесь Гипотеза независимости двух характеристик: эквивалентна гипотезе и задача сводится, таким образом, к разобранной в предыдущем разделе.

Вместо извлечения выборок из двух категорий часто бывает удобнее взять случайную выборку из совокупности, рассматриваемой как целое. Результаты подобной выборки могут быть сведены в следующую 2X2 таблицу сопряженности признаков. В ее клетках указано количество объектов разных категорий:

(см. скан)

Величины имеют совместное полиномиальное распределение

Лемма 2 и теорема 3 применимы к любому параметру вида

Полагая и обозначая и вероятности категорий в рассматриваемой совокупности, мы имеем

Независимость эквивалентна равенству а неравенства указывают соответственно на положительную и отрицательную зависимость.

Критерий гипотезы независимости, или любой другой гипотезы относительно описывается в терминах условного распределения X при данных Вместо того чтобы непосредственно вычислять это распределение, рассмотрим сначала условное распределение при условии (которое влечет Это распределение, как легко видеть, равно

т. е. представляет собой совместное распределение двух независимых биномиальных величин с параметрами соответственно. Действительно, это ясно и без вычислений, поскольку теперь мы имеем дело с выборками фиксированных объемов из категорий вероятность А в которых равна Если наложить дополнительное условие условное распределение X при двух условиях

будет таким же, как у X при данном в случае двух независимых биномиальных величин, рассмотренных в предыдущем параграфе. Стало быть, оно равно

(мы заменили в (21) у на следует заметить, что выбор именно X для построения критериев совершенно произволен; с таким же успехом мы могли бы выбрать У). Для параметра имеем выражение

Из проведенных рассуждений мы видим, что условный критерий при данных для проверки любой гипотезы, относящейся к идентичен с условным критерием при данном для той же самой гипотезы относительно в обстановке предыдущего раздела (в котором было дано априори). В частности, условный критерий для проверки независимости (критерий Фишера — Ирвина) совпадает с критерием проверки равенства двух биномиальных параметров и потому может быть выражен в терминах гипергеометрического распределения.

В начале раздела уже отмечалось, что гипотеза независимости может быть проверена на основании выборок, взятых различными способами. Выборки фиксированного объема можно взять из и 1 или из или, наконец, из совокупности как целого. Какой из этих планов более эффективен, зависит от стоимости выбора из различных категорий и из всей совокупности, а также от стоимости необходимой классификации отобранных индивидуумов в соответствии с рассматриваемыми характеристиками. Предположим, однако, на время, что мы пренебрегаем этой стороной дела и желаем сравнить планы эксперимента в терминах мощностей отвечающих им критериев при одной и той же альтернативе. Тогда при возрастании объема выборки до бесконечности верны следующие асимптотические утверждения:

(1) Если выборки объемов тип извлекаются из или то наилучшими значениями тип будут

(II) Выборки равного объема лучше извлекать из чем из если

(III) Случайная выборка из всей совокупности хуже, чем выборки равного объема из или из

Мы не будем доказывать здесь эти утверждения. Отметим лишь, что их можно получить, используя нормальное приближение к биномиальным распределениям и замечая, что при случайном выборе из всей совокупности стремятся по вероятности к соответственно.

<< Предыдущий параграф Следующий параграф >>
Оглавление