Главная > Обработка сигналов, моделирование > Построение динамических стохастических моделей по экспериментальным данным
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8с.2. Критерии проверки адекватности, использующие остатки.

Используя данную модель и предыдущие наблюдения можно образовать остатки являющиеся оценками значений шума соответственно. Не будем повторять метод получения остатков, так как он был объяснен в гл. VI и VII. Заметим, что остаток раньше обозначался через Нужно проверить, можно ли рассматривать эту последовательность как последовательность независимых случайных величин с нулевым средним, имеющих нормальное распределение где неизвестно. Раньше мы убедились, что конкретные тесты можно применять только для выяснения, принадлежит ли конечный вектор параметров одному из классов, когда число классов конечно. Строго говоря, проверка элементов последовательности на независимость не имеет смысла до тех пор, пока не будут установлены альтернативные типы зависимости. Поэтому мы будем пользоваться последовательной процедурой, приведенной ниже.

1. Предположим, что заданная последовательность независима и нормально распределена по закону Проверим равенство когда неизвестно, используя критерий 1, приведенный ниже.

2. Предположим, что элементы заданной последовательности нормальны, независимы и удовлетворяют (8с.2.1), где последовательность независимых одинаково распределенных по

закону величин с нулевым средним. Эта последовательность отличается от последовательности из § 8а,

Проверяем равенства с помощью критериев 2, 3 или 4, описанных ниже.

3. Предположим, что данная последовательность распределена нормально с нулевым средним и

где последовательность независимых нормально распределенных по закону случайных величин с неизвестным Проверяем равенства с помощью критериев 5 и 6.

4. Предполагаем, что элементы данной последовательности независимы. Проверяем, является ли ее распределение нормальным.

Мы приведем критерии для каждого из шагов этой процедуры и используем для всех них одинаковый уровень значимости. Если проверки, предусмотренные пп. 1—3, дали положительные результаты, то соответствующая модель по которой были получены будет считаться обоснованной. В противном случае недостаток модели определяется тем критерием, которому она не удовлетворяет, и модель соответствующим образом изменяется. Часто критерий п. 4 не удовлетворяется. Это означает только то, что заданная последовательность распределена не по нормальному закону. Так как нормальность используется в тестах пп. 1—3, может возникнуть вопрос, не ставит ли под сомнение данный вывод результаты этих критериев. Это не так, поскольку критерии, разработанные для пп. 1—3, приблизительно справедливы, даже когда распределение не является нормальным.

Предлагаемые критерии можно вывести из метода проверки гипотез для метода правдоподобия, описанных в § 8b; они разрабатывались Уиттлом (1951, 1952), Андерсоном (1976), Боксом, Дженкинсом (1970), Кенуем (1957) и др. Значение этих критериев нельзя недооценивать, особенно с точки зрения их простоты. Процедура построения модели включает значительное количество проб и ошибок, и на каждой итерации можно пользоваться критериями для проверки полученной модели.

8с.2.1. Тест на равенство нулю среднего значения (критерий 1). Пусть имеются два класса:

где последовательность одинаково распределенных по закону случайных величин с нулевым средним,

Используя остатки требуется выбрать один из классов или

Тестовой статистикой является . В классе величина имеет -распределение с степенями свободы независимо от Следовательно можно выбрать следующее решающее правило:

Пороговое значение выбирается по таблице -распределений, соответствующих заданному уровню значимости например Известно, что этот критерий локально наиболее мощный. Покажем теперь связь этого критерия с критерием

Пусть остаточные дисперсии наиболее подходящих моделей в классах соответственно:

Тогда статистика в решающем правиле имеет вид

Заметим, что пропорциональна Если имеет -распределение, то легко показать, что имеет приблизительно -распределение.

Ниже приведены пороговые значения при различных N и .

8с.2.2. Тест на отсутствие синусоидальных членов.

Дадим три различных метода для проверки, содержит ли последовательность остатков детерминированные синусоидальные компоненты.

Критерий 2. Частота заданной последовательности известна (Андерсон, 1976). Пусть имеются два класса

Уравнения и содержат последовательность независимых нормально распределенных по закону случайных: величин, частота известна,

Можно использовать критерии отношения правдоподобия длят получения тестовой статистики. Более того, распределение вероятностей тестовой статистики также можно определить в явном виде:

Пусть и пусть остаточные дисперсии наиболее подходящих моделей в классах соответственно:

Приведенное выше соотношение является точным, если . В противном случае это аппроксимация.

Тестовую статистику можно записать в виде

Решающее правило имеет вид

где выбирается с учетом соответствующего уровня значимости.

Критерием 2 нельзя пользоваться, если неизвестна частота . В этом случае нужно использовать критерии 3 и 4. В этих критериях осуществляется проверка на присутствие синусоидальных компонент всех возможных частот. Если в нашем распоряжении только остатков, то тогда по теории Найквиста нужно рассматривать частоты, кратные Следовательно, только частоты представляют интерес. Поскольку представляют интерес только частоты, а не фазы, частота является избыточною если была рассмотрена частота Таким образом, список возможных частот уменьшается до где если четно, и если нечетно. Например, если имеются ежемесячных наблюдений процесса, то соответствующие частоты будут радиан в месяц, а соответствующие периоды месяца. Сформулируем критерий Фишера.

Критерий 3: критерий Фишера. Предположим, что последовательность представляет собой либо белый шум, либо смесь белого шума с синусоидальными компонентами только одной из частот Определим классы как и ранее, причем имеют вид

где последовательность независимых одинаково распределенных по закону величин и

Пусть Уравнение может иметь синусоидальные члены только одной частоты. Это обеспечивается заданием множества как показано ниже. Множество состоит из различных точек:

Мы выведем тестовую статистику из отношения правдоподобия. Тестовая статистика имеет вид

где

Когда лежит в классе статистика в отличие от прежних случаев, имеет распределение, отличное от -распределения, из-за операции максимума при определении Распределение вероятностей определенное Фишером, дается в виде

Плотность вероятности имеет «хвост» с одной стороны. Решающим правилом является

Порог опять ищется по соответствующему уровню значимости. Подчеркнем, что данное выше решающее правило нельзя интерпретировать как критерий отношения правдоподобия, когда уравнение содержит синусоидальные члены более чем одной частоть В этом случае данное выше распределение также неверно. Следующий пример (Андел, Валек, 1971) проиллюстрирует сказанное.

Пример Рассмотрим эмпирический ряд с имеющий единственную преобладающую частоту Пусть уровень значимости равен 98%. Пороговое значение находим из уравнения

Решение уравнения дает значение Пусть

По определению, Следовательно, критерий обнаруживает наличие синусоидального тренда, если или

Добавим теперь в ряд другую синусоидальную компоненту частоты Пусть и имеют значения

Пусть вклад членов неосновной частоты, будет таким же, как и в предыдущем случае, т. е. выбрано так, чтобы или Тестовая статистика имеет вид

Очевидно, значение меньше порогового, равного 0,189. Более того,

что значительно больше, чем 0,05, не говоря уже о 0,02. Таким образом, критерий не указывает на присутствие единственного синусоидального члена тренда, хотя в последовательности содержатся синусоидальные члены двух различных частот. Если бы присутствовала только одна из частот, критерий бы ее обнаружил.

Следующий критерий не обладает недостатком критерия 3.

Критерий 4: критерий кумулятивной периодограммы (Бартлетт, 1966). Определим уравнения множество и 0, как в тесте вдитерия 3. Множество определим следующим образом:

Этот критерий задается в несколько ином виде, чем предыдущие. Вычислим следующие статистики

где определено в критерии 3.

График зависимости от к называют нормированной кумулятивной периодограммой. Если правильный класс, график от к представляет собой прямую линию, исходящую из начала координат в точку (0,5; 1) и, следовательно, нормированная кумулятивная периодограмма должна колебаться около прямой, соединяющей (0; 0) и (0,5; 1). Вероятность того, что вся периодограмма лежит внутри полосы, ограниченной прямыми, параллельными вышеупомянутой прямой на расстояниях равна

Например, эта вероятность равна если и если то Предположим, что мы работаем с -процентным уровнем значимости. Тогда, если вся кумулятивная периодограмма лежит внутри -процентной полосы, то принимается класс . В противном случае его отвергают.

Этот критерий совершенно непохож на критерии, рассмотренные ранее. Он включает вычисление статистик Кроме того, он не требует ограничений критерия Фишера, упомянутых выше. Далее, когда критерий не удовлетворяется, это служит признаком наличия в исходных данных доминирующих частот. Если кумулятивная периодограмма выходит

из ограниченной полосы на частотах то некоторые из этих частот являются доминирующими частотами в наблюдаемой последовательности.

8с.2.3. Тест на сериальную независимость.

Определим, являются ли члены последовательности сериально коррелированными (Уиттл, 1951, 1952). Критерий 5. Пусть имеются два класса:

где последовательность независимых одинаково распределенных по закону величин, заданное целое число, выбор которого будет пояснен далее.

Можно использовать критерий отношения правдоподобия, как в критерии 2. Для больших можно установить обоснованность -распределения соответствующей тестовой статистики критерия.

Пгсть остаточные дисперсии наиболее подходящих моделей для имеющихся данных в двух классах соответственно. Пусть эмпирическая ковариация при сдвиге

Тогда

где -матрица, Тестовой статистикой является

для больших если х принадлежит классу Как и ранее, решающее правило есть

где выбрано в соответствии с уровнем значимости.

Критерий несмещенный, т. е. если х удовлетворяет любой модели в классе то вероятность ошибки II рода для него меньше, чем где уровень значимости, при любых

Рассмотрим случай целого Обычно, когда мы работаем с множеством данных, где порядка нескольких сотен, приходится выбирать равным либо Если модель отвергается критерием при таких высоких значениях мы должны найти максимальное значение при котором модель принимается критерием. Значение дает возможность выяснить представление об ограниченности модели.

Критерий 6: критерий «чемодана» (Бокс, Дженкинс, 1970). Это критерий согласия. Как таковой, здесь только класс вполне определен. Как и прежде, содержит только модели белого шума с нулевым средним и дисперсией Класс включает все модели, не содержащиеся в классе

Пусть коэффициенты корреляции значений процесса х. Соответствующая оценка спектральной плотности:

Если белый шум, то и среднеквадратическое отклонение от равно

Можно проверить, является ли последовательность белым шумом, оценивая На практике приходится усекать ряды и заменять коэффициент корреляции его оценкой определенной ранее.

Искомая тестовая статистика: Целое выбирается обычно порядка или в зависимости от Если х принадлежит классу то имеет распределение степенями свободы. Решающее правило имеет вид

где порог, вычисленный по соответствующему уровню значимости т. е. находят из уравнения

Этим критерием относительно просто пользоваться по сравнению с критерием 5. Когда приходится иметь дело с выборкой.

объем которой порядка нескольких тысяч, критерий 5 практически неприменим, в отличие от критерия 6. За простоту критерия «чемодана» приходится расплачиваться более высокой вероятностью ошибки, чем в критерии 5. Покажем это при Пример. Рассмотрим два класса:

где обычная последовательность с распределением

Решающее правило критерия 6 есть

где , если принят правильно. 0 является оценкой максимального правдоподобия 0, когда х принадлежит классу порог. Решающее правило критерия 5: возьмем

где порог и

когда принадлежит классу Хорошо известно, что -распределение асимптотически идентично -распределению с одной степенью свободы. Следовательно, равны, скажем, при условии, что в обоих критериях используется одинаковый уровень значимости: вероятность ошибки II рода по тесту при условии, что 0 — истинное значение параметра AR-модели, (т. е. х принадлежит классу

Аналогично,

Но

Следовательно, для каждого в т. е. критерий 6 равномерно менее мощный, чем критерий 5.

Тест на нормальность. Мы опустим подробности тестов на нормальность, поскольку их можно найти в любом учебнике по статистике.

<< Предыдущий параграф Следующий параграф >>
Оглавление