Главная > Обработка сигналов, моделирование > Построение динамических стохастических моделей по экспериментальным данным
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8а. Природа задачи выбора

Напомним, что класс моделей описывается тройкой где стохастическое разностное уравнение, характеризуемое вектором коэффициентов и соответствующей ковариацией

В этом уравнении компоненты являются известными функциями от конечного числа компонент

и детерминированных функций тренда При явном определении вектор может также содержать члены вида т. е. уравнение системы может содержать члены скользящего среднего. Функция известная функция от (или от ) вида или или Множество описывает множество возможных значений, принимаемых 9.

Элемент класса обозначается Определим множество так, чтобы каждая компонента любого элемента была отлична от нуля. Это условие обеспечивает, что любые два класса моделей не пересекаются до тех пор, пока соответствующие уравнения и отличаются хотя бы одним членом. Согласно этому определению класс моделей не пересекается с классом моделей Следует подчеркнуть, что при этом нельзя определить класс моделей как класс AR-моделей порядка или меньше, поскольку каждый коэффициент в уравнении модели должен быть отличен от нуля.

Даны непересекающихся классов и множество результатов наблюдений Предполагая, что множество может быть элементом любого класса требуется определить «наиболее правдоподобный» или «наиболее вероятный» класс, который мог бы породить это множество наблюдений.

Задаче сравнения различных классов не уделялось достаточного внимания в литературе. Обычно задача рассматривается в

очень узком аспекте, а именно, рассматривается выбор порядка членов авторегрессии или скользящего среднего в классах моделей ARMA. Излишне говорить, что класс ARMA не является самым подходящим классом для всех временных рядов. Рассмотрим, например, задачу построения модели для биологической популяции журавлей Ошибка предсказания лучшей авторегрессионной модели для этой популяции намного больше, чем у лучшей мультипликативной (или логарифмической) модели. Это свойство нельзя вывести непосредственно визуальным просмотром данных. Такая важная информация может быть получена только при подробном сравнении двух классов моделей, а именно классов аддитивных и мультипликативных моделей. Другим примером является моделирование ряда годового отлова канадской рыси Этот ряд содержит сильную колебательную компоненту с периодом около восьми или девяти лет. Со времен Юла (1927) было принято моделировать такие временные ряды, используя только члены авторегрессии. В гл. X и XI показано, что во многих примерах модель, содержащая члены авторегрессии и синусоидальные члены, воспроизводит статистические характеристики наблюдаемых данных намного лучше, чем просто AR-процесс.

В настоящее время общепринято исследовать задачи выбора класса моделей главным образом в терминах коэффициентов корреляции данных (Бокс, Дженкинс, 1970). Такая процедура не всегда может оказаться подходящей, поскольку предполагается, что мы строго ограничиваемся классом ARMA-моделей и исключаем классы ковариационно-стационарных или мультипликативных моделей.

Другой аспект задачи выбора класса: всегда ли класс -моделей лучше соответствует заданному временному ряду, чем класс -мoдeлeй? (Напомним, что эти классы не пересекаются.) Этот вопрос можно обобщить следующим образом. Если имеются два класса моделей и где в уравнении содержатся все члены из уравнения то всегда ли класс является более подходящим в некотором смысле, чем класс Ответ: нет, не всегда. Если лучшая модель из меньшего класса удовлетворяет всем критериям проверки адекватности, то лучшая модель в классе обладает худшей способностью предсказания, чем лучшая модель из класса Точность оценок в модели из ниже, чем в модели из класса Этот результат показан в приложении 8.1.

Излагая методы выбора класса, следовало бы отметить, что по конечному объему данных никогда нельзя установить, что модель полностью воспроизводит рассматриваемый процесс. В лучшем случае можно подобрать такую модель, что различие между характеристиками модели и характеристиками данных лежит в

пределах ошибки выборки (т. е. ошибки, вызванной конечным объемом данных). А раз так, чисто детерминированные методы выбора, основанные на том, что процесс точно подчиняется детерминированной модели, имеют ограниченную область применения. Как правило, эти методы содержат определение ранга некоторой матрицы, а при вычислении с двойной точностью почти все матрицы, как нетрудно показать, имеют полный ранг.

Одним из популярных методов сравнения классов является метод проверки гипотез. Остановимся на нем более подробно. Хотя этой теории нельзя отказать в изяществе, она содержит произвольные параметры, такие как уровни значимости. Кроме того, она имеет ограниченную область применимости в том смысле, что может работать только с двумя классами моделей одновременно, а классы могут содержать только обобщенные AR-модели. Поэтому мы будем развивать два других подхода к сравнению, а именно метод максимума правдоподобия и метод предсказания. Оба эти подхода могут работать с более чем двумя классами одновременно, и эти классы не ограничиваются только обобщенными AR-моделями. В случае AR-моделей решающее правило, определяемое методом максимума правдоподобия, идентично решающему правилу проверки гипотез для определенного уровня значимости.

Кроме того, можно сравнивать различные классы путем непосредственного сравнения лучших моделей из каждого из этих классов при одних и тех же данных. Мы дадим два таких метода, а именно байесов и предсказания. Относительные достоинства различных методов обсуждаются в конце § 8b.

<< Предыдущий параграф Следующий параграф >>
Оглавление