Главная > Обработка сигналов, моделирование > Построение динамических стохастических моделей по экспериментальным данным
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

10с. Модели процессов среднемесячного расхода воды в реках

10с.1. Описание модели.

В идеале нам хотелось бы иметь единственную модель, справедливую для всех временных шкал. Например, было бы прекрасно, если бы одна и та же модель давала хорошие прогнозы как на одни сутки, так и на один год вперед. Однако, как правило, невозможно получить такие общие модели. Поэтому мы будем строить разные модели, справедливые для разных диапазонов частот съема данных. В частности, мы построим модель процесса среднемесячного расхода воды, используя данные по месяцам Подобным же образом можно построить модели для данных о расходе воды, берущихся через суточный или годовой интервал.

Мы не можем утверждать априори, что прогнозы на один год вперед, даваемые на основе модели данных, идущих с годовым интервалом, будут лучше таких же прогнозов, даваемых на основе модели данных, идущих с месячным интервалом. Мы должны предварительно сравнить соответствующие свойства моделей месячных и годовых данных, прежде чем прийти к такому заключению.

Сильные изменения в выборочных средних значениях и стандартных отклонениях, вычисляемых на основе данных по месяцам, четко указывают на то, что последовательность среднемесячного расхода воды в реке нельзя моделировать процессами, стационарными в широком смысле, например, AR- или ARMA-процессами. Поэтому для каждой реки мы будем искать наилучшую модель в классе нестационарных. Но среди нестационарных

моделей мы ограничимся классом AR-моделей с добавленными к ним членами, описывающими детерминированные синусоидальные тренды, поскольку, как можно показать, этого класса вполне достаточно для наших целей.

Пусть обозначает средний расход воды в месяце. В этом пункте мы не будем использовать индекс если это не приводит к недоразумениям. Рассмотрим следующее семейство нестационарных моделей:

В (10c.1.1) есть последовательность независимых величин с нулевым математическим ожиданием и дисперсией удовлетворяющая предположению Изменяющийся во времени множитель введен для того, чтобы учесть систематические изменения от месяца к месяцу в стандартном отклонении процесса среднемесячного расхода воды в реке. Аналогично, слагаемое вводится для того, чтобы учесть систематические изменения в среднем значении этого процесса; доминирующие частоты в спектре процесса среднемесячного расхода воды. Выбор целого числа и подходящих частот среди обсуждался в работе Рао и Кашьяпа (1974). Коэффициенты удовлетворяют предположению а члены, описывающие тренд, удовлетворяют Поскольку одновременно и коэффициенты в тренде и дисперсию шума нельзя выбирать произвольно, мы положили

Как мы видели, распределение процесса расхода воды в реке далеко от нормального. Поэтому неразумно вычислять оценки условного максимального правдоподобия, опираясь на гауссовость распределения, ибо в данном случае эти оценки не будут обладать свойствами, подобными асимптотической минимальности дисперсии. По этой причине мы ограничимся отысканием оценок наименьших квадратов для различных коэффициентов в уравнении ибо эти оценки представляются вполне адекватными. В соответствии с уравнениями было получено несколько моделей с использованием разных значений для и эти модели сравнивались друг с другом на основе решающих правил, обсужденных в п. 8b.2. Окончательные модели для процессов расхода воды в трех реках приведены в табл. 10с.1.1. Соответствующие значения коэффициентов входящих

в соотношение приведены в табл. 10с.1.2. Удовлетворительное качество окончательных моделей подтверждено исследованием характеристик ошибок предсказания на один месяц вперед, проверкой остатков и сравнением статистических характеристик выходных сигналов моделей с соответствующими эмпирическими характеристиками наблюденных процессов расхода воды.

Таблица 10с.1.1. (см. скан) Оценки параметров окончательных моделей для процессов среднемесячного расхода воды. Член определен соотношениями

Распределения вероятностей случайных входных процессов используемых для генерирования искусственного процесса, имитирующего расход воды, перечислены в табл. Подробности

Таблица 10с.1.2. (см. скан) Оценки коэффициентов в моделях процессов среднемесячного расхода воды в реках

оценивания параметров и проверки адекватности подобранных моделей можно найти в работах Рао, Кашьяпа (1973, 1974).

10с.2. Сравнение с другими моделями.

Основная модель процесса среднемесячного расхода воды в реке сравнивается с некоторыми другими моделями, предложенными для этих данных. Здесь обсуждается лишь небольшая часть таких моделей, некоторые другие упоминаются в работах, приведенных в списке литературы. Наше обсуждение довольно сжато, так как не о всех других моделях есть количественные данные, имеющие отношение к проверке адекватности и испытанию моделей.

10с.2.1. Авторегрессионные и авторегрессионные со скользящим средним модели. Модель Томаса — Файеринга.

Эта модель (Томас, Файеринг, 1962) для процесса среднемесячного расхода воды может быть описана следующим образом:

где коэффициент регрессии данных за месяцы, последовательность независимых гауссовских величин с нулевым математическим ожиданием и единичной дисперсией, а — выборочное стандартное отклонение среднемесячного расхода воды в месяце, коэффициент корреляции расхода воды в месяцах, результат осреднения по нескольким годам среднемесячного расхода воды в месяце календарного года, среднемесячный расход воды в месяце года,

Так как уравнение описывает марковский процесс первого порядка, сравним его с вариантом первого порядка нашей модели, описываемой уравнением

Таблица 10с.1.3. (см. скан) Распределения вероятностей случайных входных процессов

Основное различие между этими двумя представлениями заключается в том, что в нашей модели имеется лишь несколько коэффициентов авторегрессии, в частности, один в случае модели первого порядка, тогда как в модели имеются 12 соответствующих параметров по одному на каждый месяц года. Это увеличение числа параметров приводит к тому, что

оценки для них становятся менее точными, чем оценки коэффициентов в уравнении Например, если имеются данные за лет, то коэффициент в уравнении можно оценить, используя значений среднемесячного расхода воды, тогда как каждый из коэффициентов можно оценивать, используя только значений. Но множители при возмущениях имеют одинаковый тип в этих моделях. И множители и множители изменяются от месяца к месяцу, Далее, если модель Томаса — Файеринга обобщить до марковской модели более высокого порядка, то параметры уже не будут иметь той простой интерпретации, о которой говорилось выше.

Представляя в виде комбинации синусоид, как в модели и используя алгоритм рекуррентного оценивания, можно отслеживать произвольные медленные изменения в среднем значении процесса среднемесячного расхода. Такие изменения в этом среднем значении обычно характерны для данных за длительный интервал времени. Напротив, модель Томаса — Файеринга оказывается в этом отношении негибкой; ее нельзя использовать для выявления изменений на некотором интервале времени в среднем значении среднемесячного расхода воды.

Модель Томаса — Файеринга предназначается в основном для имитации процесса расхода воды в реке, тогда как модель может использоваться как для имитации, так и для предсказания.

Модель Томаса — Файеринга может давать сведения о средних значениях и стандартных отклонениях среднемесячного расхода воды в определенных месяцах года, передавать также такие характеристики, как распределения вероятностей, коррелограммы и спектральные плотности процессов среднемесячного расхода воды. Качество прогноза на основе этой модели оказывается значительно хуже, чем у модели Исследованная здесь модель может передавать все упомянутые характеристики процесса расхода воды в реке, включая временные характеристики разброса в измененном масштабе.

10с.2.2. Другие AR-, ARMA-модели и ARIMA-модели сезонных изменений.

Для данных о расходе воды идущих с месячным интервалом, можно подобрать авторегрессионную модель (AR) или авторегрессионную со скользящим средним (ARMA) модель типа, описываемого нижеприводимым уравнением (10с.2.2) без членов описывающих тренд. В этом уравнении есть последовательность некоррелированных случайных величин:

Из-за периодических составляющих, присутствующих в данных о расходе воды, идущих с месячным интервалом, AR-модель или ARMA-модель типа будет приводить к большой средней квадратической ошибке предсказания на один шаг вперед. С помощью модели нельзя воспроизводить такие характеристики наблюденных данных, как среднее значение и дисперсия среднемесячного расхода воды. В то же время, как было показано в настоящем исследовании, AR-модели с введенными в них подходящими синусоидальными входными сигналами адекватно передают все статистические характеристики наблюденных данных.

ARIMA-модели сезонных изменений обсуждались Кларком (1973) при моделировании процессов среднемесячного расхода воды в реках и Рао, Рао (1974) в связи с процессами выпадения осадков. У этих моделей нет никаких преимуществ перед разработанными здесь ковариационно-стационарными AR- и ARMA-моделями. Дополнительные недостатки ARIMA-моделей сезонных изменений, например противоречащая интуиции природа возмущающих воздействий и сложность оценивания параметров, упоминались в гл. III.

10с.2.3. Модели нормированных процессов расхода воды в реках.

Для устранения периодических составляющих, присутствующих в последовательностях данных о расходе воды в реке, идущих с месячным интервалом, используются два вида нормировки данных:

При первом типе нормировки из среднемесячного расхода воды в месяце года вычитается его среднее значение за несколько лет, остаток делился на стандартное отклонение расхода воды в месяце года (Сингх, Лонквист, 1974). При втором типе нормировки производится анализ Фурье последовательности наблюденных данных чтобы получить отрезок ряда Фурье Остатки получающиеся после вычитания анализируются в свою очередь (Евевич, 1972). Наблюденные последовательности среднемесячного расхода воды могут также подвергаться различным преобразованиям с использованием логарифма, квадратного или кубического корней, и уже затем нормироваться. К временным рядам подбираются авторегрессионные и авторегрессионные со скользящим средним модели.

При анализе процессов среднемесячного расхода воды такие модели, как с нормировкой вида будут содержать неизвестных, к которым относятся

. В случае нормировки имеется неизвестных, где число членов в отрезке ряда Фурье Изменения в очень сильно сказываются на качестве предсказания модели, и поэтому преобразованные модели могут оказаться неподходящими для целей прогноза.

С помощью синтетических данных, генерируемых нормированными моделями, могут воспроизводиться средние значения и стандартные отклонения среднемесячного расхода воды. Детальная информация о -свойствах моделей, основанных на нормированных данных, и об их способности воспроизводить гистограммы процессов расхода воды отсутствует.

Ошибки прогноза у нормированной модели могут превосходить такие ошибки у модели так как в случае последней возможно отслеживать любое изменение при оценивании коэффициента синусоидальной составляющей благодаря описанному в гл. VI алгоритму оценивания в реальном масштабе времени.

В противоположность этому, в нормированной модели приходится фиксировать значения этих коэффициентов, даже если они могут медленно изменяться во времени.

10.с.2.4. Модель с дробным шумом.

Характеристика разброса в измененном масштабе для наблюденной последовательности среднемесячного расхода воды в реке отличается от прямой линии, когда значения вычерчиваются в зависимости от сдвига на логарифмической бумаге. Модель с дробным шумом, как таковая, не может быть постулирована для данных, идущих с месячным интервалом. Однако с помощью такой модели можно было бы воспроизводить не содержащий тренда процесс который получается из вычитанием среднего значения и Кашьяп, 1974). Посредством такой модели процесса, не содержащего тренда, будут воспроизводиться -характеристики наблюденных данных, не содержащих тренда.

Один из недостатков модели с дробным шумом заключается в том, что из-за свойства стационарности этой модели ее выходные процессы, имитирующие данные о расходе воды, не могут воспроизводить среднее значение и стандартное отклонение наблюдений. Модели с дробным шумом еще недостаточно разработаны, чтобы можно было убедиться в их способность воспроизводить такие характеристики, как корреляция, спектральная плотность и распределение вероятностей для процесса среднемесячного расхода воды с устраненным трендом.

Возможности предсказаний посредством модели с дробным шумом еще должны быть проанализированы, хотя предварительные результаты показывают, что среднее квадратическое значение ошибки предсказания на один шаг вперед с помощью этой модели значительно превышает соответствующее значение для к

овариационно-стационарной модели, исследованной в настоящей книге. Но эти заключения не удивительны ввиду того факта, что модели, использованные в данных исследованиях, работают в основном с высокочастотными составляющими процессов расхода воды, тогда как модель с дробным шумом предназначается для воспроизведения низкочастотных свойств этих процессов. Детальное обсуждение модели с дробным шумом для данных о расходе воды, берущихся с годовым интервалом, читатель найдет в § 10е.

<< Предыдущий параграф Следующий параграф >>
Оглавление