Главная > Обработка сигналов, моделирование > Построение динамических стохастических моделей по экспериментальным данным
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава I. ВВЕДЕНИЕ В ПОСТРОЕНИЕ МОДЕЛЕЙ

Для описания заданной системы слово «модель» используется в самых разнообразных ситуациях, и поэтому имеются существенные расхождения во мнениях относительно его значения. Оно может обозначать фотографическую копию исследуемой системы, отображающую все ее тонкости настолько, что модель будет адекватно представлять исходную систему. Такого рода копирование редко достигается на практике. Каждая модель может предназначаться для ряда специфических целей, таких как предсказание и управление, и модель должна быть конкретна лишь в той мере, в какой она удовлетворяет этим требованиям. Таким образом, основная предпосылка для построения моделей состоит в том, что сложные системы — а всякие реальные системы обычно являются сложными — не обязательно требуют сложных моделей. Например, полное феноменологическое описание речного потока является очень сложным. Тем не менее можно получить относительно простые модели этого процесса, дающие достаточно хорошие характеристики предсказания и управления. Модели, лежащие за пределами определенного уровня сложности, часто оказываются более низкими по качеству, чем некоторые более простые модели. Если модель данного процесса содержит большое число параметров, то часто это служит верным указанием на то, что для процесса следует рассмотреть совсем другой класс моделей. Всегда желательно выбирать для исходных данных относительно простые модели, увеличивая их сложность только в том случае, если более простая модель неудовлетворительна. В этом отношении методология построения моделей не отличается от обычной практики, используемой в других областях науки.

Традиционно системы рассматриваются как детерминированные или стохастические. Принципиальным недостатком детерминированных моделей систем является отсутствие эффективного метода сравнения различных возможных моделей, создаваемых на основе одних и тех же эмпирических данных, — сравнения, основанием для которого является назначение модели. Для сравнения моделей можно было бы использовать какой-нибудь критерий, такой как критерий наименьших квадратов (между выходом модели и наблюдаемым выходом). Но результат такого сравнения не всегда будет иметь прямое отношение к предсказанию или управлению, поскольку системы, удовлетворительные с точки

зрения критерия наименьших квадратов, могут оказаться неудовлетворительными с точки зрения предсказания. Более того, полезность модели теснейшим образом связана с ее так называемой способностью к обобщению. Говорят, что модель обладает способностью к обобщению, если, будучи построена на основе наблюдений над системой, она не очень сильно отличается от модели, построенный на основе последующих наблюдений. Построение же моделей в рамках вероятностного подхода позволяет сравнивать различные модели и придавать точный смысл таким понятиям, как «значимый» и «пренебрежимый», что совершенно невозможно для моделей, создаваемых в рамках детерминированного подхода. Поскольку класс стохастических моделей включает в себя класс детерминированных, поиск наилучшей стохастической модели не влечет какой бы то ни было потери общности.

Для механических или электромеханических систем, таких как турбогенераторы и самолеты, переменные, доступные для непрерывного измерения вплоть до данного момента времени, подразделяются на две группы — так называемые входные и выходные. Обычная предпосылка такого подразделения состоит в том, что выходными являются те переменные, поведение которых нас интересует, но на которые нельзя воздействовать непосредственно: влиять на них можно посредством входных переменных, или независимых переменных, допускающих прямое воздействие. Если обозначает выходную, а входную переменную, то функция прошлых значений Однако это не исключает возможности того, что зависит от прошлых значений поскольку в системе могут быть скрытые обратные связи. Для метеорологических или экономических систем причинная связь между переменными может быть заранее неочевидной; при этом произвольное деление переменных на входные и выходные не всегда полезно. В этом случае при построении модели все переменные рассматриваются как выходные, а причинные связи между переменными выявляются с помощью построенной модели.

1а. Природа и цели построения модели

Главная цель построения модели при заданных входных и выходных наблюдениях — добиться понимания процесса. Как правило, любое аналитическое выражение, объясняющее природу и степень зависимости текущего наблюдения от его прошлой истории, увеличивает, можно сказать, понимание процесса. Другой взгляд на модель эмпирического процесса состоит в том, что модель есть удобный способ суммирования всего наличного множества наблюдений: важнейшие характеристики данных можно выявить из модели с помощью ее анализа или моделирования происходящих в ней процессов. Прекрасным историческим примером

модели эмпирического процесса является модель Кеплера движения планет, предназначенная для объяснения наблюденных в прошлом положений планет. Законы Кеплера можно использовать для предсказания будущего положения планеты по ее текущему положению. В то же время они изящно суммируют все множество наблюдений за положением различных планет. Другими классическими примерами служат авторегрессионная модель второго порядка для описания последовательности ежегодных наблюдений за солнечными пятнами и стохастическое стационарное дифференциальное уравнение первого порядка для турбулентных потоков.

Но соответствия модели количественным наблюдениям еще недостаточно. Мы хотели бы иметь модель «простую» или «приятную для разума». Модель с чрезмерно большим числом параметров обычно рассматривается как неудовлетворительная. Класси ческий пример такого рода — птолемеевская теория циклов и эпициклов для объяснения движения планет. Эта модель чрезвычайно громоздка, хотя она и могла объяснить все имеющиеся к моменту ее создания наблюдения: разница между предсказанием по модели и действительным положением планеты была сравнима по величине с ошибкой наблюдения. Законы Кеплера объяснили то же множество наблюдений моделью с относительно небольшим числом параметров. Но, конечно, громоздкая модель принимается, если нельзя построить лучшей.

Имея дело со сложным процессом, нельзя надеяться получить удовлетворительную детерминированную модель. Поэтому процесс рассматривается, в момент времени как сумма двух частей: части, являющейся функцией всех наблюдений до момента времени и чисто случайной составляющей т. е. последовательности независимых одинаково распределенных случайных величин с нулевым средним. Соответствующее уравнение для представляется в виде

где последовательность наблюдений для момента последовательность независимых одинаково распределенных случайных величин с нулевым средним, функции заданных аргументов, а в - конечномерный вектор параметров.

Рассматривая функции необходимо выделить два случая: (I) функции известны с точностью до неизвестного вектора параметров функции неизвестны. В случае (I) задача построения модели полностью решена, если параметр в оценен по эмпирическим данным. Такая ситуация встречается в механических или электромеханических системах, таких как самолеты и турбогенераторы, динамика которых полностью известна, за исключением нескольких параметров. Случай (II) типичен для задач экономики, гидрологии, метеорологии, изучения популяций и т. п. Здесь по физическим сообраяениям или

соображениям эвристического характера ограничивают множество пар конечным числом возможных пар считая зависящими от 1) и от неизвестного конечномерного вектора параметров Среди возможных пар функций необходимо сначала выбрать подходящую пару, а затем оценить соответствующий параметр в выбранной паре. Этот аспект будет обсуждаться позже.

Как только хорошая модель построена, ее можно использовать для ряда целей, подобных предсказанию переменных на один или несколько шагов вперед или управлению системой. Ее можно использовать для генерирования данных с характеристиками, аналогичными характеристикам эмпирических данных. Например, в случае изучения речного потока данные, полученные посредством использования модели, называются синтетическими данными и широко используются в вопросах надежности, связанных с проектированием водохранилищ, определением режимов их заполнения и т. д. Еще одно применение находят модели в технике связи при передаче данных. В случае передачи речевого сигнала его сначала квантуют. Есть две возможности: или непосредственно передавать квантованный сигнал, или же сначала подбирать авторегрессионную модель к отрезкам сигнала длительностью, скажем, 40 мсек, а затем передать только параметры авторегрессионного процесса. На принимающем конце речь можно синтезировать, используя эти параметры при моделировании авторегрессионного процесса на вычислительной машине.

Обратимся к вопросу о предсказании. Часто можно слышать, что главная цель построения модели — это предсказание, или прогноз. Такое утверждение не совсем верно. Следует заметить, что часто предсказание можно получить простыми методами регрессионного анализа, используя значения процесса в прошлом. Прекрасный исторический пример получения хорошего прогноза посредством одного лишь наблюдения процесса, без использования вообще какой-либо теории, — вавилонский метод предсказания первой фазы новолуния и лунных затмений.

Во многих случаях две совершенно различные модели могут приводить к более или менее одинаковой ошибке предсказания на шаг вперед. А раз так, то одна способность к предсказанию не может быть принята в качестве окончательной оценки качества модели, если только мы не хотим использовать модель исключительно для предсказания. Конечно, если предсказание — наша главная цель, то нет необходимости использовать более сложную модель. Так, например, в статистике популяций удовлетворительна детерминированная модель, предсказывающая численность популяции на год вперед с точностью около 5%. Но такая модель не может быть обоснована с помощью обсуждаемых здесь методов, поскольку она не сохраняет всех принципиальных статистических характеристик исходных данных.

<< Предыдущий параграф Следующий параграф >>
Оглавление