Главная > Обработка сигналов, моделирование > Построение динамических стохастических моделей по экспериментальным данным
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3с. Причинность

В предыдущих рассуждениях не принимались во внимание так называемые экзогенные входы системы. Разумеется, если имеешь дело с техническими системами, такими как самолет или процесс управления, экзогенные переменные однозначно определены и исключение их из модели может привести лишь к ухудшению качества модели. Здесь мы не будем иметь дело с такими системами. Хотелось бы поставить следующий вопрос: каков критерий определения, является ли данная переменная существенным (экзогенным) входом для данного выхода?

Нетрудно сформулировать эти критерии неформально. Если мы думаем, что определенная входная переменная является существенной, то наиболее подходящая модель, содержащая этот вход, должна, быть лучше по сравнению с наиболее подходящей моделью, не содержащей этого входа. Прежде чем идти дальше,

нужно пояснить слово «лучший». В детерминированной среде тест на причинность достаточно прост. Достаточно зафиксировать все переменные, кроме одной, и варьировать эту одну исследуемую переменную. Соответствующее изменение выхода есть мера степени причинной связи каждой входной переменной и выходной переменной. Очевидно, что такие простые тесты неприемлемы в стохастическом случае. Можно рассмотреть следующее операционное определение причинности в стохастических системах. Допустим, мы хотим узнать, влияет ли переменная на выходную переменную Если да, то можно ожидать, что кроме членов в уравнении для должны присутствовать члены вида или Если же их опустить, то способность модели описывать имеющиеся данные уменьшается и эта потеря может быть обнаружена проверкой качества предсказания. Например, можно разделить данное множество наблюдений на две части, скажем, равного объема. Можно использовать первую часть для построения двух наиболее подходящих моделей для причем первая имеет только выходные члены, а вторая — выходные члены плюс входные Обе модели используются для предсказания на один шаг вперед во второй части наблюдений, упомянутой раньше, и вычисляются соответствующие среднеквадратические ошибки предсказания (СКО). Модель, дающая меньшую СКО, считается лучшей. Эксперимент можно повторить, деля наблюдаемые данные на две части в других пропорциях, чтобы убедиться в том, что полученные результаты нечувствительны к разделению данных на группы. Другие методы определения влияния экзогенных членов на пригодность модели для предсказания рассматриваются в гл. VIII и IX.

Одним из важных выводов из таких исследований является то, что (наилучшая) модель с большим количеством входных переменных не обязательно дает лучшее предсказание, чем (наилучшая) модель с небольшим числом входных переменных или вовсе без них. По сути дела, добавление «не относящихся к делу» входных переменных может проявиться в значительном ухудшении качества предсказания моделью. Этот результат не является неожиданным. Он наблюдался даже в обычных авторегрессионных системах. Наиболее подходящая модель не обязательно дает более точное предсказание, чем наиболее подходящая модель

Напомним, что для учета ряда переменных может быть введен тренд. Способом, аналогичным описанному выше, можно определить приемлемость введения в модель тренда или соответствующих экзогенных членов.

Были попытки определить понятие причинности в стохастической среде в терминах эмпирического (или наблюдаемого) коэффициента корреляции. Если мы имеем дело с двумя

временными рядами и если оцениваемый коэффициент корреляции между ними, например между близок к 1, то говорят, что между х и у существует причинная связь. Такое определение неудовлетворительно по нескольким причинам. Во-первых, два ряда х и у могут быть сильно коррелированы, даже если они совершенно не связаны друг с другом. К примеру, если

то x и у статистически независимы в силу независимости и все же между имеется высокая эмпирическая корреляция, вызванная сходством трендов. Во-вторых, коэффициент корреляции симметричен относительно двух переменных х и у. Но причинность в том смысле, в каком она обычно понимается, не обладает свойством симметричности. Вход х может причинно влиять на но в то же время х может причинно не зависеть от у. Например, пусть атмосферные осадки, а уровень грунтовых вод. Ясно, что осадки влияют на уровень грунтовых вод, но не наоборот. Существуют и другие причины для того, чтобы не рассматривать коэффициенты корреляции. Другие методы оперирования с причинностью обсуждаются в гл. IX.

<< Предыдущий параграф Следующий параграф >>
Оглавление