Главная > Обработка сигналов, моделирование > Восстановление изображений (Василенко Г. И., Тараторин А. М.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.3. ЦИФРОВЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЙ

В настоящее время вычислительная техника претерпевает бурное развитие. Успехи микроэлектроники привели к значительному снижению стоимости и одновременному повышению быстродействия вычислительных систем. Выпускаемые сейчас персональные компьютеры по возможностям зачастую превосходят большие вычислительные системы десятилетней давности, а лучшие современные мини-ЭВМ иногда мощнее суперкомпьютеров, распространенных еще несколько лет назад. Микро-ЭВМ, предназначенные для научных расчетов, уже конструктивно оформляются в виде обычного дисплея и содержат до байт оперативной памяти, -разрядные процессоры с тактовой частотой и более, а иногда и -разрядные процессоры для быстрого выполнения арифметических операций. Производительность ЭВМ такого рода составляет сотни тысяч приведенных операций в секунду. Наиболее дешевые из них стоят примерно столько же, сколько еще недавно стоил хороший графический дисплей. Начат также выпуск дешевой универсальной мини-ЭВМ с производительностью 600 000 операций/с, выполненной на одном кристалле. Наиболее распространенные современные мини- и микро-ЭВМ имеют многопроцессорную архитектуру. Лучшие представители этой серии («супер-мини» системы) имеют 32-разрядную шипу и производительность, достигающую десяти миллионов операций.

Изображения являются высокоинформативными сигналами, предъявляющими одни из самых высоких требований к вычислительным системам. Эти требования заключаются прежде всего в большом объеме оперативной памяти для храпения изображения и в чрезвычайно высокой скорости обработки. Даже на лучших современных универсальных ЭВМ обработка изображений сталкивается с трудностями. Это вызвало появление специализированных систем для обработки изображений.

Обсудим некоторые особенности архитектуры вычислительных систем для обработки изображений и пути их дальнейшего развития.

1. Организация цифровой памяти изображений. Цифровое изображение даже относительно небольшого формата 256 элементов при 256 уровнях квантования занимает память 64К байт; изображение телевизионного формата при той же глубине квантования — память 256К байт. Если необходимо хранить несколько кадров изображения, -10 память хранения цифровой картины достигает мегабайта и более. Обычно на универсальных ЭВМ оперативной памяти не хватает для запоминания изображения, поэтому приходится работать с внешней

памятью на лептах или дисках, что во много раз увеличивает время обработки.

В настоящее время выпускаются интегральные схемы памяти емкостью 64К байт, что позволяет собирать оперативную память достаточно большой емкости — несколько мегабайт. Обычно в специализированных системах обработки изображений используется модульный принцип построения памяти: на шине процессора находится некоторое число однотипных модулей памяти (память на кадр, например, формата 512Х512 элементов). В наиболее крупных системах число таких модулей может достигать нескольких десятков [87]. Однако модульный многопортовый принцип построения памяти изображения имеет ряд недостатков: в один момент времени процессор работает только с одним модулем системы. Кроме того, затруднена работа многих процессоров одновременно, так как протокол обмена на общей шипе при одновременной работе многих устройств становится сложным. Альтернативой общей шины является асинхронная шина, допускающая взаимодействие многих процессоров и их одновременную работу с памятью изображения. Но асинхронная шина обычно не позволяет достичь таких высоких скоростей обмена, как общая шина. Поэтому одним из существенных достижений считается разработка асинхронной шины со скоростью обмена порядка 10 Мбайт/с и более [133].

2. Повышение производительности вычислительных систем. Размеры изображений предъявляют высокие требования к производительности вычислительных систем. Рассмотрим следующий простой пример: с какой скоростью должен работать процессор, обеспечивающий двумерную свертку весовой функции размером всего 5X5 элементов с цифровым изображением телевизионного формата 512x512 элементов в реальном времени (25 кадров/с)? Пользуясь табл 7.1, легко оцепить, что производительность процессора для такой простейшей операции должна быть более 200 миллионов приведенных операций/с. Такой производительностью в настоящее время обладают лишь некоторые сверхмощные ЭВМ.

Резервы повышения производительности вычислительных систем лежат прежде всего в параллельности вычислений и применении многопроцессорной архитектуры [21]. Большинство универсальных ЭВМ построены по принципу вычислительной машины фон Неймана, содержащей один управляющий элемент, который обеспечивает работу всей системы. Современные вычислительные системы начинают все более отходить от этого принципа, а развитие многопроцессорных систем происходит по нескольким направлениям.

Во-первых, на центральный процессор в универсальных ЭВМ кроме собственно вычислений ложится и различная служебная работа: общение с памятью и периферийными устройствами (дисками, лентами, терминалами и т. п.), распределение времени между пользователями системы и выполнение других функций управления. Естественно разгрузить центральный процессор от этих функций и использовать один или несколько управляющих процессоров для служебной работы в системе. Поэтому современные вычислительные комплексы часто используют двухмашинную структуру: одна из ЭВМ используется для диалога с оператором, управления периферийными устройствами, быстрой выборки из памяти; вторая, «главная» ЭВМ является быстродействующим вычислителем, специально предназначенным для обработки большого числа данных, получаемых от управляющей машины. Такую архитектуру имеют, например, современные «супер-мини» системы.

Во-вторых, большие резервы повышения производительности вычислительных систем лежат в распараллеливании операций. Для обработки изображений типичной является ситуация, когда одни и те же арифметические

операции необходимо применить к большому числу точек изображения (один поток команд — много потоков данных). Рассмотрим, например, сложение двух кадров изображения телевизионного формата. На обычной ЭВМ эта операция потребует выполнения 256 000 сложений. Представим теперь, что в системе имеются 512 однотипных процессоров, каждый из которых работает только со своей строкой изображения и получает команды от одного центрального процессора. Для такой системы сложение двух кадров, очевидно, эквивалентно сложению двух строк.

Существуют различные способы построения параллельных систем [87, 92]:

а) Системы с общей шиной. В этих системах обычно используется несколько (в основном до 16) однотипных процессоров и блоков памяти, которые обмениваются информацией по высокоскоростной шине. Существуют и более крупные системы, содержащие до 200 процессоров, однако при большем числе элементов возрастают трудности, связанные со взаимодействием процессоров, и эффективность системы уменьшается. Системы с общей шиной обычно предназначены для решения универсальных задач (много потоков команд — много потоков данных). Если ситуация может быть сведена к одному потоку команд, возможно построение более простых систем обработки.

б) Матричные процессоры и -процсссоры. В пределе матричный процессор должен иметь один вычислительный элемент для каждой точки изображения. Каждый элементарный вычислительный элемент может представлять собой недорогой микропроцессорный модуль. Команды даются всем элементарным вычислителям одновременно одного управляющего устройства. Если такой параллельный процессор обрабатывает двумерный массив, он обычно называется матричным, если же одновременная обработка затрагивает группу точек (например, строку изображения), процессор называется «-процессором. Матричные процессоры в настоящее время получают все большее развитие и являются перспективным направлением параллелизации вычислений.

в) Конвейерные системы с одновременным доступом к нескольким точкам изображения (pipeline). В этих системах на высокоскоростной процессор подаются последовательно считываемые данные, пропущенные через линии задержки таким образом, чтобы обеспечить одновременный доступ к набору различных точек изображения. Такой способ особенно удобен при прямом вычислении двумерных сверток. Процессор работает в конвейерном режиме в том смысле, что в то время, как новые данные поступают для обработки, обработанные данные передаются в память.

г) Систолические матричные процессоры. Эти системы являются промежуточными между чисто матричными процессорами и системами с одновременным доступом к нескольким точкам. В систолических процессорах набор процессорных элементов одновременно обрабатывает группы точек (небольшие массивы), получаемые на выходе набора линий задержки. Если систему с одновременным доступом можно сравнить с небольшим окном (например, 5x5 точек изображения), сканирующим изображение, то систолический матричный процессор можно рассматривать как набор окон, параллельно обрабатывающих двумерный массив.

3. Использование специализированных процессоров. Наиболее частыми операциями, встречающимися при цифровой обработке изображений, являются вычисления быстрого преобразования Фурье и свертки. Эти операции, конечно, можно весьма эффективно выполнить с помощью матричных процессоров. Однако существует и другой путь решения задачи — создание специализированных процессоров для вычисления БПФ (БПФ-процессоров) и свертки (конволверов). БПФ-процессор

представляет собой специализированное цифровое устройство с распараллеливанием операций, которое на аппаратном уровне реализует алгоритм БПФ. В лучших БПФ-процессорах, разработанных для обработки радиолокационных сигналов, удается добиться времени комплексного умножения порядка 80 не [43]. Двумерное фурье-преобразование изображения, содержащего 256x256 элементов, на этом процессоре может быть выполнено за 30 мс. Описан БПФ-процессор, реализующий операцию вычисления свертки на основе преобразования с числами Ферма. Тактовая частота этого процессора 38 МГц. В [43] описан также вариант процессора для вычисления свертки через БПФ, который способен вычислить свертку двух массивов 512x512 элементов за 5 мсек. Такие огромные скорости обработки получаются из-за распараллеливания операций.

В некоторых случаях проще вычислять свертку не через БПФ, а с помощью прямого алгоритма. На этом пути также удается достигнуть высоких скоростей. В [92] описан специализированный процессор, производящий 250 миллионов умножений/с, который способен вычислять свертку изображения информативностью 512x512X8 бит с весовой функцией фильтра 5x5 элементов со скоростью 30 кадров/с. Процессор собран на нескольких специально разработанных интегральных схемах высокой степени интеграции. Для повышения эффективности в процессоре используется арифметика остатков. Конструктивно процессор выполнен в виде небольшого блока. Математическое обеспечение позволяет использовать процессор вызовом подпрограммы с мини-ЭВМ PDP-11 /34.

Рассмотрим современные вычислительные системы для обработки изображений и специализированные процессоры.

Системы малой мощности. Это системы для интерактивного анализа изображений с помощью микропроцессорной техники. К этим системам можно отнести систему «СВИТ» (СССР) на базе микро-ЭВМ «Электроника-60», дисплейные процессоры, интеллектуальный терминал Pericolor-1000 (Франция). Характерными особенностями этих систем является: обновляемая память изображений емкостью до нескольких кадров размером 256x256 элементов, цветной полутоновой монитор, процессор малой мощности, наличие математического обеспечения для простых операций над изображением (раскраски в различные цвета, суммирования и вычитания кадров, подчеркивания границ, цифровой индикации значений яркости и т. п.). Как правило, на таких системах сложная обработка занимает большое время, поэтому их удобно использовать в качестве периферийного устройства мощной универсальной ЭВМ.

Специализированные системы средней мощности. К этим системам можно отнести вычислительные системы на базе мини-ЭВМ, способные достаточно эффективно решать задачи цифровой обработки изображений. Характерным представителем этой группы является система Спектр-Д (СССР). Это 24-разрядная ЭВМ с периферийным оборудованием и математическим обеспечением для обработки изображений, имеющая производительность процессора-106 элементарных операций/с и память на несколько кадров формата 512x512 элементов. В системе Magiscan (Англия) используются специальные процессоры для управления выбором данных из памяти объемом 1024X1024X8 бит. Система содержит элементы параллельных вычислений — используется структура с одновременным доступом, которой управляет отдельный процессор.

Система Opton (ФРГ) по возможностям близка к системе Magiscan. Отличием системы Opton является включение в систему слайс-процессора, что позволяет проводить операцию выделения контуров на изображении формата 512x512 элементов за 0,5 с. Система Pericolor-2000

(Франция) — двухпроцессорная система, имеющая обновляемую память изображений объемом 10X512X512X8 бит. Для одновременной обработки 16 точек изображения используется слайс-процессор. Операция фильтрации путем прямого вычисления свертки с ядром 3X3 элемента над изображением 512x512 элементов в этой системе занимает 1,2 с.

Системы повышенной мощности. Эти системы обычно используют параллельные процессоры. В системе ZMOB (США) имеется память изображений на 16 кадров с информативностью 1024X1024x8 бит каждый. Система основана на базе мини-ЭВМ VAX-11/780, имеет специальные микропроцессоры для управления вводом/выводом данных. Она содержит 256 микропроцессоров Z80A, объединенных на общей шине. Для изображения с информативностью 512X512X8 бит время прямой свертки с ядром 3X3 элемента составляет 400 мс.

Система DIP1 (США) имеет память на 4 кадра с информативностью 512X512X8 бит каждый. В ней используется метод одновременного доступа с матричными операциями (систолический матричный процессор). Для ядра 3x3 элемента время свертки с изображением телевизионного формата равно 180 мс [87].

4. Высокопроизводительные параллельные ЭВМ для обработки изображений. Система ПС-2000 (СССР) имеет производительность — 200X106 операций/с. Система содержит до 64 процессоров со своими блоками памяти и позволяет выполнять матричные операции. Время вычисления быстрого преобразования Фурье длиной 1024 отсчета — 4 мс. Система Сгау-Х/МР (США) применяется для обработки изображений с высоким разрешением (при разложении до 4000X4000 элементов)

5. Специализированные процессоры. Специализированный БПФ-про-цессор СВК-Ф (СССР) обеспечивает частоту преобразования до 500 кГц, что соответствует выполнению фурье-преобразования изображения с информативностью 512X512x8 бит за 0,5 с. Матричный процессор FPS-5430 (США) предназначен для работы с массивами до 512x512x8 бит. Время вычисления быстрого преобразования Фурье кадра такого формата составляет 0,5 с.

В настоящее время происходит переход к системам обработки изображений следующего поколения. Перспективные системы будут, по-видимому, содержать несколько процессоров, быструю многопортовую память изображений и высокоскоростные шины, с которыми соединены специализированные устройства: матричные процессоры, специализированные БПФ-процессоры и устройства для вычисления свертки. Внедрение таких систем позволит проводить эффективную обработку изображений больших форматов и реализовывать сложные нелинейные алгоритмы обработки за значительно более короткое время, чем на универсальных ЭВМ и с помощью распространенных в настоящее время специализированных систем.

<< Предыдущий параграф Следующий параграф >>
Оглавление