загрузка...

 

загрузка...
Основы телевидения     |     Психовизуальная избыточность телевизионных сообщении

Информационная оценка изображения

Сколько информации содержится в изображении? Например, в знаменитой картине Леонардо да Винчи Джоконда или в географической карте Киевской области. Где больше информации — в Джоконде или в Саскии Рембрандта?

На эти вопросы теория информации ответа не дает. Теория информации касается больше сигналов, несущих информацию, чем информации как таковой. Работа Шеннона имеет больше дело со связью, чем с трудно уловимым конечным результатом связи, которым собственно и является информация

Поставим вопрос иначе: сколько информации содержится в телевизионном (дискре-тизированном) изображении?

Рассмотрим плоское монохромное изображение, как наиболее простое. Если задано число градаций т, которым представляется яркость каждого элемента изображения, то согласно (3.1) его информационная емкость СЭ равна

Информационная емкость кадра, содержащего N элементов, в N раз больше

а информационная емкость изображения, состоящего из q последовательных кадров,

Можно ли утверждать, что информация IK содержащаяся в телевизионном кадре, всегда равна информационной емкости кадра Ск? По-видимому, нет. Это равносильно утверждению, что в 10-литровом ведре всегда находится 10 литров воды. Можно лишь утверждать, что максимально возможное количество информации в телевизионном кадре Ik max = Ck а максимально возможное количество информации в телевизионном изображении из q кадров Iq max = Cq = qCk

Знание максимально возможного количества информации в телевизионном изображении представляет несомненный интерес, но чтобы строить экономичные телевизионные системы , нужно знать энтропию, т. е. среднее количество информации, приходящееся на кадр или на элемент для данного класса визуальных сообщений.

Однако это очень сложно. Теория информации развита применительно к одномерному сигналу, а источники телевизионных сообщений являются многомерными. Правда, все современные телевизионные системы основаны на преобразовании посредством развертки пространственного изображения в одномерный электрический сигнал, информационные свойства которого оценить просто, однако не ясно, насколько эффективно осуществляется такое преобразование. Рассмотрим это на примере. Допустим, что мы должны передать по телефону информацию об изображении, приведенном на рис. 3.2, а так, чтобы абонент, находящийся на другом конце провода, смог бы с наших слов воспроизвести это изображение. Для описания изображения воспользуемся методами, применяемыми в телевидении, т. е. нанесем на изображение сетку из вертикальных и горизонтальных линий и разобьем его таким образом на N элементов. Число элементов выберем исходя из точности, с которой мы хотим, чтобы было воспроизведено изображение.

Из этих же соображений определим необходимое число градаций яркости т. (В нашем примере N = = 16 X 16 = 256, а m = 3 — белый, серый и черный цвета). Присвоим каждому элементу изображения индекс, обозначив горизонтальные полосы-строки буквами русского алфавита от а до р , а вертикальные — цифрами от 1 до 16. Сообщим предварительно нашему абоненту число клеток сетчатого поля (т. е. число элементов изображения) и порядок их нумерации с тем, чтобы он мог заранее подготовить разграфленные листы бумаги. Это равносильно установлению стандарта разложения изображения. Поскольку стандарт установлен, можно определить информационные емкости элемента изображения и кадра.

В данном примере Са = log23 = 1,58 бит, а Ck = NC Э = 256 C Э =404 бит. Рассмотрим некоторые способы описания изображения.

Способ первый

Условимся с абонентом, что будем называть индекс элемента и цвет, в который нужно его закрасить. При этом наше сообщение будет иметь вид: а1. — серый, б1 — серый, а2 — серый, в8 — черный и т. д. Оценим количество информации I Т.С в приведенном описании кадра, которое можно отождествить с телевизионным сигналом. Заметим, что каждое сообщение включает в себя сведения о пространственном положении элемента изображения I пр и его яркости Ia следовательно,

Для того чтобы указать положение любого элемента, необходимо пронумеровать его двоичным кодом с числом разрядов, равным log2N П оскольку нужно пронумеровать все элементы, то таких чисел должно быть N, поэтому

Чтобы закодировать яркость элемента, необходимо log 2m двоичных разрядов, а всех элементов в N раз больше, значит,

Таким образом,

В данном случае I Т.С =256x8 =256Х

X 1,58 = 2440 бит. Нетрудно заметить, что второе слагаемое в (3.13) равно информационной емкости кадра (3.8). Но ведь не может изображение содержать информации больше, чем вмещается в кадр. Следовательно, наше описание вследствие непродуманности обладает большой избыточностью (говорим много лишнего). Действительно, зачем называть и номер элемента, и его цвет?

Способ второй

Договоримся с абонентом, что будем называть ему цвет элементов изображения по порядку слева направо вдоль строки и сверху вниз по строкам, не указывая номера элемента. При этом сообщение будет иметь вид: серая, серая, серая..., черная, черная, черная..., белая, белая, белая... и т. д. Поскольку выпала информация о пространственном положении элементов, первое слагаемое в (3.13) станет равным нулю. Тогда

в данном случае IТ.С = 256 X 1,58 = 404 бит (в 6 раз меньше, чем при первом способе). Заметим, что в канале связи могут быть помехи, в результате чего возникают сбои и ошибки при воспроизведении изображения. Представим, что наш абонент иногда отвлекается и забывает закрасить элемент. При большом числе элементов это может привести к существенным ошибкам, поэтому целесообразно внести в сообщение избыточность для повышения надежности передачи.

Способ третий

Аналогичен способу второму, но в конце каждой строки для повышения надежности передачи сообщается дополнительная информация: конец строки, а в конце кадра — конец кадра. По этому способу работает современная система телевидения, в которой дополнительная информация о конце строки и кадра передается при помощи строчных и кадровых синхроимпульсов.

Предположим, что мы находимся в Киеве, а наш абонент во Владивостоке и разговор нужно оплатить из студенческой стипендии. Это обстоятельство заставит нас подумать о более экономичном способе описания изображения. Анализируя изображение, заметим, что оно имеет вид черного и двух белых пятен, расположенных на сером фоне, занимающем значительную часть кадра, и решим, что экономичнее...

Способ четвертый

Предложим абоненту взять бумагу серого цвета и закрасить на ней элементы: черным — в8, г 7 , г8, г9, дб и т. д. и белым — к5, к6, к10, к11, л5 и т. д. Этот способ требует раскраски не всех, а только I элементов из N. Но поскольку раскрашиваются не все элементы, то нужно указать геометрическое положение раскрашиваемых элементов. В данном случае передаваемая информация также содержит две составляющие — яркостную и пространственную. Пространственная составляющая будет меньше, чем в (3.11), так как нужно закодировать положение только I элементов из N:

Iпр = l log2N

Яркостная составляющая также будет меньше, чем в (3.12), поскольку нужно назвать всего по одному разу все возможные цвета элементов:

I я = m log 2m

Таким образом,

На рис. 3.2 отличаются от серого 90 элементов. Полагая I = 90, находим, что IТ.С = 90 • 8 + 3 • 1.58 ≈ 725 бит. На этот раз мы ошиблись. Количество передаваемой информации не уменьшилось, а, наоборот, почти в два раза возросло по сравнению с информационной емкостью кадра. В данном случае этот способ оказался менее эффективным, чем второй. Попытаемся его усовершенствовать.

Способ пятый

Предложим нашему абоненту на бумаге серого цвета закрасить черным пятно, контур которого ограничивают элементы в8, г9, (910, ell, ж12, з13, 12 и т. д.и белым — пятна с контурами к5, к6, л6, м6 6, н5, м5, л5 и к10, к1 и т. д. В этом случае Z = 46 и, следовательно,

IТ .С =46•8+3•1,58 ≈373 бит.

Здесь уже количество информации в сообщении меньше информационной емкости кадра. Кроме того, выясняется, что значительная часть информации об изображении заключена в его контурах,.

Продолжим поиск.

Способ шестой

Предложим абоненту на серой бумаге нарисовать черный треугольник с вершинами в8, зЗ, з13, черный прямоугольник с вершинами и 4 , и12, о4, о12, затем белые прямоугольники с вершинами к5, к6, н5, кб, к10, к11, н10, н11.

В данном случае удалось существенно сократить число элементов, положение которых требует указания (l —15) благодаря априорной информации, заключенной в понятиях треугольник и прямоугольник. Для того чтобы закодировать понятия треугольник и прямоугольник с указанием трех цветов (т = 3), понадобится 6 бит информации, следовательно,

IT.C=15x8+6=126 бит

что в три с лишним раза меньше, чем информационная емкость кадра.

Из рассмотренных шести способов наиболее экономичным оказался шестой. Можно ли на основании этого сказать, что наше изображение содержит 126 бит информации? Конечно, нет. Мы вправе лишь утверждать, что сигнал, с помощью которого передано изображение, способен перенести 126 бит информации. Поскольку изображение не может содержать больше информации, чем заключено в сигнале, который его воспроизвел, то, по-видимому, переданное изображение содержит не более 126 бит информации, но насколько меньше, сказать трудно. Все зависит от того, в какой степени удалось учесть при формировании сигнала статистические свойства изображения и априорные сведения, имеющиеся у абонента.

Допустим, что разговор идет между представителями двух проектных организаций, для которых изображение домика на рис. 3.2 стандартизовано и числится под шифром Д5. Тогда для передачи информации об изображении возможен .

Способ седьмой

Предлагаем нарисовать объект Д5 с вершиной в точке в8.

Здесь уже нужно передать совсем немного информации, чтобы абонент мог воспроизвести передаваемое изображение.

Подведем итоги.

Информация о телевизионном изображении в общем случае содержит две составляющие: пространственную (положение элементов изображения) и яркостную (интенсивность излучения).

При детерминированной развертке, когда порядок передачи элементов точно задан и наперед известен (способ второй), пространственная составляющая информации в телевизионном сигнале равна нулю, количество информации в нем определяется уравнением (3.14) и равно информационной емкости кадра. С помощью такого сигнала может быть передано любое сложное изображение в пределах, ограничиваемых стандартом (числом элементов разложения N и числом градаций по уровню т) независимо от статистических характеристик изображения, определяемых корреляционными связями между его элементами.

3. Наличие корреляционных связей между элементами изображения позволяет применить недетерминированную развертку и тем самым в ряде случаев сократить количество передаваемой информации по каналу связи. Для каждого класса изображений имеется свой наиболее эффективный способ разложения.

Рассмотрим изображение, состоящее из q последовательных кадров. Пусть, например, изображение домика передается с движущейся повозки и очередной кадр имеет вид, представленный на рис. 3.2, в. Для передачи этого нового кадра можно, конечно, воспользоваться одним из рассмотренных способов. Однако, учитывая, что у абонента имеется некоторая априорная информация (изображение предыдущего кадра), можно попытаться передать изображение и цвет только тех элементов изображения, которые изменили свою яркость (рис. 3.2, в), или еще проще — предложим абоненту во втором кадре сдвинуть изображение домика вправо на величину одного элемента.

Итак:

1. Количество информации Iq , содержащееся в последовательности из q кадров, благодаря корреляционным связям меньше, чем суммарное количество ин формации в q кадрах:

где Iki — количество информации в г-м кадре; Нк — энтропия кадра в данном ансамбле визуальных сообщений.

2. Степень корреляционных связей может быть оценена при сравнении сосед них кадров в первом приближении по числу элементов, изменивших свою яркость.

Для этого, однако, требуется запоминание информации, содержащейся по крайней мере в предыдущем кадре.

Реклама