www.chms.ru - вывоз мусора в Балашихе 

Динамо-машины  Сигналы и спектры 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 [ 288 ] 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358

ми). Повышение порога вследствие наличия сильных тоналов, приводит к локальной маскировке спектральных компонентов ниже нового порогового уровня. Спектральные компоненты сигнала, лежащие ниже порога слышимости, объявляются несущественными и не кодируются в процессе сжатия. Сигналы, превышающие зависящий от частоты порог, кодируются с достаточной точностью, позволяющей удерживать ошибку аппроксимации ниже уровня остроты. Этот процесс завершается делением спектра множеством узкополосных фильтров и присвоением достаточного числа бит для описания каждого выхода фильтра относительно его амплитуды, которая расположена выше порога. Таким образом, сигналу, в определенной полосе составляющему 30 дБ выше порога, будет при квантовании вьщелено 5 бит. В этом случае шум квантования падает ниже порога, так как отношение шум/сигнал квантования сократилось на 6 дБ на бит. Типичный график порога остроты представлен на рис. 13.38.

Скрытый порог слышимости


Слабый, ранее различимый тон теперь скрывается сильным тоном

0,02 0,05 0,1 0,2 0,5 1,0 2,0 5,0 10,0 20,0 (кГц)

Рис. 13.38. Порог остроты и маскировка

Кодер работает следующим образом. Стандартный 16-битовый аудиосигнал РСМ усекается и преобразуется в компоненты спектральной подполосы с помощью группы многофазных фильтров, состоящей из 32 равномерно расположенных полосовых фильтров. Блок фильтра создается с помехами соседнего канала, превосходящими 96 дБ, - уровень, требуемый ддя подавления искажения восприимчивости, вызванного шумом квантования. Фильтрованные выходные сигналы выбираются с частотой Найквиста для каждой полосы пропускания диапазона частот. В декодере этот процесс обращается. Частота дискретизации каждого многополосного фильтра увеличивается до частоты исходного сигнала источника с помощью интерполирования сигналов подполосы, образованных на выходах полосы пропускания блока синтетических фильтров. На рис. 13.39 представлена блочная диаграмма аудиокодера и декодера уровней I и II стандарта MPEG.

На уровне III стандарта MPEG/ISO (МРЗ) достигается разрешение белее высокой частоты, которое весьма точно соответствует критической разрешающей способности человека. Это усовершенствованное деление достигается посредством дальнейшей обработки 32 подполосных сигналов с помощью перекрывающегося или усеченного 6-точечного или 18-точечного модифицированного дискретного косинус-преобразования (modified discrete cosine transform - MDCT). (Короткое описание ДКП представлено в следующем разделе, посвященном сжатию изображений.) Результирующее число полос частот, которое может



быть разрешено на уровне III, равно 32 х 18, или 576, где каждый фильтр представляет полосу частот в 24 000/576 или 41,67 Гц. Уровень III отличается от уровней I и II дополнительным введением модифицированного ДКП в блок анализа, кодера Хаффмана на выход кварпующего устройства и канала побочной информации.

Информаи1я о масштабном множителе

32-канальный блок фильтров

Блоки 8мс

P m I О

in с

Скрывающий порог

Изменение масштаба и квантование

Кодер динамического распределения бит и масштабных множителей

Отношение сигнал/маска

32-канальный

Обратное изменение масштаба и квантование

блок фильтров

Декодер динамического распределения бит и масштабных множителей

Рис. 13.39. Блочная диаграмма аудиокодера и декодера, уровни I и II 13.8.2. Сжатие изображения

Мы часто сльииали старое высказьшание: Картина стоит тысячи слов. Верно ли оно? 1 ООО слов содержит 6 ООО знаков, которые, будучи закодированы как 7-битовые символы ASCII, требуют в общей сложности 42 ООО бит. Какого размера образ (или картина) может быть описан с помощью 42 ООО бит? Если используется монохромный (т.е. черный и белый) образ со стандартной 8-битовой шкалой оттенков серого, образ будет ограничен 5 250 пикселями (или элементами изображения). Этот образ может иметь размерность 70 х 75 пикселей, и если предположить, что образ среднего качества (разрешение 300 пикселей на

дюйм), в результате получаем, что наш образ составляет примерно дюйма на дюйма.

Определенно, требуется какое-то кодирование изображения.

Подойдем к проблеме с другой стороны. Насколько большим является изображение? Выбирая лист бумаги размером 8,5 х 11,0 дюймов, содержащий изображение с разрешением 300 пикселей на дюйм, получаем образ, содержащий 8,5 х 300 х 11,0 x 300 или 8,4 X 10* элементов изображения. Если это полноцветная картина с тремя цветами на элемент, каждый из которых описывается с помощью 8-битовых слов, находим, что образ содержит 2x10 бит, что эквивалентно 4,8 х 10* 6-знаковых слов ASCII. Возможно, старое высказывание стоит обновить в соответствии с совре-

Более привычным является все же выражение лучше один раз увидеть, чем сто раз услышать , но в целях дальнейшего обсуждения приведен дословный перевод. - Примеч. пер.



менным положением дел, сказав, что: Картина стоит порядка пяти миллионов слов. Для сравнения с другими форматами изображения отметим, что отдельный кадр телевизионного изображения высокой четкости содержит примерно 1,8 х 10* пикселей, стандартное телевизионное изображение - это примерно 0,33 х пикселей, а мониторы компьютера высшего класса содержат от 1,2 до 3,1 х 10* элементов изображения.

Технология дала нам принтеры низкой стоимости с высокой разрешающей способностью, сканеры, камеры и мониторы, позволяющие схватывать и представлять изображения с коммерческой и развлекательной целью. Хранение и передача этих образов существенно зависит от кодирования источника, призванного снизить требования к полосе частот и памяти. Существует множество стандартов, которые были разработаны для сжатия изображений. В следующем разделе будут изучены элементы двух основных схем сжатия [26, 27].

13.8.2.1. JPEG

JPEG (Joint Photography Experts Group - объединенная группа экспертов в области фотографии) - это общее название, которое дано стандарту ISO/JPEG 10918-1 и стандарту ITU-T Recommendation Т.81 Цифровое сжатие постоянных изображений непрерывного тона . JPEG, в основном, известен как основанная на преобразовании схема сжатия с потерями. Сжатие с потерями допускает ошибки в построении сигнала. Уровни ошибок должны быть ниже порога восприимчивости человеческого глаза. JPEG поддерживает три режима работы, связанных с дискретным косинус-преобразованием (discrete cosine transform - DCT, ДКП): последовательное ДКП, прогрессивное ДКП и иерархическое, а также режим без потерь с использованием дифференциального предсказания и энтропии кодирования ошибки предсказания. ДКП - это численное преобразование, связанное с дискретным преобразованием Фурье (discrete Fourier transform - DFT, ДПФ) и предназначенное для получения спектрального разложения четно-симметричных последовательностей. Если входная последовательность является четно-симметричной, нет необходимости в синусоидальных компонентах преобразования. Следовательно, ДКП может заменить ДПФ.

Начнем с введения двухмерного преобразования ДКП 8x8. Сначала прокомментируем использование ДКП для образования спектрального описания блока 8x8 пикселей. Двухмерное ДКП - это сепарабельное преобразование, которое может быть записано в виде двойной суммы по двум размерностям. Сепарабельное ДКП произюдит восемь 8-точечных ДКП в каждом направлении. Следовательно, основной компоноючный блок представляет собой единичное 8-точечное ДКП. Возникает вопрос, почему используется ДКП, а не какое-либо другое преобразование, например ДПФ. Ответ связан с теоремой о дискретном представлении и преобразованием Фурье. Преобразование в одной области приводит к периодичности в другой. Если преобразуется временной ряд, его спектр становится периодичным. С другой стороны, если преобразуется спектр временного ряда, временной ряд периодически продолжается. Этот процесс известен как периодическое расширение и обозначается результирующей периодограммой. Периодическое расширение исходных данных (рис. 13.40) демонстрирует разрыв на фаницах, который офаничивает степень спектрального затухания в спектре величиной 1 . Можно образовать четное расширение данных, отображая данные относительно одной из фаниц. Если данные являются периодически расширенными, как показано на рис. 13.40, разрывность уже свойственна не амплитуде данных, а ее первой производной, так что степень спектрального затухания увеличивается до 1 . Более быстрая скорость спектрального затухания приводит к меньшему



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 [ 288 ] 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358