www.chms.ru - вывоз мусора в Балашихе 

Динамо-машины  Сигналы и спектры 

 297 ] 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358

РО = = 2 1 ~~ осмысленное (14.12)

Р(М2) = 0 Л/2 - бессмысленное (14.13)

Предположим, что существует 2 * возможных ключа (размер алфавита ключей), где ЩК) - энтропия ключа (количество бит в ключе). Предположим, что все ключи равновероятны.

Р()=-щ- = ~ (14.14)

Определение расстояния единственности основано на модели случайного шифра, которая утверждает, что ддя каждого ключа К и шифрованного текста С операция дешифрования Dk(Q дает независимую случайную переменную, распределенную по всем юзможным 2 сообщениям (как осмысленным, так и бессмысленным). Следовательно, для данных Ки С операция gt;к(С) может с равной вероятностью давать любое из открытых сообщений.

При данном шифровании, описываемом как С,=Ек{М,), неверное решение F

возникает всегда, когда шифрование с помощью другого ключа Kj может давать С, из того же сообщения М, или из некоторого другого сообщения М,.

C,=E {M,) = E{M,) = E{Mj) (14.15)

Криптоаналитик, перехвативший С не сможет выбрать верный ключ и, следовательно, не сможет взломать систему шифрования. Мы не рассматриваем операции дешифрования, которые дают бессмысленные сообщения, так как они могут легко отбрасываться.

Для каждого верного решения конкретного шифрованного текста существует г * неверных ключа, каждый из которых имеет ту же вероятность P{F) получения неверного решения. Так как все осмысленные открытые сообщения предполагаются равновероятными, вероятность неверного решения равна вероятности получения осмысленного сообщения.

P(F) = - = 2-=2- deg; (14.16)

Здесь D = /-r - избыточность языка. Тогда ожидаемое число неверных решений F равно следующему:

F=[2 lt; -1]P(F) = [2 ( -ф- =2 -ш

Поскольку F быстро убывает с увеличением N, то

log2F = H(K)-DN=0 (14.18)

является точкой, где число неверных решений достаточно мало; так что шифр может быть взломан. Следовательно, получаемое расстояние единственности описывается следующим выражением:

N=-. (14.19)



Из уравнения (14.17) следует, что если Н{К) значительно больше DN, то будет множество осмысленных расшифровок, и, следовательно, существует малая вероятность выделения криптоаналитиком верного сообщения из возможных осмысленных. Приблизительно, DN - это число уравнений для ключа, а Н{К) - число неизвестных. Если число уравнений меньше числа неизвестных битов ключа, единственное решение не-юзможно; говорят, что система на поддается взлому. Если число уравнений больше числа неизвестных, возможно единственное решение, и система не может больше считаться не поддающейся взлому (хотя она все еще может относиться к защищенным по вычислениям).

Стоит отметить, что доминирование бессмысленных дешифровок позволяет взламывать криптограммы. Уравнение (14.19) показывает значение использования методов сжатия данных до шифрования. Сжатие данных устраняет избыточность языка, таким образом увеличивая расстояние единственности. Совершенное сжатие данных даст Z? = О и = оо для любого размера ключа.

Пример 14.4. Расстояние единствешюсти

Вычислите расстояние единственности для системы шифрования, использующей письменный английский язык, ключ которой задается последовательностью к\, где каждое к, -

случайное целое из интервала (1, 25), которое определяет номер сдвига (рис. 14.3) для /-го символа. Предположим, что все возможные ключевые последовательности равновероятны.

Решение

Существует (25) возможных равновероятных ключевых последовательностей. Следовательно, используя равенства (14.5), (14.8) и (14.19), получаем следующее:

энтропия ключа: Н(К) = logi (25) = 135 бит,

абсолютная интенсивность английского языка: / = log2 26 = 4,7 бит/символ,

предполагаемая истинная интенсивность английского языка: г = 1,5 бит/символ,

избыточность: D = / - г = 3,2 бит/символ,

, Н(К) 135

N =-=-= 43 символа.

D 3,2

В примере 14.2 совершенная секретность сообщения из 29 символов иллюстрировалась с использованием того же типа ключевой последовательности, что и в данном примере, где показано, что если имеющийся шифрованный текст состоит из 43 символов (откуда следует, что некоторая часть ключевой последовательности должна использоваться дважды), то возможно единственное решение. В то же время не определена вычислительная сложность отыскания рещения. Даже если оценить теоретическое количество шифрованного текста, необходимое для взлома шифра, практически это может оказаться невозможным.

14.3. Практическая защищенность

Для последовательностей шифрованного текста, размер которых больше расстояния единственности, любая система уравнений (определяющая ключ) может быть решена путем простого перебора всех возможных ключей, пока не будет получено единственное решение. Однако это соверщенно непрактично, за исключением применения очень короткого ключа. Например, для ключа, полученного путем перестановки английского алфавита, существует 26! = 4 х 10* возможных пере-



становок (в криптографическом смысле это считается малым). Будем считать, что в результате изнурительных поисков мы нашли правильный ключ, перебрав приблизительно половину возможных комбинаций. Если допустить, что каждая проверка потребует для вычисления 1 мкс, то полное время поиска превысит 10 лет. Следовательно, если криптоаналитик хочет иметь некоторую надежду на успех, то о лобовых методах перебора следует забыть и применять какую-ту иную технологию (например, статистический анализ).

14.3.1. Смешение и диффузия

При расшифровке многих систем шифрования может применяться статистический анализ, использующий частоту появления отдельных символов и их комбинаций. Шеннон [5] предложил две концепции шифрования, усложняющие задачу криптоаналитика. Он назвал эти преобразования смешение (confusion) и диффузия (diffusion). Смешение - это подстановки, которые делают взаимосвязь между ключом и шифрованным текстом как можно более сложной. Это усложняет применение статистического анализа, сужающего поиск практического подмножества области ключей. В результате смешения дешифрование даже очень короткой последовательности шифрованного текста требует большого числа ключей. Диффузия - это преобразования, сглаживающие статистические различия между символами и их комбинациями. Примером диффузии 26-буквенного алфавита является преобразование последовательности сообщений М = Л/о, Л/ь ... в новую последовательность сообщений 1= Уо, Yi, - с помощью следующего соотношения:

У = Af +, по модулю 26. (14.20)

1 = 0

Здесь каждый символ в последовательности рассматривается как число по модулю 26, S - некоторое выбранное целое число и л = 1, 2, ... . Новое сообщение У будет иметь ту же избыточность, что и исходное сообщение М, но частота появления всех букв в У будет более равномерной, чем в Л/. В результате, чтобы статистический анализ принес криптоаналитику какую-либо пользу, ему необходимо перехватить большую последовательность шифрованного текста.

14.3.2. Подстановка

Технология шифрования с помощью подстановки, например использование шифра Цезаря и прогрессивного ключа шифрования Тритемиуса, широко используется в головоломках. Такие простые подстановочные шифры дают малую защищенность. Чтобы к подстановочной технологии можно было применить концепцию смешения, требуется более сложное соотношение. На рис. 14.6 изображен пример создания большей подстановочной сложности с помощью использования нелинейного преобразования. В общем случае п входных битов сначала представляются как один из 2 различных символов (на приведенном рисунке п = 2). Затем множество из 2 символов перемешивается так, чтобы каждый символ заменялся другим символом множества. После этого символ снова превращается в п-битовый.



 297 ] 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358