Хэш-функция: истории из жизни, советы, новости, юмор и картинки — Горячее

1 месяц назад

Можно ли получить один и тот же хэш из разных данных⁠⁠

Вот такой вопрос неожиданно у меня возник.

(Напомню, что хэш данных это кагбэ символьное имя определённой длины, получаемое из самих данных. Из одинаковых данных получается одинаковое имя, другие свойства хэша нам пока не интересны)

Ну теоретически, конечно, возможно, что один и тот же хэш получится из слова password12345 и из гифки с Риком Эшли и ещё из файла, хранящего жесткий диск моей виртуальной машины. Но насколько вероятно, что два объекта получат один и тот же хэш, если речь идёт, например, о MD5. Попробуем это оценить.

Объём всех данных в интернете на 2024 год неизвестен. Но очень грубо можно предположить цифру между 150 и 250 зеттабайт. Переводя 250Z в биты получим 2 x 10^24 битов. Если предположить, что каждый бит в интернете - уникальный и назначать им хэши подряд, начиная с нуля, - нам понадобится 2 x 10^24 хэшей. Т.е. последний хэш, если использовать количество разрядов как в MD5, будет выглядеть примерно так ->
000000000001a784379d99db41fedcba

Алгоритм хеширования MD5 имеет в своём распоряжении примерно 3.4 x 10^38 хэшей. Вероятность получить заданный конкретный хэш = 1 / ( 3.4 x 10^38),
а вероятность получить хэш занятый одним из битов интернета - в (2 x 10^24) раз больше, т.е.
примерно 0.6 / (10^14). Насколько велика эта вероятность?

Если бросать монету, то вероятность невыбросить решку:
с первого раза = 0.5,
c двух раз = 0.5^2 = 0.25
не буду утомлять вас логарифмами, но:
c 47-ми раз = 0.71 / (10^14)

Другими словами, вероятнее что вы не выбросите решку с 47-ми попыток, нежели то, что новый MD5 совпадёт с каким-то MD5 из числа уникальных для каждого бита интернета.

Показать полностью

20

sotlef

4 года назад

Лига математиков

Коллизии от 2-х хэш функций⁠⁠

Всем привет!

Интересует такой вопрос. Имеются две разные хэш-функции, выдающие 32-битное значение. Каждая может для определенных пар входных строк выдавать одинаковое значение - вероятность появления коллизий у каждой функции довольно высокая на практике.

Чтобы уменьшить вероятность появления коллизий, хочу скомбинировать результаты. Т.е. будет хэш функция, выдающая 64-битное значение: беру результат первой хэш-функции, сдвигаю его на 32 бита влево и складываю результат второй функции.

С точки зрения теории вероятности, как изменится вероятность появления коллизий для этой функции? Т.е. коллизия произойдет, когда найдется такая пара строк, для которых каждая из функций выдает одинаковые значения.

[моё] Теория вероятностей Хэш-функция Текст

13

sociumR

5 лет назад

Информационная безопасность IT

Верификация тайного удаленного электронного голосования.⁠⁠

Здравствуйте. Нужна критика. Видео создавалось не для узкого круга спецов, а скорее чтоб большее число людей смогло доверять системе голосования, поэтому частично "разжеваны" термины. Тема переплетается с политотой и правом. Поэтому как предупреждение на упаковке "Могут содержать кусочки того и другого"
Вкратце: в основе хэш-функция, ЕСИА, сквозное асимметричное шифрование.

[моё] Верификация Тайное голосование Выборы Есиа Хэш-функция Шифрование Голосование Видео

46