专栏地址:每周一个 Python 模块

hashlib 模块定义了用于访问不同加密散列算法的 API。要使用特定的哈希算法,需要先用适当的构造函数或new()创建哈希对象。然后,无论使用何种算法,对象都使用相同的 API。

散列算法

由于hashlib 受 OpenSSL “支持”,因此该库提供的所有算法都可用,包括:

  • MD5
  • SHA1
  • SHA224
  • SHA256
  • SHA384
  • SHA512

有些算法可用于所有平台,有些算法依赖于底层库。对于每个列表,分别查看 algorithms_guaranteedalgorithms_available 函数。

import hashlib

print(‘Guaranteed:\n{}\n’.format(’, ‘.join(sorted(hashlib.algorithms_guaranteed))))
print(‘Available:\n{}’.format(’, ’.join(sorted(hashlib.algorithms_available))))

# output
# Guaranteed:
# blake2b, blake2s, md5, sha1, sha224, sha256, sha384, sha3_224,
# sha3_256, sha3_384, sha3_512, sha512, shake_128, shake_256
#
# Available:
# BLAKE2b512, BLAKE2s256, MD4, MD5, MD5 - SHA1, RIPEMD160, SHA1,
# SHA224, SHA256, SHA384, SHA512, blake2b, blake2b512, blake2s,
# blake2s256, md4, md5, md5 - sha1, ripemd160, sha1, sha224, sha256,
# sha384, sha3_224, sha3_256, sha3_384, sha3_512, sha512,
# shake_128, shake_256, whirlpool

复制代码

样本数据

本节中的所有示例都使用相同的示例数据:

# hashlib_data.py 

import hashlib

lorem = ‘‘‘Lorem ipsum dolor sit amet, consectetur adipisicing
elit, sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis nostrud exercitation
ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis
aute irure dolor in reprehenderit in voluptate velit esse cillum
dolore eu fugiat nulla pariatur. Excepteur sint occaecat
cupidatat non proident, sunt in culpa qui officia deserunt
mollit anim id est laborum.’’’

复制代码

MD5 示例

要计算数据块(此处为转换为字节字符串的 unicode 字符串)的 MD5 哈希或摘要,首先创建哈希对象,然后添加数据并调用 digest()hexdigest()

import hashlib

from hashlib_data import lorem

h = hashlib.md5()
h.update(lorem.encode(‘utf-8’))
print(h.hexdigest()) # 3f2fd2c9e25d60fb0fa5d593b802b7a8

复制代码

此例使用 hexdigest() 方法而不是 digest(),因为输出已格式化,因此可以清晰地打印。如果二进制摘要值可以接受,请使用digest()

SHA1 示例

SHA1 摘要以相同的方式计算。

import hashlib

from hashlib_data import lorem

h = hashlib.sha1()
h.update(lorem.encode(‘utf-8’))
print(h.hexdigest()) # ea360b288b3dd178fe2625f55b2959bf1dba6eef

复制代码

摘要值在此示例中是不同的,因为算法从 MD5 更改为 SHA1。

按名称创建哈希

有时,在字符串中按名称引用算法比通过直接使用构造函数更方便。例如,将哈希类型存储在配置文件中。在这种情况下,用 new() 创建哈希对象。

# hashlib_new.py 

import argparse
import hashlib
import sys

from hashlib_data import lorem

parser = argparse.ArgumentParser(‘hashlib demo’)
parser.add_argument(
‘hash_name’,
choices=hashlib.algorithms_available,
help=‘the name of the hash algorithm to use’,
)
parser.add_argument(
‘data’,
nargs=‘?’,
default=lorem,
help=‘the input data to hash, defaults to lorem ipsum’,
)
args = parser.parse_args()

h = hashlib.new(args.hash_name)
h.update(args.data.encode(‘utf-8’))
print(h.hexdigest())

# output
# $ python3 hashlib_new.py sha1
# ea360b288b3dd178fe2625f55b2959bf1dba6eef
#
# $ python3 hashlib_new.py sha256
#
# 3c887cc71c67949df29568119cc646f46b9cd2c2b39d456065646bc2fc09ffd8
#
# $ python3 hashlib_new.py sha512
#
# a7e53384eb9bb4251a19571450465d51809e0b7046101b87c4faef96b9bc904cf7f90
# 035f444952dfd9f6084eeee2457433f3ade614712f42f80960b2fca43ff
#
# $ python3 hashlib_new.py md5
#
# 3f2fd2c9e25d60fb0fa5d593b802b7a8

复制代码

增量更新

update() 可以重复调用哈希计算器的方法。每次,摘要都会根据输入的附加文本进行更新。逐步更新比将整个文件读入内存更有效,并产生相同的结果。

import hashlib

from hashlib_data import lorem

h = hashlib.md5()
h.update(lorem.encode(‘utf-8’))
all_at_once = h.hexdigest()

def chunkize(size, text):
“Return parts of the text in size-based increments.”
start = 0
while start < len(text):
chunk = text[start:start + size]
yield chunk
start += size
return

h = hashlib.md5()
for chunk in chunkize(64, lorem.encode(‘utf-8’)):
h.update(chunk)
line_by_line = h.hexdigest()

print(‘All at once :’, all_at_once) # All at once : 3f2fd2c9e25d60fb0fa5d593b802b7a8
print(‘Line by line:’, line_by_line) # Line by line: 3f2fd2c9e25d60fb0fa5d593b802b7a8
print(‘Same :’, (all_at_once == line_by_line)) # Same : True

复制代码

相关文档:

pymotw.com/3/hashlib/i…

  • python

    Python (发音:[ paiθ(ə)n; (US) paiθɔn ]n. 蟒蛇,巨蛇 ),是一种面向对象的解释性的计算机程序设计语言,也是一种功能强大而完善的通用型语言,已经具有十多年的发…

    7951 引用 • 22 回帖 • 2 关注
感谢    赞同    分享    收藏    关注    反对    举报    ...