比特币地址生成算法详解

1 生成过程

比特币地址生成流程如下图所示:

 

第一步,随机选取一个32字节的数,大小介于1~0xFFFF FFFF FFFF FFFF FFFF FFFF FFFF FFFE BAAE DCE6 AF48 A03B BFD2 5E8C D036 4141之间,作为私钥

18e14a7b6a307f426a94f8114701e7c8e774e7f9a47e2c2035db29a206321725

第二步,使用椭圆曲线加密算法(ECDSA-SECP256k1)计算私钥所对应的非压缩公钥(共65字节,1字节0x04,32字节为x坐标,32字节为y坐标)。

0450863AD64A87AE8A2FE83C1AF1A8403CB53F53E486D8511DAD8A04887E5B23522CD470243453A299FA9E77237716103ABC11A1DF38855ED6F2EE187E9C582BA6

第三步,计算公钥的SHA-256哈希值

600FFE422B4E00731A59557A5CCA46CC183944191006324A447BDB2D98D4B408

第四步,计算上一步哈希值的RIPEMD-160哈希值

010966776006953D5567439E5E39F86A0D273BEE

第五步,在上一步结果之间加入地址版本号(如比特币主网版本号"0x00")

00010966776006953D5567439E5E39F86A0D273BEE

第六步,计算上一步结果的SHA-256哈希值

445C7A8007A93D8733188288BB320A8FE2DEBD2AE1B47F0F50BC10BAE845C094

第七步,再次计算上一步结果的SHA-256哈希值

D61967F63C7DD183914A4AE452C9F6AD5D462CE3D277798075B107615C1A8A30

第八步,取上一步结果的前4个字节(8位十六进制数)D61967F6,把这4个字节加在第五步结果的后面,作为校验(这就是比特币地址的16进制形态)

00010966776006953D5567439E5E39F86A0D273BEED61967F6

第九步,用base58表示法变换一下地址(这就是最常见的比特币地址形态)

16UwLL9Risc3QfPqBUvKofHmBQ7wMtjvM

下面给出比特币地址生成的python源码

 1 import hashlib
 2 from ecdsa import SECP256k1, SigningKey
 3 import sys
 4 import binascii
 5 
 6 # 58 character alphabet used
 7 BASE58_ALPHABET = '123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz'
 8 
 9 def from_bytes (data, big_endian = False):
10     if isinstance(data, str):
11         data = bytearray(data)
12     if big_endian:
13         data = reversed(data)
14     num = 0
15     for offset, byte in enumerate(data):
16         num += byte << (offset * 8)
17     return num
18     
19 def base58_encode(version, public_address):
20     """
21     Gets a Base58Check string
22     See https://en.bitcoin.it/wiki/Base58Check_encoding
23     """
24     if sys.version_info.major > 2:
25         version = bytes.fromhex(version)
26     else:
27         version = bytearray.fromhex(version)
28     firstSHA256 = hashlib.sha256(version + public_address)
29     print("first sha256: %s"%firstSHA256.hexdigest().upper())
30     secondSHA256 = hashlib.sha256(firstSHA256.digest())
31     print("second sha256: %s"%secondSHA256.hexdigest().upper())
32     checksum = secondSHA256.digest()[:4]
33     payload = version + public_address + checksum
34     print("Hex address: %s"%binascii.hexlify(payload).decode().upper())
35     if sys.version_info.major > 2:
36         result = int.from_bytes(payload, byteorder="big")
37     else:
38         result = from_bytes(payload, True)
39     # count the leading 0s
40     padding = len(payload) - len(payload.lstrip(b'\0'))
41     encoded = []
42 
43     while result != 0:
44         result, remainder = divmod(result, 58)
45         encoded.append(BASE58_ALPHABET[remainder])
46 
47     return padding*"1" + "".join(encoded)[::-1]
48 
49 def get_private_key(hex_string):
50     if sys.version_info.major > 2:
51         return bytes.fromhex(hex_string.zfill(64))
52     else:
53         return bytearray.fromhex(hex_string.zfill(64))
54 
55 def get_public_key(private_key):
56     # this returns the concatenated x and y coordinates for the supplied private address
57     # the prepended 04 is used to signify that it's uncompressed
58     if sys.version_info.major > 2:
59         return (bytes.fromhex("04") + SigningKey.from_string(private_key, curve=SECP256k1).verifying_key.to_string())
60     else:
61         return (bytearray.fromhex("04") + SigningKey.from_string(private_key, curve=SECP256k1).verifying_key.to_string())
62 
63 def get_public_address(public_key):
64     address = hashlib.sha256(public_key).digest()
65     print("public key hash256: %s"%hashlib.sha256(public_key).hexdigest().upper())
66     h = hashlib.new('ripemd160')
67     h.update(address)
68     address = h.digest()
69     print("RIPEMD-160: %s"%h.hexdigest().upper())
70     return address
71 
72 if __name__ == "__main__":
73     #private_key = get_private_key("FEEDB0BDEADBEEF")
74     private_key = get_private_key("18e14a7b6a307f426a94f8114701e7c8e774e7f9a47e2c2035db29a206321725")
75     print("private key: %s"%binascii.hexlify(private_key).decode().upper())
76     public_key = get_public_key(private_key)
77     print("public_key: %s"%binascii.hexlify(public_key).decode().upper())
78     public_address = get_public_address(public_key)
79     bitcoin_address = base58_encode("00", public_address)
80     print("Final address %s"%bitcoin_address)

执行过程如下:

 2 关键问题

2.1 base58编码

Base58编码是一种二进制转可视字符串的算法,主要用来转换大整数,将整数字节流转换为58编码流,实际上它就是整数的58进制,和2进制、8进制、16进制是一样的道理,只是用58作为进制的单位了,正好和58个不容易混淆的字符对应,比特币所用的字符表如下:

123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz

该表去除了几个看起来会产生歧义的字符,如0(零)和O(大写字母O),I(大写的字母i)和l(小写的字母L)等。另外,比特币在实现base58编码时,开头的0做了特殊处理,所以可以将输入流开头的0直接填充到结果前边。以00000000000000000000000000000000000000000094a00911为例,最后非零整数为0x94a00911(2493516049),2493516049除以58商是42991656余数是1,1对应的base58编码是2,42991656除以58商是741235余数是26,26对应的base58编码是T,741235除以58商是12779余数是53,53对应的base58编码是v,12779除以58商是220余数是19,19对应的base58编码是L,220除以58商是3余数是46,46对应的base58编码是o,3对应的base58编码是4,000000000000000000000000000000000000000000对应着21字节的0,所以最终的base48编码为1111111111111111111114oLvT2。

2.2 比特币地址个数

而从比特币地址的生成过程可知,第四步RIPEMD-160算法的结果是20字节(160位)的数,该步是比特币地址的最小限制,所以理论上来说比特币合法地址总是应该是2^160个。另外比特币私钥是32字节(256位)的随机数,并且有一定大小范围的限制,所以合法的比特币私钥个数介于2^255~2^256之间,从而可以看出私钥个数远远大于比特币地址数,所以理论上应该存在多个私钥对应同一地址的情况。

2.3 比特币地址长度

一般BTC地址的长度是34位,也有33位,其实可以通过推理可知(当地址版本为00时),BTC最短长度是26位,最长长度是34位。由第1节第八步可知比特币地址的16进制形态有25个字节,所以理论上最短的地址应该是16进制地址00000000000000000000000000000000000000000000000000对应的base58编码地址1111111111111111111111111,但是由第八步可知以上所说的16进制地址的最后4个字节对应的是0000000000000000000000000000000000000000的两次哈希的最后4个字节即94a00911,所以对应的地址是00000000000000000000000000000000000000000094a00911对应的base58编码地址1111111111111111111114oLvT2,其长度是27位,该地址也是所谓的“燃烧地址”(burn address),BTC地址的正常推导过程是:私钥==>公钥==>Hash160<==>地址,Hash160是没有规则的字符串,我们可以随便提供个Hash160值,从半截腰上直接推导地址:Hash160<==>地址,这时候要想花费该地址上对应的比特币,必须知道Hash160串对应的私钥,而这近乎是一个无解的难题,没有私钥该地址就只能进不能出,进入的币再也不可用了,就像燃料被烧掉了一样, 非常形象。

从上图可以看出,仅仅从2017年9月21日到2018年9月21日,就有9424位“土豪”向该地址发送9424次比特币,如果从2010年8月10日的第一笔交易算起,一共向该地址转入了53439次比特币,总量达66.68个比特币,以当前比特币价格这些币价值人民币300万左右。接着上面比特币地址长度的问题进行讨论,排除掉25字节16进制全零地址以后,后一个有可能是最短地址应该是16进制地址00000000000000000000000000000000000000000100000000对应的58编码地址,但是0000000000000000000000000000000000000001的二次哈希最后4个字节是9d35b5b9,所以相应的实际BTC地址是0000000000000000000000000000000000000000019d35b5b9对应的base58编码地址11111111111111111111BZbvjr,其长度是26位,当前该地址里也有0.01028个被“燃烧”掉的比特币,如下图(BTC.com竟然查不到该地址的余额):

 接下来继续分析比特币地址最长可能,应该是00fffffffffffffffffffffffffffffffffffffffffa06820b,最后4个字节是fffffffffffffffffffffffffffffffffffffffff两次哈希结果的后4个字节,对应的base58编码地址为1QLbz7JHiBTspS962RLKV8GndWFwi5j6Qr,该地址同样是“燃烧地址”,共转入51次比特币,总数是0.012495个,如下图:

 

3 源码分析

 BTC源码中由PubKeyToAddress将比特币公钥转换为base58编码的字符串地址。

1 inline string PubKeyToAddress(const vector<unsigned char>& vchPubKey)
2 {
3     return Hash160ToAddress(Hash160(vchPubKey));
4 }

在PubKeyToAddress函数中,会先调用Hash160对公钥进行SHA256和RIPEMD160哈希运算,即对应生成过程的第三、四步。

1 inline uint160 Hash160(const vector<unsigned char>& vch)
2 {
3     uint256 hash1;
4     SHA256(&vch[0], vch.size(), (unsigned char*)&hash1);
5     uint160 hash2;
6     RIPEMD160((unsigned char*)&hash1, sizeof(hash1), (unsigned char*)&hash2);
7     return hash2;
8 }

之后调用Hash160ToAddress来处理生成的哈希结果,在Hash160ToAddress函数中首先会把版本加到哈希结果的最前面(第五步),之后调用EncodeBase58Check,该函数中13行会调用Hash函数来进行两次哈希运行(第六、七步)并附加两次哈希结果的最后四个字节(校验用),最后调用EncodeBase58做最终的base58编码转换,主要代码如下:

 1 inline string Hash160ToAddress(uint160 hash160)
 2 {
 3     // add 1-byte version number to the front
 4     vector<unsigned char> vch(1, ADDRESSVERSION);
 5     vch.insert(vch.end(), UBEGIN(hash160), UEND(hash160));
 6     return EncodeBase58Check(vch);
 7 }
 8 
 9 inline string EncodeBase58Check(const vector<unsigned char>& vchIn)
10 {
11     // add 4-byte hash check to the end
12     vector<unsigned char> vch(vchIn);
13     uint256 hash = Hash(vch.begin(), vch.end());
14     vch.insert(vch.end(), (unsigned char*)&hash, (unsigned char*)&hash + 4);
15     return EncodeBase58(vch);
16 }
17 
18 inline string EncodeBase58(const unsigned char* pbegin, const unsigned char* pend)
19 {
20     CAutoBN_CTX pctx;
21     CBigNum bn58 = 58;
22     CBigNum bn0 = 0;
23 
24     // Convert big endian data to little endian
25     // Extra zero at the end make sure bignum will interpret as a positive number
26     vector<unsigned char> vchTmp(pend-pbegin+1, 0);
27     reverse_copy(pbegin, pend, vchTmp.begin());
28 
29     // Convert little endian data to bignum
30     CBigNum bn;
31     bn.setvch(vchTmp);
32 
33     // Convert bignum to string
34     string str;
35     str.reserve((pend - pbegin) * 138 / 100 + 1);
36     CBigNum dv;
37     CBigNum rem;
38     while (bn > bn0)
39     {
40         if (!BN_div(&dv, &rem, &bn, &bn58, pctx))
41             throw bignum_error("EncodeBase58 : BN_div failed");
42         bn = dv;
43         unsigned int c = rem.getulong();
44         str += pszBase58[c];
45     }
46 
47     // Leading zeroes encoded as base58 zeros
48     for (const unsigned char* p = pbegin; p < pend && *p == 0; p++)
49         str += pszBase58[0];
50 
51     // Convert little endian string to big endian
52     reverse(str.begin(), str.end());
53     return str;
54 }
Hash160ToAddress

参考网址:

http://8btc.com/article-1929-1.html

 

posted @ 2018-09-25 12:31  weiwei22844  阅读(15038)  评论(0编辑  收藏  举报