Bitcoin 涉及到的数据结构和算法分析

Bitcoin

2008 年中本聪提出 Bitcoin 的概念。

2009 年项目上线。

所有 coin 由 mining 产生,一共 2100 万枚。通过调整 difficulty, 确保每隔10min 产生新的 block。

PoW + chaining,使得修改交易记录基本不可能。

 

Bitcoin 由四部分组成:

  • 去中心化的 P2P 网络( bitcoin 协议 )
  • 公开的交易账本( blockchain ,区块链 )
  • 用于交易验证和货币发行的一套规则( consensus rules,共识规则 )
  • 选择全局认同的区块链( PoW algo,工作量证明)

 

Merkle tree : hash tree

leaf node: hash(data block)

non-leaf node: hash(children nodes)

hash tree 的优点:高效、安全地验证数据内容。

确定一个叶子节点是否属于一棵二叉树:O(log(# leaf nodes))。

hash list: O(# leaf nodes)。

Uses:确定数据 undamaged,unaltered,not fake。Git/Mercurial 使用了 Merkle tree。

 Merkle tree

 

Cryptographic hash function

Mathematical algorithm: 将任意长度的数据转换为固定长度的比特字符串。

one-way function: message->hash 很容易, 但 hash->message 很难,几乎不可能。

 

输入数据:message。

输出数据:hash value (hash,message digest,digest)

 

理想的 cryptographic hash function 具有 5 个性质:

1. deterministic,确定性/唯一性。相同的输入总会得到相同的 hash。

2. 可以很快计算出任一给定 message 的 hash value。

3. 从 hash value 反推出 message 是不可行的。除了尝试所有可能的 message(暴力破解)。

4. 如果 message 有了很小的变化,那么 hash value 会有很大的变化(雪崩效应,这一点与 simhash 相反)。

5. 找到具有相同的 hash value 的 两个不同的 message 是不可行的。

 

cryptographic hash function 也可用于快速查找,不过成本比较高。

cryptographic hash function 的安全级别有以下几个性质:

1. Pre-image resistence

从 hash value 找出 message 很难。

2. Second pre-image resistence

给定 m1,很难找到一个不同的 m2,满足 hash(m1) = hash(m2)。

3. Collision resistence

很难找到两个不同的 m1、m2,满足 hash(m1) = hash(m2)。

要求 hash value 的长度是 pre-image resistence 需要的两倍。不然会在 birthday attack 中发生碰撞。

 

Public key cryptography

  • prime number exponentiation
  • elliptic curve multiplication

 

 

Diffie-Hellman key exchange agreement(Merkle 提出相关概念)

在 public channel 上安全地交换 cryptographic key。

和 RSA 一样,是一种 public key encryption algo。

 

private key -> digital signature / witness

public key -> digital fingerprint / bitcoin address

public key -> SHA256 -> RIPEMD160 -> public key hash -> Base58check Encode

 

posted @ 2018-05-15 08:45  赫尔修斯  阅读(313)  评论(0编辑  收藏  举报