摘要: > 文本相似度算法## minhash[minhash](https://baike.baidu.com/item/MinHash)```1. 把文档A分词形成分词向量L2. 使用K个hash函数,然后每个hash将L里面的分词分别进行hash,然后得到K个被hash过的集合3. 分别得到K个集合中的最小hash,然后组成一个长度为K的hash集合4. 最后用Jaccard index求出两篇文档... 阅读全文
posted @ 2017-11-30 22:13 白云辉 阅读(2197) 评论(0) 推荐(0) 编辑
摘要: ## 合约编译```#!/usr/bin/env python# coding: utf8import jsonimport os# Solc Compilerfrom functools import reduceSOLC = "solc"BASE_PATH = os.path.dirname(os.path.abspath(__file__))src_dir = os.path.join(BA... 阅读全文
posted @ 2017-11-30 18:53 白云辉 阅读(535) 评论(0) 推荐(0) 编辑