随笔分类 - 常见算法
摘要:from Crypto.PublicKey import RSA from Crypto.Cipher import PKCS1_OAEP # 生成 RSA 密钥对 def generate_rsa_keys(): """ 公钥是通过特定算法从私钥导出的,可以安全地公开。 公钥用于加密数据或验证签名
阅读全文
摘要:相似度计算 # 输入A,B两段语句,判断相似度 import jieba from collections import Counter def preprocess_data(text): """数据预处理函数,分词并去除停用词""" # 使用结巴分词对文本进行分词 words = jieba.c
阅读全文
摘要:正向最大匹配 def forward_match(text,item_dict): """ :param text: 分词文本 :param item_dict: 指导分词 """ resList = [] # 存放结果 LongWord = max([len(word) for word in i
阅读全文
摘要:// 按顺序比较大小 public class equals_线性查询 { public static void main(String[] args) { String[] arr = new String[]{"AA", "BB", "CC", "DD", "FF"}; String dest
阅读全文
摘要:1:公式 2:实例 2-1:实例文章标题 2-2:每个关键词出现的次数(人为分辨) 2-3:S = T*S*D(也就是上面这个图的分解,公式分辨) 2-4:得出的二维图:(这里做下解释。如果两个文章的夹角越小,那么这两个文章越相似) 2-5:计算相似度:向量模型 (将原始数据降为二维空间的数值,再进
阅读全文