随笔分类 -  常见算法

摘要:from Crypto.PublicKey import RSA from Crypto.Cipher import PKCS1_OAEP # 生成 RSA 密钥对 def generate_rsa_keys(): """ 公钥是通过特定算法从私钥导出的,可以安全地公开。 公钥用于加密数据或验证签名 阅读全文
posted @ 2024-12-05 16:27 PythonNew_Mr.Wang 阅读(29) 评论(0) 推荐(0) 编辑
摘要:相似度计算 # 输入A,B两段语句,判断相似度 import jieba from collections import Counter def preprocess_data(text): """数据预处理函数,分词并去除停用词""" # 使用结巴分词对文本进行分词 words = jieba.c 阅读全文
posted @ 2024-02-28 17:33 PythonNew_Mr.Wang 阅读(161) 评论(0) 推荐(0) 编辑
摘要:正向最大匹配 def forward_match(text,item_dict): """ :param text: 分词文本 :param item_dict: 指导分词 """ resList = [] # 存放结果 LongWord = max([len(word) for word in i 阅读全文
posted @ 2023-10-30 15:37 PythonNew_Mr.Wang 阅读(159) 评论(0) 推荐(0) 编辑
摘要:// 按顺序比较大小 public class equals_线性查询 { public static void main(String[] args) { String[] arr = new String[]{"AA", "BB", "CC", "DD", "FF"}; String dest 阅读全文
posted @ 2020-12-09 10:45 PythonNew_Mr.Wang 阅读(107) 评论(0) 推荐(0) 编辑
摘要:1:公式 2:实例 2-1:实例文章标题 2-2:每个关键词出现的次数(人为分辨) 2-3:S = T*S*D(也就是上面这个图的分解,公式分辨) 2-4:得出的二维图:(这里做下解释。如果两个文章的夹角越小,那么这两个文章越相似) 2-5:计算相似度:向量模型 (将原始数据降为二维空间的数值,再进 阅读全文
posted @ 2020-05-26 17:05 PythonNew_Mr.Wang 阅读(370) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示