摘要: 判断一段文本中是否包含一个字典中的某个词 布隆算法 什么情况下需要布隆过滤器?--避免高内存 先来看几个比较常见的例子 字处理软件中,需要检查一个英语单词是否拼写正确 在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上 在网络爬虫里,一个网址是否被访问过 yahoo, gmail等邮箱垃圾邮件过滤功能 阅读全文
posted @ 2019-08-26 09:22 cup_leo 阅读(1625) 评论(0) 推荐(0) 编辑
摘要: # pip install pywin32com# ppt太大会读取失败import win32com from win32com.client import Dispatch, constants import os path=r'C:\Users\mzj\Desktop\ppt' def ppt_text(p): ppt = win32com.client.Dispatch('PowerPoi 阅读全文
posted @ 2019-08-24 20:20 cup_leo 阅读(2762) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python # encoding: utf-8 """ @author: wayne @file: file_type.py @time: 2018/11/13 19:46 """ import os """ 通过给定目录,统计所有的不同子文件类型及占用内存 """ size_dict = {} type_dict = {} def get_size_type(pa 阅读全文
posted @ 2019-08-24 09:26 cup_leo 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 字典树 原来讲明白了剩下的就是具体实现了,最适合存储和计算词频的数据结构就是字典树,这里给一个讲解的很清楚的链接 具体代码 代码已开源,需要的点击这个Github 阅读全文
posted @ 2019-08-23 16:17 cup_leo 阅读(1514) 评论(1) 推荐(0) 编辑
摘要: 原文: https://segmentfault.com/a/1190000016059726 当然,首先我们得载入模块,在notebook中使用tqdm带的基于Js显示的进度条前,请务必检查是否安装ipywidgets模块。 其中第一行载入的两个方法的作用分别是: tqdm_notebook:用来 阅读全文
posted @ 2019-08-19 20:05 cup_leo 阅读(2523) 评论(0) 推荐(0) 编辑
摘要: https://stackoverflow.com/questions/41746137/conda-environment-is-discoverable-but-not-activateable-when-activate-is-a-bash You can list all discovera 阅读全文
posted @ 2019-08-18 16:38 cup_leo 阅读(3952) 评论(0) 推荐(0) 编辑
摘要: 我这边官网下载的特别慢,提供一下云盘下载安装包: 链接:http://pan.baidu.com/s/1sl2YGbz 密码:p1vj windows下的我也下载了 链接:http://pan.baidu.com/s/1i5aOOol 密码:guvv 首先 安装依赖包 sudo apt-get in 阅读全文
posted @ 2019-08-16 21:02 cup_leo 阅读(1372) 评论(1) 推荐(1) 编辑
摘要: Ubuntu16.04下安装多版本cuda和cudnn 原文 https://blog.csdn.net/tunhuzhuang1836/article/details/79545625 前言 因为之前针对Pytorch,caffe,torch等,装了cuda8.0和对应cudnn5.1,但是最近在 阅读全文
posted @ 2019-08-15 10:44 cup_leo 阅读(896) 评论(0) 推荐(0) 编辑
摘要: 数据集地址 https://blog.ailemon.me/2018/11/21/free-open-source-chinese-speech-datasets/ 阅读全文
posted @ 2019-08-14 14:34 cup_leo 阅读(905) 评论(0) 推荐(0) 编辑
摘要: train loss与test loss结果分析 train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,test loss趋于不变,说明网络过拟合; train loss 趋于不变,test loss不断下降,说明数据集100%有问题; tr 阅读全文
posted @ 2019-08-14 08:45 cup_leo 阅读(524) 评论(0) 推荐(0) 编辑