2019年8月25日

LRU(Least Recently Used)算法的理解

摘要: https://blog.csdn.net/wydyd110/article/details/84023688 感谢 ,自己学习记笔记 内存里建立一个哈希表,后来数据多了,爆了。咋整呢? 一个算法,就是LRU,就是用最新的数据,不常用的数据就删掉(如果用的时候,再从数据库取。) 如果内存快爆了,就把 阅读全文

posted @ 2019-08-25 23:18 耀扬 阅读(655) 评论(0) 推荐(0) 编辑

红黑树二叉查找树二叉排序树的理解

摘要: https://blog.csdn.net/chudelong1/article/details/82698010 感谢,自己记个笔记 二叉查找树(BST)具备什么特性呢? 1.左结点小于或等于根结点的值。 2.右结点大于或等于根结点的值。 3.左、右子树也分别为二叉排序树。 查找 10 很方便查找 阅读全文

posted @ 2019-08-25 22:48 耀扬 阅读(729) 评论(0) 推荐(0) 编辑

elasticsearch原理学习笔记

摘要: https://mp.weixin.qq.com/s/dn1n2FGwG9BNQuJUMVmo7w 感谢,透彻的讲解 整理笔记 请说出 唐诗中 包含 前 的诗句 ...... 其实你都会,只是想不起来, “窗前明月光” 因为在你大脑中的 索引方式是 静夜思 床前明月光,疑是地上霜,举头望明月,低头思 阅读全文

posted @ 2019-08-25 14:24 耀扬 阅读(318) 评论(0) 推荐(0) 编辑

2019年8月22日

负样本的理解

摘要: https://www.cnblogs.com/rainsoul/p/7890641.html 总结一下学习笔记 如,做一个汽车的照片分类,正样本 就是 正确的 汽车的图片,负样本就是 不是 汽车的图片。 通过模型训练,可以告诉机器,那些是对的,哪些是错误的。错误的就是负样本。 针对与分类问题,正样 阅读全文

posted @ 2019-08-22 17:10 耀扬 阅读(2529) 评论(5) 推荐(1) 编辑

2019年8月21日

Softmax学习笔记

摘要: softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类! 他把一些输入映射为0-1之间的实数,并且归一化保证和为1,因此多分类的概率之和也刚好为1。 实际应用中,使用 Softmax 需要注意数值溢出的问题。因为有指数运算,如果 V 数值很 阅读全文

posted @ 2019-08-21 14:25 耀扬 阅读(219) 评论(0) 推荐(0) 编辑

2019年8月20日

学习贝叶斯定理

摘要: 感谢 https://mp.weixin.qq.com/s/YPUHWBPwRiH0N0AFNnIrmw 整理一下,学习笔记 贝叶斯定理是一种在已知其他概率的情况下求概率的方法: P(A|B) 是在 B 发生的情况下 A 发生的概率; P(A) 是 A 发生的概率; P(B|A) 是在 A 发生的情 阅读全文

posted @ 2019-08-20 23:59 耀扬 阅读(273) 评论(0) 推荐(0) 编辑

2019年8月15日

独热编码(One-Hot)的理解

摘要: https://www.imooc.com/article/35900 参考上面大神的原文,说的非常透彻。非常便于理解。感谢 感谢 自己做个小笔记,便于自己学习 特征值是离散的,无序的。 如: 性别特征:["男","女"] 祖国特征:["中国","美国,"法国"] 运动特征:["足球","篮球"," 阅读全文

posted @ 2019-08-15 18:11 耀扬 阅读(2780) 评论(0) 推荐(0) 编辑

2019年8月11日

全网独发gensim中similarities.Similarity用法

摘要: index = similarities.MatrixSimilarity(lsi[corpus]) # 管网的原文翻译如下: 警告:similarities.MatrixSimilarity类仅仅适合能将所有的向量都在内存中的情况。例如,如果一个百万文档级的语料库使用该类,可能需要2G内存与256 阅读全文

posted @ 2019-08-11 23:00 耀扬 阅读(7336) 评论(0) 推荐(0) 编辑

一个非常有趣的爬虫小练习带ocr识别的

摘要: 有个小的想法,想找一找 形近字 。百度一搜索,百度文库有一个,收费4元。而且我觉得字数不是太多。想自己弄一个,于是找到了 这个网站 http://www.fantiz5.com/xingjinzi/ 这里面据说字数很多,开练! 主要是为了学习 chrome,开发者调试 发现 有个 zhuan() 的 阅读全文

posted @ 2019-08-11 19:58 耀扬 阅读(1011) 评论(0) 推荐(0) 编辑

python中ocr软件pytesseract使用

摘要: 首先要看原版的参考 https://github.com/madmaze/pytesseract 直接上代码, import pytesseractfrom PIL import Image image = Image.open(r'D:\xingjinzi\5.jfif') result =pyt 阅读全文

posted @ 2019-08-11 17:26 耀扬 阅读(2003) 评论(0) 推荐(0) 编辑

2019年8月10日

笔记本用hdmi连接显示器后无法播放声音问题

摘要: 打开控制面板的声音选项,把默认播放音频的设备设置成笔记本扬声器。这种方法直接利用笔记本扬声器 上述三个选项全部启用 阅读全文

posted @ 2019-08-10 21:58 耀扬 阅读(2858) 评论(0) 推荐(0) 编辑

2019年8月9日

一个多进程爬虫下载图片的demo

摘要: import os,re import pickle import requests import random import time from bs4 import BeautifulSoup from multiprocessing import Pool user_agent_list = 阅读全文

posted @ 2019-08-09 21:20 耀扬 阅读(302) 评论(0) 推荐(0) 编辑

一个爬虫的demo,requests,beatuifulsoup使用的

摘要: 爬虫的demo,requests,beatuifulsoup import os,re import requests import random import time from bs4 import BeautifulSoup user_agent_list = [ "Mozilla/5.0 ( 阅读全文

posted @ 2019-08-09 18:57 耀扬 阅读(213) 评论(0) 推荐(0) 编辑

2019年8月8日

720全景拍摄经历

摘要: 第一次准备拍摄720全景。决定自己亲自上。 首先研究硬件方案,觉得那些现成的全景相机不一定靠谱,觉得采用第二套方案,用普通的单反+云台 自己拍的方案。 1、硬件采购 从淘宝上买了720云的云台和脚架。在此必须说,720云的脚架不好。 这种脚架只能起到升高的作用,不能起到稳定的作用。镜头在不停的晃动, 阅读全文

posted @ 2019-08-08 17:56 耀扬 阅读(991) 评论(0) 推荐(0) 编辑

python ocr中文识别库 tesseract安装及问题处理

摘要: 这个破东西,折腾了快1个小时,网上的教材太乱了。 我解决的主要是windows的问题 先下载exe。(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de/tesseract/ 选好自己的机型, 最新版的,可能会采坑啊 安装时可以添加支持的语言包,如下界 阅读全文

posted @ 2019-08-08 17:50 耀扬 阅读(5781) 评论(0) 推荐(0) 编辑

导航