04 2020 档案
摘要:sudo vim /etc/apt/sourcellist deb http://mirrors.163.com/ubuntu/ precise main universerestricted multiverse deb-src http://mirrors.163.com/ubuntu/ pre
阅读全文
摘要:下载docker后,当需要push镜像到公司仓库或者私有仓库时,需要先login. 1. 登录时,出现了 hadoop@slave3:/etc/docker$ docker login xxxxx Username: dingheng Password: Error response from da
阅读全文
摘要:1. 查看日志,找到出错位置。 源码位置:hbase-0.94.11\src\main\java\org\apache\hadoop\hbase\master\AssignmentManager.java 1879 可以看到,问题是由于把某个region进行transit过程中出现了错。 造成的原因
阅读全文
摘要:1. Docker的安装(ubuntu) https://www.cnblogs.com/dhName/p/12753938.html 2. Docker的配置 https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors 3. 三个概念。
阅读全文
摘要:1 . 卸载旧版docker.io旧版本的Docker被称作docker或者docker-engine,Docker CE(社区版)包现在被叫做docker-ce。如果之前安装过了,需要先卸载: sudo apt-get remove docker docker-engine docker.io#有
阅读全文
摘要:安装完docker后,执行docker相关命令,出现: ”Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get http://%2Fv
阅读全文
摘要:概述 今天晚上7.00-8.00参加了阿里巴巴集团的算法工程师--自然语言处理的笔试题,谈几点感受,仅记录这忙碌的一天。 要求 要求录制屏幕,关闭所有通信和其他网页,手机扫码锁定手机,反正你能想到的作弊手段基本给你搞没了,足见大厂的严格。 内容 内容为两道算法题。平常也刷一些leetcode,优先队
阅读全文
摘要:1. 什么是决策树 1.1 决策树的基本思想 其实用一下图片能更好的理解LR模型和决策树模型算法的根本区别,我们可以思考一下一个决策问题:是否去相亲,一个女孩的母亲要给这个女海介绍对象。 大家都看得很明白了吧!LR模型是一股脑儿的把所有特征塞入学习,而决策树更像是编程语言中的if-else一样,去做
阅读全文
摘要:1. 什么是逻辑回归 逻辑回归是用来做分类算法的,大家都熟悉线性回归,一般形式是Y=aX+b,y的取值范围是[-∞, +∞],有这么多取值,怎么进行分类呢?不用担心,伟大的数学家已经为我们找到了一个方法。 也就是把Y的结果带入一个非线性变换的Sigmoid函数中,即可得到[0,1]之间取值范围的数S
阅读全文
摘要:1.什么是线性回归 线性:两个变量之间的关系是一次函数关系的——图象是直线,叫做线性。 非线性:两个变量之间的关系不是一次函数关系的——图象不是直线,叫做非线性。 回归:人们在测量事物的时候因为客观条件所限,求得的都是测量值,而不是事物真实的值,为了能够得到真实值,无限次的进行测量,最后通过这些测量
阅读全文
摘要:在优秀的词嵌入方法出现之前,潜在语义分析模型(LSA)和文档主题生成模型(LDA)都是解决自然语言问题的好方法。LSA模型和LDA模型有相同矩阵形式的词袋表示输入。不过,LSA模型专注于降维,而LDA模型专注于解决主题建模问题。 在自然语言理解任务中,我们可以通过一系列的层次来提取含义——从单词、句
阅读全文
摘要:1. 递归形式: 1 def Levenshtein_Distance_Recursive(str1, str2): 2 3 if len(str1) == 0: 4 return len(str2) 5 elif len(str2) == 0: 6 return len(str1) 7 elif
阅读全文
摘要:环境: windows 10 python 3.5 GTX 1660Ti tensorflow-gpu 1.13.1 numpy 1.18.1 1. 首先下载google开源的预训练好的model。我本次用的是 BERT-Base, Uncased(第一个) BERT-Base, Uncased:
阅读全文
摘要:trie人称字典树,又称前缀树,是一个比较高效的字符串检索的存储方式。 trie的应用可以详见leetcode。 DoubleArrayTrie是一个trie的升级版,通过两个数组来实现trie。性能有所提高。 https://www.cnblogs.com/zhangchaoyang/articl
阅读全文
摘要:本次调研3种工具pinyin4j;jpinyin;hanlp。经过从 运行时间;词典维护代价;源代码社区活跃程度及更新速度 几方面考虑,推荐使用hanlp进行汉语转拼音。 1. Pinyin4j 虽然此jar包描述信息包括可以对多音字进行识别,但是其处理逻辑是对多音字取第一个拼音。例如”长”的拼音数
阅读全文