摘要:
任务内容 1.信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 2.决策树的不同分类算法(ID3算法、C4.5、CART分类树)的原理及应用场景 3.回归树原理 4.决策树防止过拟合手段 5.模型评估 6.sklearn参数详解Python绘制决策树 具体解释 信息论基础(熵 联合熵 条件熵 阅读全文
摘要:
文章来源:https://nbviewer.jupyter.org/github/justmarkham/pandas videos/blob/master/pandas.ipynb 方法:用括号调用 属性:用.属性调用 阅读全文
摘要:
任务内容 1、逻辑回归与线性回归的联系与区别 2、 逻辑回归的原理 3、逻辑回归损失函数推导及优化 4、 正则化与模型评估指标 5、逻辑回归的优缺点 6、样本不均衡问题解决办法 7、sklearn参数 具体解释 逻辑回归与线性回归的联系与区别 二者都属于监督学习算法。但是线性回归解决回归问题,逻辑回 阅读全文
摘要:
今天碰到一个错误,一个字典取值报keyError, 一查看key, 字符串类型的数字后面多了小数点0, 变成了float的样子了。 发现了pandas一个坑:如果列有NAN,则默认给数据转换为float类型! 来源:https://stackoverflow.com/questions/396663 阅读全文
摘要:
任务内容:机器学习的一些概念 1. 有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证 2. 线性回归的原理 3. 线性回归损失函数、代价函数、目标函数 4. 优化方法(梯度下降法、牛顿法、拟牛顿法等) 5. 线性回归的评估指标 6. sklearn参数详解 具体解释: 阅读全文
摘要:
netstat用来查看系统当前系统网络状态信息,包括端口,连接情况等,常用方式如下: ,各参数含义如下: t : 指明显示TCP端口 u : 指明显示UDP端口 l : 仅显示监听套接字(LISTEN状态的套接字) p : 显示进程标识符和程序名称,每一个套接字/端口都属于一个程序 n : 不进行D 阅读全文
摘要:
当我们需要一次执行多个命令的时候,命令之间需要用连接符连接,不同的连接符有不同的效果。下面我们总结一下,加以区分。 (1) ; 分号,没有任何逻辑关系的连接符。当多个命令用分号连接时,各命令之间的执行成功与否彼此没有任何影响,都会一条一条执行下去。 (2) || 逻辑或,当用此连接符连接多个命令时, 阅读全文
摘要:
保持竞争力 技术这个行业发展迅速、变化太快,每年也都有无数相关行业毕业生加入竞争,稍不留神就会被赶上甚至超越。所以我们无时无刻都得保持竞争力。 多的谈不上,我只能谈下目前我在做的事情: 打好基础。不是学了之后就忘了,需要不停的去看,巩固,基础是万变不离其宗的。 多看源码,了解原理,不要停留在调参侠的 阅读全文
摘要:
match 从首字母开始开始匹配,string如果包含pattern子串,则匹配成功,返回Match对象,失败则返回None,若要完全匹配,pattern要以$结尾。 search 若string中包含pattern子串,则返回Match对象,否则返回None,注意,如果string中存在多个pat 阅读全文
摘要:
作者:严肃 链接:https://www.zhihu.com/question/19732473/answer/20851256 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 “阻塞”与"非阻塞"与"同步"与“异步"不能简单的从字面理解,提供一个从分布式系统角度的 阅读全文
摘要:
Docker的优势: 环境依赖问题 更轻量的虚拟化,节省了虚拟机的性能损耗 Docker应用场景: 程序分发,gitlab的安装很恶心吧,所以有人做了gitlab的image 部署发布,这点对运维的同学很有帮助 阅读全文
摘要:
Linux的每个文件中,依据权限分为使用者、群组与其他人三种身份; 群组最有用的功能之一,就是当你在团队开发资源的时候,且每个账号都可以有多个群组的支持; 利用ls l显示的文件属性中,第一个字段是文件的权限,共有十个位,第一个位是文件类型, 接下来三个为一组共三组,为使用者、群组、其他人的权限,权 阅读全文
摘要:
基本素养 "如何聪明的提问" 面试方法 "从面试官角度来告诉大家,哪些人能面试成功" "如何在面试中介绍自己的项目经验" 计算机系统 " 【面试】 迄今为止把同步/异步/阻塞/非阻塞/BIO/NIO/AIO讲的这么清楚的好文章(快快珍藏)" 网络相关 "天下无难试之HTTP协议面试***难大全" "HT 阅读全文
摘要:
一句话 程序语言要进行词法分析,判断是变量还是数字。如果人为规定变量名不以数字开头,从工程上来看会大大减少判断的复杂度,它只要判断第一个如果为数字则不可能为变量。 复杂点的解释 作者:叶晓斌 因为每次输入“头符号”后要判断该符号是数字还是字符,如果是数字,则可以直接跳入数字处理的模块,若是字符则按变 阅读全文
摘要:
参考来源:https://stackoverflow.com/questions/9055371/python and pyaml yaml scanner scannererror mapping values are not allowed her 前几天使用Flask swagger进行api 阅读全文