摘要: 本博客主要摘录了《机器学习实战》里面对各个算法的总结 K 近邻算法 优点 精度高、对异常值不敏感、无数据输入假定 缺点 计算复杂度高、空间复杂度高 适用范围 数值型和标称型 决策树 优点 计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 缺点 可能会产生过度匹配的问题 阅读全文
posted @ 2017-11-04 15:25 james+zhao 阅读(561) 评论(0) 推荐(0) 编辑
摘要: 这篇博客是对Java垃圾回收的总结,主要是对 "Java Garbage Collection Introduction" 以及后续的三篇博客的翻译。我把这四篇博客翻译到这一篇博客里,把参考的其他博客的链接附在文章末尾。 Java Garbage Collection Introduction 在J 阅读全文
posted @ 2017-06-04 11:10 james+zhao 阅读(3056) 评论(0) 推荐(0) 编辑
摘要: 这篇博客主要对PostgreSQL进行总结,内容偏基础。 这里先附上一个PostgreSQL的中文资源: "PostgreSQL 8.1 中文文档" 。英文不好的同学可以看看这个。 安装PostgreSQL 安装PostgreSQL客户端 安装PostgreSQL服务器 安装图形管理界面 Postg 阅读全文
posted @ 2017-05-25 20:37 james+zhao 阅读(640) 评论(0) 推荐(0) 编辑
摘要: 最近在学习Java Web,发现Java Web的概念很多,而且各个概念之间的关系也挺复杂,本篇博客把这些关系总结于此,主要参考的博客附在文章末尾。 概念 服务器 服务器,硬件角度上说就是一台高性能的计算机。我们通常指的服务器其实应该是装有能够处理具体请求事务的服务器软件的计算机。比如最常见的www 阅读全文
posted @ 2017-05-24 11:59 james+zhao 阅读(887) 评论(0) 推荐(0) 编辑
摘要: 这篇博客是对String的总结,注意,不是系统地讲解String方方面面,想学String的全部知识,看看Java编程思想的字符串这一章就行,这篇博客只是对String一些细节问题的总结。整篇博客会比较零散,我尽量系统地总结好,而且会持续更新。具体引用别人博客的地方,我会附上链接。 String, 阅读全文
posted @ 2017-05-23 18:17 james+zhao 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 降维在机器学习里面再正常不过了,这里总结了降维的一些方法,主要参考了陈利人老师的“数据分析领域中最为人称道的七种降维方法”(在微信公众号看到的,无法提供链接,有兴趣的可以搜索看原文)。不过这篇文章除了PCA,其他的降维方法多多少少有点特征工程的意思了。 缺失值比率 (Missing Values R 阅读全文
posted @ 2017-05-17 17:16 james+zhao 阅读(5587) 评论(0) 推荐(0) 编辑
摘要: 参加kaggle的都知道,特征处理比跑模型重要的多,在特征处理上的时间也更多,这里总结一下常见的特征处理方法,在书上或者博客上看见一些比较好的处理特征的方法,我就总结在这里,并注明出处,持续更新。。。 先看看特征工程的总体,下面这幅图来自 "一次kaggle的特征工程总结" ,后面的总结不像这幅图系 阅读全文
posted @ 2017-05-16 12:16 james+zhao 阅读(5820) 评论(1) 推荐(0) 编辑
摘要: 面试官一般在面试的最后,会问你一句还有什么问题吗。最开始我一般都会问你们主要做些什么,需要哪些技能。面试多了就感觉这个问题没有那么简单,所以稍微搜索了一下相关问题,总结一下。问题的主要答案来自知乎的 "为什么面试官在最后的面试中,都会问一句你还有什么问题吗,这个考察什么?" , "当面试官问「你有什 阅读全文
posted @ 2017-05-03 23:01 james+zhao 阅读(947) 评论(0) 推荐(0) 编辑
摘要: 本博客总结自各个博客,汇集于此。不定期更新。。。 1. 用一条SQL 语句 查询出每门课都大于80 分的学生姓名 name kecheng fenshu 张三 语文 81 张三 数学 75 李四 语文 76 李四 数学 90 王五 语文 81 王五 数学 100 王五 英语 90 解法1: sele 阅读全文
posted @ 2017-05-03 16:22 james+zhao 阅读(4142) 评论(0) 推荐(0) 编辑
摘要: 定义 马氏距离的定义相关资料太多了,我这里直接截图维基百科上的定义。 特点 马氏距离具有以下特点: 马氏距离不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关,即独立于测量尺度。采用数据预处理中的标准化和中心化等方法所获得的马氏距离相同; 马氏距离具有放大变化微小的变量的作用,这对于化学指纹 阅读全文
posted @ 2017-05-02 11:10 james+zhao 阅读(5084) 评论(0) 推荐(0) 编辑