02 2020 档案

【Python】垃圾回收机制
摘要:GC作为一个编程语言的自动内存管理机制,无非就是做俩件事:找到内存中不需要的对象,清除对象把内存空间空出来。一般谈起GC一般大家想起的是Java,但是Python也有,Python中采用的事引用计数为主,标记清除和分代回收为辅。 引用计数: Python里面万物皆对象,如果一个对象被另一个对象引用, 阅读全文

posted @ 2020-02-29 15:39 雪原那么远 阅读(177) 评论(0) 推荐(0) 编辑

【ML】数据清洗
摘要:之前听别人说,一个好的数据分析师80%的时间都花在数据清洗上,一个高质量的数据集才能支撑的了接下来的数据分析和应用。 什么是好的数据质量呢,我认为只要满足俩个方面就可以了: 1.完整:比如说 缺值少值,值不完整,NAN之类 2.合法:数据的类型,内容,大小是符合该特征的。比如,一个年龄的特征值不可能 阅读全文

posted @ 2020-02-25 20:39 雪原那么远 阅读(289) 评论(0) 推荐(0) 编辑

【ML】从Titannic说起一个完整机器学习的7步骤
摘要:一个机器学习主要要经过如下几步: 这么一讲比较抽象,我拿Kaggle比赛中的泰坦尼克生存率预测为例子: 收集数据:https://github.com/cystanford/Titanic_Data 该数据集一共有俩个文件: train.csv:训练集,包含特征信息,分类结果(存活与否) test. 阅读全文

posted @ 2020-02-24 21:36 雪原那么远 阅读(324) 评论(0) 推荐(0) 编辑

【MF】SVD
摘要:矩阵分解是推荐系统的主流思想之一,它的思想是把矩阵拆解为多个矩阵的乘积。 矩阵分解有俩种方法,分别是 EVD(特征值分解) 和 SVD(奇异值分解),在推荐系统中许多矩阵是非对称的,而且不是方阵,所以通常在应用过程中采用SVD。 如图所示,我们可以认为A是uer/iterm矩阵,通过矩阵分解,我们可 阅读全文

posted @ 2020-02-24 10:44 雪原那么远 阅读(365) 评论(0) 推荐(0) 编辑

【Java】内存
摘要:1.当使用直接赋值的方式实例化一个字符串对象的时候,他的引用是保存在哪里的? 首先要明确一点,只要是引用对象就保存在堆内存里面,而我们所有能够进行的内存控制,也只有堆内存。 JVM内存优化: 1.JVM内存优化的第一个问题,取消掉伸缩区,让total = max -CMS问题,频繁的CMD会导致性能 阅读全文

posted @ 2020-02-14 20:18 雪原那么远 阅读(136) 评论(0) 推荐(0) 编辑

【数据库】Mysql压缩包安装
摘要:下载地址: https://dev.mysql.com/downloads/mysql/ 在我下载了mysql以后,我发现我下载的是zip文件,并不能直接使用,则需要做一些额外操作。 1.解压到你希望安装的mysql的目录下,进入mysql文件夹,在文件夹下创建“ 一个文件夹 data 一个配置文件 阅读全文

posted @ 2020-02-13 19:43 雪原那么远 阅读(144) 评论(0) 推荐(0) 编辑

导航

点击右上角即可分享
微信分享提示