摘要: OneHotEncoder独热编码和 LabelEncoder标签编码https://www.cnblogs.com/king-lps/p/7846414.html Dummy variable (变量dummy化)https://blog.csdn.net/u011467621/article/d 阅读全文
posted @ 2019-06-17 21:08 不吃披萨边 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 1、实现Cloneable接口表明该类的对象是允许克隆的。 2、允许克隆的意思是:可以调用clone()方法。 3、深拷贝还是浅拷贝,取决于如何重写Object的clone()方法。 4、原对象和克隆对象的关系: 深拷贝:阳关道和独木桥; 浅拷贝:藕断丝连。 上面的第二点解释一下,如果没有实现Clo 阅读全文
posted @ 2019-06-17 14:42 不吃披萨边 阅读(1536) 评论(0) 推荐(0) 编辑
摘要: 我们经常在进行持久化操作和返回数据时都会使用到javabean来统一封装参数,方便操作,一般我们也都会实现Serializable接口,那么问题来了,首先:为什么要进行序列化;其次:每个实体bean都必须实现serializabel接口吗?最后:我做一些项目的时候,没有实现序列化,同样没什么影响,到 阅读全文
posted @ 2019-06-17 14:28 不吃披萨边 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 首先要将字符串分割成词语列表。比如”hurry up”要分割成[“hurry”,”up”]。 对于中文来讲,分词就是一个很关键的问题,不过可以去找一些分词库来实现。我一般用的是jieba. 而对于英文来说,虽然分词方便,但是要注意词干提取和词形还原。 在将文档分割成词语之后,使用dictionary 阅读全文
posted @ 2019-06-17 09:39 不吃披萨边 阅读(168) 评论(0) 推荐(0) 编辑