摘要: 引用自:http://blog.csdn.net/pipisorry/article/details/52247379 数据的标准化(normalization)和归一化 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到, 阅读全文
posted @ 2017-07-21 10:48 LazyJoJo 阅读(34149) 评论(0) 推荐(0) 编辑
摘要: 1.打开注册表编辑器,开始->运行->regedit。 2.在HKEY_CLASSSES_ROOT→ * → Shell 下,在Shell下,新建项命名为Open With Sublime Text,在该新建项的右边窗口新建字符串值(右键--新建--字符串值)。名称:Icon;值:D:\Progra 阅读全文
posted @ 2017-06-23 20:03 LazyJoJo 阅读(524) 评论(0) 推荐(0) 编辑
摘要: UCL机器学习知识库:包括近300个不同大小和类型的数据集,可用于分类、回归、聚类和推荐系统任务。数据集列表位于:http://archive.ics.uci.edu/ml/。 UCL机器学习知识库:包括近300个不同大小和类型的数据集,可用于分类、回归、聚类和推荐系统任务。数据集列表位于:ht 阅读全文
posted @ 2017-05-27 09:15 LazyJoJo 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 1、配置好Hadoop和spark 2、配置好Pytho3.5 3、安装py4j pip3 install py4j 4、idea 中添加Python插件 file->setting->editor->plugins 右边搜索框中 搜索Python,下载插件 5、下载完后,重启软件,建立Python 阅读全文
posted @ 2017-05-26 21:32 LazyJoJo 阅读(2262) 评论(0) 推荐(0) 编辑
摘要: 修改默认Python (默认的是Python2.7) 安装所需依赖: 阅读全文
posted @ 2017-05-25 14:35 LazyJoJo 阅读(1129) 评论(0) 推荐(0) 编辑
摘要: 命令行登入mysql show variables like '%timeout%';(其中有用的是: interactive_timeout 和wait_timeout 为28800,默认为8小时设置;) set ​ interactive_timeout=764000; set ​wait_ti 阅读全文
posted @ 2017-05-12 16:27 LazyJoJo 阅读(536) 评论(0) 推荐(0) 编辑
摘要: 使用命令: apt-get install adobe-flashplugin 即可 阅读全文
posted @ 2017-04-19 13:28 LazyJoJo 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 查看内存及cpu使用情况的命令:top 也可以安装htop工具,这样更直观,安装命令如下:sudo apt-get install htop安装完后,直接输入命令:htop 阅读全文
posted @ 2017-04-18 10:01 LazyJoJo 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 1. 首先搭建好spark和hive,参见相关文档 2. 在spark/conf下创建hive-site.xml 表示链接master上的远程数据库 3. 在spark/jars 下放mysql链接包 mysql-connector-java-5.1.41-bin.jar 4. 启动 hive -- 阅读全文
posted @ 2017-04-13 09:59 LazyJoJo 阅读(274) 评论(0) 推荐(0) 编辑
摘要: 部分引用: http://blog.csdn.net/pakko/article/details/37878837 http://blog.csdn.net/sunbow0/article/details/45563747 Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法 一、原 阅读全文
posted @ 2017-04-09 22:30 LazyJoJo 阅读(366) 评论(0) 推荐(0) 编辑