上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 59 下一页
摘要: 报错: 经过查看集群的jps如下: 查看日志: 状况: 所有namenode都是standby,即ZK服务未生效 尝试一:手动强制转化某个namenode为active 操作:在某台namenode上,执行 hdfs haadmin -transitionToActive --forcemanual 阅读全文
posted @ 2019-10-08 14:21 wqbin 阅读(1858) 评论(0) 推荐(0) 编辑
摘要: 单个学习器要么容易欠拟合要么容易过拟合,为了获得泛化性能优良的学习器,可以训练多个个体学习器,通过一定的结合策略,最终形成一个强学习器。这种集成多个个体学习器的方法称为集成学习(ensemble learning)。 集成学习通过组合多种模型来改善机器学习的结果,与单一的模型相比,这种方法允许产生更 阅读全文
posted @ 2019-10-08 10:43 wqbin 阅读(4561) 评论(0) 推荐(0) 编辑
摘要: 几位朋友找我,做一个基于spark的推荐系统。我们于是买了三台阿里云服务器折腾一下。 1.配置putty和安装nano 2.配置主机映射 /etc/hosts 3. 阅读全文
posted @ 2019-10-07 12:41 wqbin 阅读(774) 评论(0) 推荐(0) 编辑
摘要: 1 阅读全文
posted @ 2019-10-05 10:55 wqbin 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 1.从cp/scp命令出发 scp(secure copy)是linux系统下基于ssh登录进行安全的远程文件拷贝的命令。 备注: 直接使用scp来跨机器拷贝文件,会提示输入密码,scp原理是先使用ssh连接服务端机器后,再使用网络来执行远程拷贝(cp) 2.SSH原理 Secure Shell(安 阅读全文
posted @ 2019-10-04 14:51 wqbin 阅读(720) 评论(0) 推荐(0) 编辑
摘要: 最近机器学习的模型需要序列化和反序列化,因为写个博客总结一下几个模型和数据等序列化的模块。 阅读全文
posted @ 2019-09-30 16:35 wqbin 阅读(220) 评论(0) 推荐(0) 编辑
摘要: tqdm 是 Python 进度条库。 tqdm库下面有2个类我们经常使用: 1. 2. 可以在 Python 长循环中添加一个进度提示信息用法:tqdm(iterator) trange(i) 是 tqdm(range(i)) 的简单写法。 可以总结为三个方法: 方法一: 结果如下: 方法二:可以 阅读全文
posted @ 2019-09-30 16:29 wqbin 阅读(3288) 评论(0) 推荐(0) 编辑
摘要: 昨天和刚来项目的机器学习小白解释了一边什么baseline 和pipeline,今天在这里总结一下什么是baseline和pipeline。 1.pipeline 1.1 从管道符到pipeline 先从在linux的管道符讲起, inux体系下的各种命令工具的处理,可以使用管道符作为传递,这是一种 阅读全文
posted @ 2019-09-30 10:43 wqbin 阅读(7163) 评论(0) 推荐(1) 编辑
摘要: 1、在java中编译JAR文件的时候我们都会用到,jar这个命令。 2、这样的问题是因为,jar包中的META-INF文件夹下的MANIFEST.MF文件缺少定义jar接口类。说白了就是没有指定class类。这里说明一下MANIFEST.MF就是一个清单文件, 通俗点将就相当于WINDOWS中ini 阅读全文
posted @ 2019-09-27 21:27 wqbin 阅读(859) 评论(0) 推荐(0) 编辑
摘要: 1.第一步读入泰坦尼克号数据集 2.通过df的loc的函数从df中取出一列的数据,该数据格式为 : <class 'pandas.core.series.Series'> 会发现数据维度:(891,) 3.数据维度的转换 升维 因为sklearn里面的数据必须是二维 1.使用Series类的 to_ 阅读全文
posted @ 2019-09-27 20:39 wqbin 阅读(3775) 评论(1) 推荐(0) 编辑
上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 59 下一页