上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 21 下一页
摘要: # 1.修改每个用户的hosts vi /etc/hosts #127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localh 阅读全文
posted @ 2019-04-19 17:06 bioamin 阅读(1139) 评论(0) 推荐(0) 编辑
摘要: 多项式特征处理 class sklearn.preprocessing.PolynomialFeatures(degree=2, interaction_only=False, include_bias=True) 参数: degree interaction_only 默认为False inclu 阅读全文
posted @ 2019-04-06 19:52 bioamin 阅读(376) 评论(0) 推荐(0) 编辑
摘要: import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D data=np.genfromtxt("Delivery.csv",delimiter=',') x_data = d 阅读全文
posted @ 2019-04-05 10:09 bioamin 阅读(363) 评论(0) 推荐(0) 编辑
摘要: 当多维数组的某一列时返回的是一个行向量 如果我索引多维数组的某一列时,返回的仍然是列的结构,一种正确的索引方式是: >>>X[:, 1][:, np.newaxis] array([[2], [6], [10]]) 如果想实现第二列和第四列的拼接(层叠): >>>X_sub = np.hstack( 阅读全文
posted @ 2019-04-03 20:40 bioamin 阅读(190) 评论(0) 推荐(0) 编辑
摘要: sklearn线性模型之线性回归 查看官网 https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html 1.实例化: 2.方法: Returns the coefficien 阅读全文
posted @ 2019-04-03 20:28 bioamin 阅读(1064) 评论(0) 推荐(0) 编辑
摘要: 数据 32.502345269453031,31.70700584656992 53.426804033275019,68.77759598163891 61.530358025636438,62.562382297945803 47.475639634786098,71.5466322335677 阅读全文
posted @ 2019-04-02 11:55 bioamin 阅读(1103) 评论(0) 推荐(0) 编辑
摘要: Python 并没有提供数组功能,虽然列表 (list) 可以完成基本的数组功能,但它并不是真正的数组,而且在数据量较大时,使用列表的速度就会慢的让人难受。Numpy 提供了真正的数组功能,以及对数据快速处理的函数。Numpy 还是很多更高级的扩展库的依赖库,例如: Scipy,Matplotlib 阅读全文
posted @ 2019-04-01 20:23 bioamin 阅读(3199) 评论(0) 推荐(0) 编辑
摘要: flume的数据源采用taiDir,sink类型选择kafka类型 测试目标:flume监控某一个目录的日志文件,并将文件存储到kafka中,在kafka的消费端可以实现数据的消费 dip005、dip006、dip007安装kafka dip005、dip006、dip007安装flume 1、k 阅读全文
posted @ 2019-03-15 15:29 bioamin 阅读(550) 评论(0) 推荐(1) 编辑
摘要: kafka测试启动创建topic ./kafka-topics.sh --create --zookeeper dip005:2181,dip006:2181,dip007 --replication-factor 1 --partitions 1 --topic test2./kafka-topi 阅读全文
posted @ 2019-03-15 15:17 bioamin 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 元数据库设计到的服务: scm库:server hive库:hive元数据信息 amon库:cloudera management服务 hue库:存储hue的账户及查询信息 元数据库要从5.7.24升级到5.7.25,为了避免升级失败导致 集群不可用,我们计划在另一个节点安装5.7.25数据库,然后 阅读全文
posted @ 2019-03-14 16:01 bioamin 阅读(1082) 评论(0) 推荐(0) 编辑
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 21 下一页