上一页 1 2 3 4 5 6 7 ··· 18 下一页
摘要: 一:kafka配置信息 1.配置说明: Broker的配置信息server.properties Socket Server Setting: port=9092 Log Basics: log.dirs=/home/alex/tmp/kafka-logs num.partitions=1 Log 阅读全文
posted @ 2019-05-02 09:00 Coding_Now 阅读(385) 评论(0) 推荐(0) 编辑
摘要: 一:三种方式 a.均方误差(MSE) b.均方根误差(RMSE) c.平均绝对误差(MAE) 二:评测公式 均方误差:对(y_test-y_test_predict)的平方求和,但是为了排除个数对数值的影响,我们将上述的值在进行除以y_test的大小。 均方根误差:对均方误差进行开根号。 平均绝对误 阅读全文
posted @ 2019-04-20 10:03 Coding_Now 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 一:定义 简单理解:y=ax+b,x是特征值,y是标记,模型就是计算a和b的值。 二:最优模型 尽量使的y的预测值与真实值的差小,即对 y-y(i)进行求和使其值最小,即(y-y(i))^2小。 主要是最小二乘法和对a,b求偏导,得出 a = 对 (x(i)-x的平均值)*(y(i)-y的平均值) 阅读全文
posted @ 2019-04-18 14:26 Coding_Now 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 一.传统的消息通信方式 a.Socket通信协议 缺点:服务器端和客户端必须同时在线;传输大量数据时,数据完全不完备,对网络要求极高。 b.文件服务器(ftp) 缺点:实时性比较差;本地磁盘IO读写; c.共享数据库方式(Database) 缺点:系统间访问共享数据库比较难实现:1.据库连接池有限的 阅读全文
posted @ 2019-04-12 14:37 Coding_Now 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 一:所在包 from sklearn.preprocessing import StandardScaler。 二:步骤 a.将训练集进行fit操作 b.在将训练集进行transform操作,得到均值为0,方差为1的数据集。 c.对测试集进行transform操作,但是不需要在进行fit,应使用训练 阅读全文
posted @ 2019-04-10 12:18 Coding_Now 阅读(1562) 评论(0) 推荐(0) 编辑
摘要: 一:目的 数据归一化(标准化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。 二:分为 阅读全文
posted @ 2019-04-07 16:22 Coding_Now 阅读(1071) 评论(0) 推荐(0) 编辑
摘要: 主要用到 sklearn.model_selection包下的GridSearchCV类。 总共分为几步: a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSearchCV对象 d.进行数据训练 e.得出最优超参数 a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSear 阅读全文
posted @ 2019-04-07 15:33 Coding_Now 阅读(975) 评论(0) 推荐(0) 编辑
摘要: 一:定义 超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。 二:常用超参数 k近邻算法的k,权重weight,明可夫斯基距离公式的p,这三个参数都在KNeighborsClassifier类的构造函数中。 三:共同代码 四:k的最优数值 五:weight的最优数值 如果取值为u 阅读全文
posted @ 2019-04-07 12:39 Coding_Now 阅读(3695) 评论(0) 推荐(1) 编辑
摘要: 本章,我们使用sklearn自带的手写识别的数据集进行计算准确度,进而巩固之前学的KNN算法。 本节主要是进行之前学的KNN算法进行巩固,进而为后续的学习打好基础。 阅读全文
posted @ 2019-04-07 10:17 Coding_Now 阅读(812) 评论(0) 推荐(0) 编辑
摘要: 一:当我们训练出一个模型,我们不知道这个模型是好还是坏,我们如果应用到真实环境,结果预测的没有可信度,所以在输入样例之前先对模型进行测试。这时,我们就要将我们所有的数据分为两部分,一大部分用来训练,一小部分用来测试,一般比例在8:2。也就是我们会有两套数据集,一个是训练集,另一个是测试集。 二:鸢尾 阅读全文
posted @ 2019-04-04 13:38 Coding_Now 阅读(264) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 18 下一页