Coding_Now - 博客园

2019年5月2日

摘要：一：kafka配置信息 1.配置说明： Broker的配置信息server.properties Socket Server Setting： port=9092 Log Basics： log.dirs=/home/alex/tmp/kafka-logs num.partitions=1 Log 阅读全文

posted @ 2019-05-02 09:00 Coding_Now 阅读(385) 评论(0) 推荐(0) 编辑

2019年4月20日

对线性回归算法的评测

摘要：一：三种方式 a.均方误差(MSE) b.均方根误差(RMSE) c.平均绝对误差(MAE) 二：评测公式均方误差：对(y_test-y_test_predict)的平方求和，但是为了排除个数对数值的影响，我们将上述的值在进行除以y_test的大小。均方根误差：对均方误差进行开根号。平均绝对误阅读全文

posted @ 2019-04-20 10:03 Coding_Now 阅读(307) 评论(0) 推荐(0) 编辑

2019年4月18日

简单线性回归

摘要：一：定义简单理解：y=ax+b，x是特征值，y是标记，模型就是计算a和b的值。二：最优模型尽量使的y的预测值与真实值的差小，即对 y-y(i)进行求和使其值最小，即(y-y(i))^2小。主要是最小二乘法和对a，b求偏导，得出 a = 对 (x(i)-x的平均值)*(y(i)-y的平均值) 阅读全文

posted @ 2019-04-18 14:26 Coding_Now 阅读(283) 评论(0) 推荐(0) 编辑

2019年4月12日

kafka的安装和简单概念

摘要：一.传统的消息通信方式 a.Socket通信协议缺点：服务器端和客户端必须同时在线；传输大量数据时，数据完全不完备，对网络要求极高。 b.文件服务器(ftp) 缺点：实时性比较差；本地磁盘IO读写； c.共享数据库方式(Database) 缺点：系统间访问共享数据库比较难实现：1.据库连接池有限的阅读全文

posted @ 2019-04-12 14:37 Coding_Now 阅读(185) 评论(0) 推荐(0) 编辑

2019年4月10日

scikit-learn中自带的均值方差归一化函数

摘要：一：所在包 from sklearn.preprocessing import StandardScaler。二：步骤 a.将训练集进行fit操作 b.在将训练集进行transform操作，得到均值为0，方差为1的数据集。 c.对测试集进行transform操作，但是不需要在进行fit，应使用训练阅读全文

posted @ 2019-04-10 12:18 Coding_Now 阅读(1562) 评论(0) 推荐(0) 编辑

2019年4月7日

数据归一化

摘要：一：目的数据归一化（标准化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。二：分为阅读全文

posted @ 2019-04-07 16:22 Coding_Now 阅读(1071) 评论(0) 推荐(0) 编辑

KNN算法网格搜索最优参数

摘要：主要用到 sklearn.model_selection包下的GridSearchCV类。总共分为几步： a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSearchCV对象 d.进行数据训练 e.得出最优超参数 a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSear 阅读全文

posted @ 2019-04-07 15:33 Coding_Now 阅读(975) 评论(0) 推荐(0) 编辑

KNN算法的超参数

摘要：一：定义超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。二：常用超参数 k近邻算法的k，权重weight，明可夫斯基距离公式的p，这三个参数都在KNeighborsClassifier类的构造函数中。三：共同代码四：k的最优数值五：weight的最优数值如果取值为u 阅读全文

posted @ 2019-04-07 12:39 Coding_Now 阅读(3695) 评论(0) 推荐(1) 编辑

机器学习算法的分类准确度

摘要：本章，我们使用sklearn自带的手写识别的数据集进行计算准确度，进而巩固之前学的KNN算法。本节主要是进行之前学的KNN算法进行巩固，进而为后续的学习打好基础。阅读全文

posted @ 2019-04-07 10:17 Coding_Now 阅读(812) 评论(0) 推荐(0) 编辑

2019年4月4日

测试机器学习算法的好坏

摘要：一：当我们训练出一个模型，我们不知道这个模型是好还是坏，我们如果应用到真实环境，结果预测的没有可信度，所以在输入样例之前先对模型进行测试。这时，我们就要将我们所有的数据分为两部分，一大部分用来训练，一小部分用来测试，一般比例在8:2。也就是我们会有两套数据集，一个是训练集，另一个是测试集。二：鸢尾阅读全文

posted @ 2019-04-04 13:38 Coding_Now 阅读(264) 评论(0) 推荐(0) 编辑

Code_exploration

程序人生，走向人生巅峰

公告