昕友软件开发

2019年11月26日

摘要： Cassandra 提供了三种集合类型，分别是Set,List,MapSet: 非重复集，存储了一组类型相同的不重复元素，当被查询时会返回排好序的结果，但是内部构成是无序的值，应该是在查询时对结果进行了排序。List: 列表，查询时会按照元素在list中的index顺序来返回结果，可以存储多个重复的阅读全文

posted @ 2019-11-26 10:12 昕友软件开发阅读(1130) 评论(0) 推荐(0)

2019年11月25日

Cassandra开发入门文档第三部分（非规范化关系结构、批处理）

摘要：非规范化关系结构第二部分我们讲了复合主键，这可以灵活的解决主从关系，也即是一对多关系，那么多对多关系呢？多对多关系的数据模型应该回答两个问题：我跟着谁？谁跟着我？非规范化数据结构上面我们看到的第一个非规范化的例子，这是在多个地方存储相同数据的实践。在关系数据库模式中，非规范化通常是不受欢迎的阅读全文

posted @ 2019-11-25 16:10 昕友软件开发阅读(460) 评论(0) 推荐(0)

Cassandra开发入门文档第二部分（timeuuid类型、复合主键、静态字段详解）

摘要： timeuuid类型 timeuuid具有唯一索引和日期时间的综合特性，可以与日期和时间函数联合使用，常用的关联函数： dateOf() now() minTimeuuid() and maxTimeuuid() toDate(timeuuid) toTimestamp(timeuuid) toUn 阅读全文

posted @ 2019-11-25 11:27 昕友软件开发阅读(1992) 评论(0) 推荐(0)

2019年11月22日

Cassandra开发入门文档第一部分

摘要： Cassandra的特点横向可扩展性： Cassandra部署具有几乎无限的存储和处理数据的能力。当需要额外的容量时，可以简单地将更多的机器添加到集群中。当新机器加入集群时，Cassandra需要对现有数据进行重新平衡，以使扩展集群中的每个节点具有大致相等的份额。而且，Cassandra集群的性能阅读全文

posted @ 2019-11-22 17:45 昕友软件开发阅读(647) 评论(0) 推荐(0)

Flume的Source、Sink总结，及常用使用场景

摘要：代码存档 https://gitee.com/475660/databand/tree/master/databand-etl-flume https://gitee.com/475660/databand/tree/master/databand-mock-log 数据源Source RPC异构流阅读全文

posted @ 2019-11-22 10:14 昕友软件开发阅读(1975) 评论(0) 推荐(0)

2019年11月6日

「二分类算法」提供银行精准营销解决方案代码存档

摘要：第一次提交，没做什么特征工程，分数还不太理想 0.9157894736842105Accuracy : 0.9158AUC Score (Test): 0.932477 过程分析 from numpy import int64 from sklearn import metrics from skl 阅读全文

posted @ 2019-11-06 17:32 昕友软件开发阅读(1079) 评论(0) 推荐(0)

2019年10月24日

机器学习项目清单

摘要：总共有八个步骤： 1 规范化问题：Frame the Problem and Look at the Big Picture 2 获取数据：Get the Data 注意：尽可能自动化获取数据，这样您可以轻松获取最新的数据 3 探索数据：Explore the Data 名字类型：分类，int / 阅读全文

posted @ 2019-10-24 16:00 昕友软件开发阅读(385) 评论(0) 推荐(0)

2019年10月23日

持久化机器学习模型（joblib方式）

摘要： import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.preprocessing import PolynomialFeatures from sklearn.externals import joblib X_train = 阅读全文

posted @ 2019-10-23 15:44 昕友软件开发阅读(2545) 评论(0) 推荐(0)

使用协方差矩阵的特征向量PCA来处理数据降维

摘要：取2维特征，方便图形展示阅读全文

posted @ 2019-10-23 11:37 昕友软件开发阅读(320) 评论(0) 推荐(0)

使用肘部法确定k-means均值的k值

摘要： X为：随着K的增加，纵轴呈下降趋势且最终趋于稳定，那么拐点肘部处的位置所对应的k 值，不妨认为是相对最佳的类聚数量值。阅读全文

posted @ 2019-10-23 11:07 昕友软件开发阅读(2642) 评论(0) 推荐(0)

昕友软件开发

知行合一