摘要:
logging模块是Python内置的标准模块,主要用于输出运行日志,可以通过设置不同的日志等级,实现日志文件保存,输出路径以及输出形式 阅读全文
摘要:
多因子探索分析与可视化 阅读全文
摘要:
首先要观察爬虫的URL规律,爬取一个贴吧所有页的数据,观察点击下一页时URL是如何变化的。 阅读全文
摘要:
1、聚类算法又叫做“无监督分类”,其目的是将数据划分成有意义或有用的组(或簇)。这种划分可以基于我们的业务需求或建模需求来完成,也可以单纯地帮助我们探索数据的自然结构和分布。
2、KMeans算法将一组N个样本的特征矩阵X划分为K个无交集的簇,直观上来看是簇是一组一组聚集在一起的数据,在一个簇中的数据就认为是同一类。簇就是聚类的结果表现。簇中所有数据的均值通常被称为这个簇的“质心”(centroids)。在一个二维平面中,一簇数据点的质心的横坐标就是这一簇数据点的横坐标的均值,质心的纵坐标就是这一簇数据点的纵坐标的均值。同理可推广至高维空间。
3、KMeans追求的是‘簇内差异小,簇间差异大’。 阅读全文
摘要:
mongodb基本操作 阅读全文
摘要:
SpringCloud 是微服务中的翘楚,最佳的落地方案。
使用 SpringCloud 的 Hystrix Dashboard 组件可以监控单个应用服务的调用情况,但如果是集群环境,可能就不能满足需求了,这时就用到了 SpringCloud 另一个组件:Turbine。
Turbine 将每个应用服务的调用情况聚合在一起展示出来。
如果了解过 Hystrix Dashboard,那么可以简单认为 Turbine 就相当于另起了一个工程,把其他工程的监控情况
全部显示到了 Turbine 工程中。 阅读全文
摘要:
Python中列表是可变的,这是它区别于字符串和元组的最重要的特点,一句话概括即:列表可以修改,而字符串和元组不能。
列表追加数据的方法:append(),extend(数组),insert(位置,值) 阅读全文
摘要:
网络编程之 tcp服务器(一) 阅读全文
摘要:
常见的Java考试面试问题 阅读全文
摘要:
Integer装箱拆箱、参数传递 阅读全文