摘要:
与分类不同,聚类是在没有给定分类的情况下,根据数据相似度进行分组的一种方法。聚类模型可以建立在无类标记的数据上,是一种非监督学习算法。聚类根据数据自身的距离或相似度划分为若干组,划分的原则是组内距离最小化,而组间距离最大化。如下图所示:常见的聚类算法如下:K-Means、K-中心点、系统聚类K-Means聚类算法K-Means算法是典型的基于距离的非层次聚类算法,在最下化误差函数的基础上将数据划分... 阅读全文
摘要:
本篇我们将使用Java语言来实现Flink的单词统计。代码开发环境准备导入Flink 1.9 pom依赖<dependencies> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId 阅读全文
摘要:
今天打开Oracle Java官网一看,Java已经更新到 13 了https://www.oracle.com/technetwork/java/javase/jdk-relnotes-index-2162236.html而我们仍然大多使用的是Java 7的一些语法。后续,我们将使用 Java 8 阅读全文