07 2019 档案

摘要:1、flink实现计数器的灵感来源于Hadoop的MapReduce计算框架里的理念。 flink通过实现Accumulator接口实现并行计数。并行管理是由flink实现的。 计数的结果通过JobExecutionResul的getAccumulatorResult方法t获取。 2、示例,在正常业 阅读全文
posted @ 2019-07-21 13:00 我是属车的 阅读(1560) 评论(0) 推荐(0) 编辑
摘要:1、线性回归 假设线性函数如下: 假设我们有10个样本x1,y1),(x2,y2).....(x10,y10),求解目标就是根据多个样本求解theta0和theta1的最优值。 为了解决这个问题,我们需要引入误差分析预测值与真实值之间的误差为最小。 2、梯度下降算法 梯度下降的场景: 梯度下降法的基 阅读全文
posted @ 2019-07-17 17:34 我是属车的 阅读(751) 评论(0) 推荐(0) 编辑
摘要:更正:之前发的有两个错误。 1、K均值聚类算法 2、二维坐标点POJO 二维聚类中心POJO 3、缺省的数据准备 4、KMeans聚类算法实现 阅读全文
posted @ 2019-07-09 21:36 我是属车的 阅读(1845) 评论(6) 推荐(0) 编辑
摘要:1、三角枚举,从所有无向边对中找到相互连接的三角形 2、三角枚举所需要数据结构等 3、测试数据 阅读全文
posted @ 2019-07-06 17:39 我是属车的 阅读(515) 评论(0) 推荐(0) 编辑
摘要:flink 使用Transitive Closure算法实现可达路径查找。 1、Transitive Closure是翻译闭包传递?我觉得直译不准确,意译应该是传递特性直至特性关闭,也符合本例中传递路径,寻找路径可达,直到可达路径不存在(即关闭)。 2、代码很简单,里面有些概念直指核心原理,详细看注 阅读全文
posted @ 2019-07-04 10:52 我是属车的 阅读(629) 评论(0) 推荐(0) 编辑
摘要:基本概念:在流中创建“反馈(feedback)”循环,通过将一个算子的输出重定向到某个先前的算子。这对于定义不断更新模型的算法特别有用。 迭代的数据流向:DataStream → IterativeStream → DataStream 以下代码以流开始并连续应用迭代体。大于0的元素将被发送回反馈( 阅读全文
posted @ 2019-07-02 19:25 我是属车的 阅读(2846) 评论(1) 推荐(1) 编辑
摘要:软件下载:https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/ 官方字库下载:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#format-of-traine 阅读全文
posted @ 2019-07-02 10:31 我是属车的 阅读(7785) 评论(3) 推荐(1) 编辑

点击右上角即可分享
微信分享提示