随笔分类 -  001_机器学习

上一页 1 ··· 3 4 5 6 7 8 9 下一页
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第十五篇,看看horovod 弹性训练如何广播和发送通知。 阅读全文
posted @ 2021-07-16 20:24 罗西的思考 阅读(800) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第十四篇,看看horovod 如何动态发现节点 和 处理状态信息。 阅读全文
posted @ 2021-07-14 19:18 罗西的思考 阅读(738) 评论(1) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第十三篇,看看 horovod 弹性实现中 的 Driver 角色。 阅读全文
posted @ 2021-07-12 19:43 罗西的思考 阅读(788) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第十二篇,看看horovod 如何实施弹性训练。 阅读全文
posted @ 2021-07-09 21:02 罗西的思考 阅读(1286) 评论(2) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第十一篇,看看horovod 如何运行在 spark 之上(GLOO实现)。 阅读全文
posted @ 2021-07-07 19:22 罗西的思考 阅读(675) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本文是系列第十篇,看看horovod 如何运行在 spark 之上。 阅读全文
posted @ 2021-07-05 06:25 罗西的思考 阅读(863) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本文是系列第九篇,介绍 horovod on spark 如何启动。 阅读全文
posted @ 2021-07-03 09:01 罗西的思考 阅读(624) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。接下来几篇介绍 horovod 如何运行在 spark 之上。本文是第八篇,介绍 horovod on spark 的总体架构。 阅读全文
posted @ 2021-06-30 08:22 罗西的思考 阅读(1183) 评论(0) 推荐(3) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第七篇,看看 Horovod 如何与 TensorFlow 融合。 阅读全文
posted @ 2021-06-28 08:06 罗西的思考 阅读(2142) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本文是系列第六篇,看看 Horovod 后台线程架构。 阅读全文
posted @ 2021-06-24 07:39 罗西的思考 阅读(1989) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本文是系列第五篇,看看 Horovod 如何融合各个机器学习框架。 阅读全文
posted @ 2021-06-21 08:39 罗西的思考 阅读(1909) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第四篇,看看如何获取 host 之间的路由等网络信息。 阅读全文
posted @ 2021-06-17 19:15 罗西的思考 阅读(1396) 评论(0) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。本文是系列第三篇,从 python 开始进入 Horovod 世界,看看 Horovodrun 背后做了什么。 阅读全文
posted @ 2021-06-15 08:22 罗西的思考 阅读(3049) 评论(1) 推荐(0) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。系列大约有15 ~ 18 篇,本文是系列第二篇,从用户角度切入 Horovod。 阅读全文
posted @ 2021-06-10 09:16 罗西的思考 阅读(4193) 评论(1) 推荐(1) 编辑
摘要:Horovod 是Uber于2017年发布的一个易于使用的高性能的分布式训练框架,在业界得到了广泛应用。本系列将通过源码分析来带领大家了解 Horovod。系列大约有15 ~ 18 篇,本文是系列第一篇,介绍相关背景知识。 阅读全文
posted @ 2021-06-07 09:33 罗西的思考 阅读(5466) 评论(4) 推荐(0) 编辑
摘要:Facebook Hydra 允许开发人员通过编写和覆盖配置来简化 Python 应用程序(尤其是机器学习方面)的开发。开发人员可以借助Hydra,通过更改配置文件来更改产品的行为方式,而不是通过更改代码来适应新的用例。 阅读全文
posted @ 2021-06-03 19:26 罗西的思考 阅读(2197) 评论(0) 推荐(0) 编辑
摘要:Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文将带领大家来分析Alink中 聚类评估 的实现。 阅读全文
posted @ 2020-09-26 08:41 罗西的思考 阅读(755) 评论(0) 推荐(0) 编辑
摘要:Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和将带领大家来分析Alink中 回归评估 的实现。 阅读全文
posted @ 2020-09-25 23:48 罗西的思考 阅读(369) 评论(0) 推荐(0) 编辑
摘要:本文将通过一个经典的 “tensorflow找不到dll” 问题来入手,给大家一个如何找到缺失dll的办法,进而再分享一个windows上排查问题的好工具(因为大多开发者在windows上开发&在linux上部署,windows还是绕不过)。 阅读全文
posted @ 2020-09-17 21:04 罗西的思考 阅读(1256) 评论(1) 推荐(0) 编辑
摘要:Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析 Alink 中 卡方检验 的实现。 阅读全文
posted @ 2020-08-29 07:32 罗西的思考 阅读(1373) 评论(1) 推荐(0) 编辑

上一页 1 ··· 3 4 5 6 7 8 9 下一页