2021年2月10日

摘要: 从 Pytorch 转向 Tensorflow 已有一段时间,直到今天也没发现太好的 Pytorch 教程,心想倒不如自己写一个系列。除技术文章,也写写其他方面的东西。 2017年3月1号,我发布了第一篇公众号文章。随后也陆陆续续的发表了几篇,但毕竟没坚持下来。这两年经历了不少事,想着是时候把这个烂 阅读全文
posted @ 2021-02-10 21:32 海阔心 阅读(306) 评论(0) 推荐(0) 编辑

2020年4月14日

摘要: 介绍几种Python异步执行的方式 参考: "官方文档" "python 实现异步执行" "Python中协程异步IO" 通过 threading.Thread 实现 先将需要异步执行的函数用线程的方式包装为一个装饰器,然后拿去装饰需要异步执行的函数即可。 下面构造两个函数 A 函数用 async_ 阅读全文
posted @ 2020-04-14 17:30 海阔心 阅读(816) 评论(0) 推荐(1) 编辑

2020年4月13日

摘要: 总览 第一、每个spark 应用都有一个驱动程序去运行着主函数和再每个节点上的并行操作。 spark提供了一个RDD(弹性分布式数据集)的数据集合,可以通过不同的节点并行操作运算,可以通过hdfs文件构建。RDD可以在内存中进行缓存,当需要复用的时候会有更高的效率。 第二、提供了共享变量(share 阅读全文
posted @ 2020-04-13 01:32 海阔心 阅读(340) 评论(0) 推荐(1) 编辑

2020年3月31日

摘要: 架构图 要点 1. 推荐流程设计 解决信息过载问题 召回 协同过滤召回 内容相似召回 热门召回 新物品召回 等等 排序 LR GBDT/XGB/LGB DNN Wide&Deep 调整 去重 规则过滤 热门补充 其他规则调整 2. 同步业务数据 为避免推荐系统的数据读写、计算对业务系统的影响,推荐系 阅读全文
posted @ 2020-03-31 22:59 海阔心 阅读(683) 评论(0) 推荐(1) 编辑
摘要: 需求分析 针对海量图片去重通常是如下思路 1. 根据某种方法提取图片特征或者说指纹 2. 根据提取出来的特征计算图片间的距离 3. 根据距离调整阈值判断图片是否相似 1、提取指纹 常用的有如下方法: 1. ahash 2. phash 3. dhash ahash 1. 将图片灰度 2. 将图片re 阅读全文
posted @ 2020-03-31 22:52 海阔心 阅读(1505) 评论(0) 推荐(2) 编辑
摘要: Env: os: Ubuntu python3 pytorch vscode Desc 在上述环境中运行A3C多进程模型,使用命令行时没问题,使用vscode时出现 'RuntimeError: already started' 的错误, 具体错误信息如下: Solution 在自己的代码头添加以下 阅读全文
posted @ 2020-03-31 22:50 海阔心 阅读(648) 评论(0) 推荐(1) 编辑
摘要: PIP 各种可用源 清华源:https://pypi.tuna.tsinghua.edu.cn/simple 临时指定源 永久更改源 linux下: 1. vim ~/.pip/pip.conf 2. 添加以下内容 windows下: 1. 在用户目录下:C:\Users\Administrator 阅读全文
posted @ 2020-03-31 22:49 海阔心 阅读(391) 评论(0) 推荐(1) 编辑
摘要: 问题 运行 huggingface transformers 的 demo,报错FloatProgress not found。具体如下: 报错: 解决: 添加 from ipywidgets import IntProgress 阅读全文
posted @ 2020-03-31 22:47 海阔心 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 问题 Python 中的迭代器是我们经常使用的迭代工具, 但其只能消费一次,再次消费便会出现 StopIteration 报错。 解决方案 封装了一个类,当迭代器使用完后再次初始化。 代码 阅读全文
posted @ 2020-03-31 22:46 海阔心 阅读(431) 评论(0) 推荐(2) 编辑
摘要: 计算文件MD5 阅读全文
posted @ 2020-03-31 22:45 海阔心 阅读(355) 评论(0) 推荐(0) 编辑

导航