随笔分类 -  python

摘要:多任务场景中,为了节省大量子任务串行执行的耗时,通常采用并发方式充分利用 cpu 和 内存来节省整体任务运行时间。 对于多任务并发,常见的做法自然是抽象出功能函数,借助 multiprocess 类在主进程中并发出多个子进程,或者构建进程池,将任务构造好后丢入进程池中来实现并发。这种方式对于逻辑结构 阅读全文
posted @ 2024-03-21 16:17 sinatJ 阅读(1147) 评论(0) 推荐(1) 编辑
摘要:记录下一般的 Python web 项目开发后如何部署到外部服务器上,供用户访问。 1 简要 本质三件事: 租个服务器(含公网 ip)+配置环境电脑 + 公网IP 自己电脑 + 拉专线 代码放在服务器 程序运行起来 2 搞一台云服务器 租一个 linux 系统的云服务器,并获得一个公网 IP,例如直 阅读全文
posted @ 2024-02-02 15:14 sinatJ 阅读(900) 评论(0) 推荐(0) 编辑
摘要:参考: https://blog.csdn.net/qq_38122800/article/details/132663030 https://blog.csdn.net/weixin_42289273/article/details/122912938 https://zhuanlan.zhihu 阅读全文
posted @ 2023-12-26 17:07 sinatJ 阅读(868) 评论(0) 推荐(0) 编辑
摘要:1 基础命令 1 - 新建虚拟环境: conda create -n you_env_name python=3.7 2 - 查看当前有哪些虚拟环境: conda env list 3 - 激活某个虚拟环境: conda.bat activate your_env_name 4 - 在虚拟环境中安装 阅读全文
posted @ 2023-09-13 22:38 sinatJ 阅读(126) 评论(0) 推荐(0) 编辑
摘要:今天在爬取一个反爬措施较严格的网站时,使用 selenium 做自动化登录时,无法定位输入框的问题。 查看网页源代码确实没有登录相关元素的标签,可以判定是采用的动态加载,但是即使使用的动态加载,等待页面渲染完毕之后应该还是能定位的。 看了下渲染完毕之后的网页源码,发现了在当前 html 页面中,又嵌 阅读全文
posted @ 2023-08-05 18:37 sinatJ 阅读(90) 评论(0) 推荐(0) 编辑
摘要:### 1 重构说明 这是项目 [Python 自建 IP 代理池](https://www.cnblogs.com/zishu/p/17316593.html) 的重构版本,学习了 scrapy 框架的使用,并用该框架对之前项目进行了重构,得益于 scrapy 框架本身的优秀设计,之前手撸的小框架 阅读全文
posted @ 2023-06-30 16:17 sinatJ 阅读(172) 评论(0) 推荐(0) 编辑
摘要:paper:https://arxiv.org/pdf/1611.07004.pdf [CVPR 2017] code: https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix https://phillipi.github.io/pix2pi 阅读全文
posted @ 2023-05-05 21:34 sinatJ 阅读(190) 评论(0) 推荐(0) 编辑
摘要:国内视频地址:https://www.bilibili.com/video/BV17441137fa/?spm_id_from=333.880.my_history.page.click&vd_source=bda72e785d42f592b8a2dc6c2aad2409 1 NLP 基础 1.1 阅读全文
posted @ 2023-04-28 21:39 sinatJ 阅读(277) 评论(0) 推荐(0) 编辑
摘要:> 文章有点儿长,谨慎食用~ python 爬虫在爬取网页内容时,遭遇的最常见的反爬措施就是 ip 限制/封禁,对此最常见的解决方式就是设置 IP 代理池,每次请求时随机使用一个代理 IP 去访问资源。 网上有成熟的代理服务,但是小伙汁的爬虫需求多是非定期的自定义项目,使用付费代理并不划算,遂有了爬 阅读全文
posted @ 2023-04-13 21:56 sinatJ 阅读(1090) 评论(0) 推荐(0) 编辑
摘要:背景:串行执行慢,考虑使用多进程来加速。 1 多进程 这块可以参考:https://blog.csdn.net/Hao_ge_666/article/details/120571731 2 多线程 这块可以参考:https://blog.csdn.net/Hao_ge_666/article/det 阅读全文
posted @ 2023-04-09 19:25 sinatJ 阅读(39) 评论(0) 推荐(0) 编辑
摘要:当我们希望在 python 项目文件中添加作者/项目信息说明时,可以借助 pycharm 自动的配置代码模版的方式来实现。 1 进入 setting 2 配置信息模版 将下面的模版代码填入即可 # _*_ coding : utf-8 _*_ # @Time : DATE{TIME} # 阅读全文
posted @ 2023-02-06 09:49 sinatJ 阅读(70) 评论(0) 推荐(0) 编辑
摘要:针对视觉任务中的数据准备进行记录: 1.从视频中获取图片数据 首先从视频中剪辑出指定长度(2-3s)的有效片段,直接使用剪辑工具即可(推荐 快剪辑) 将视频片段拆分成帧图片。 首先右键查看视频片段的 属性,然后转 详细信息 查看 帧速率,此速率即为后期生成图片的一个重要参数。 可使用工具 ffmpe 阅读全文
posted @ 2020-03-29 23:50 sinatJ 阅读(273) 评论(0) 推荐(0) 编辑
摘要:1. 在用python处理图像数字矩阵时,若对矩阵进行了加减乘除等运算,可能会造成矩阵元素值溢出,然后某些元素值可能都被赋为255;之后若重新显示图像,可能会没有什么变化,此时,可以将运算后的矩阵值转换为int,再返回。2. 还要注意,读取图像然后转为 numpy 数组,此时的数组是 int 矩阵, 阅读全文
posted @ 2019-12-29 09:54 sinatJ 阅读(1859) 评论(0) 推荐(0) 编辑
摘要:详细说明见代码注释 阅读全文
posted @ 2019-10-13 10:19 sinatJ 阅读(7188) 评论(0) 推荐(1) 编辑
摘要:这里以一个很简单的小爬虫为例,爬取 壹心理 网站的阅读页面第一页的所有文章及其对应的图片,文章页面如下: 创建项目 首先新建一个 scrapy 项目,安装好相关依赖(步骤可参考:scrapy 安装及新建爬虫项目并运行)。 新建一个爬虫: 此时项目工程目录与新建的爬虫如下: 爬取信息并编写图片自动下载 阅读全文
posted @ 2019-09-21 14:12 sinatJ 阅读(734) 评论(0) 推荐(0) 编辑
摘要:> 参考:https://www.cnblogs.com/hy123456/p/9847570.html 在 pycharm 中并没有创建 scrapy 工程的选项,需要手动创建。 这里就有两种创建 scrapy 项目的方式,第一种是先手工创建 scrapy 项目,然后导入到 pycharm 中;第 阅读全文
posted @ 2019-09-18 16:51 sinatJ 阅读(3049) 评论(0) 推荐(0) 编辑
摘要:ubuntu 中打开命令行,执行如下指令 进入配置文件后在文件末尾加上: 保存退出,再使用下面命令使刚才修改的配置有效 当然有关该问题的解决方法不止这一种,但是上述方法还是很方便的一种。 此方法从视频(人工智能实践:Tensorflow笔记)之中总结。 阅读全文
posted @ 2019-07-17 10:14 sinatJ 阅读(1902) 评论(0) 推荐(0) 编辑
摘要:flask 若想将不同的路由写在不同的文件中(如将 user 对象的相关接口写在一个文件中,将 customer 对象的相关接口写在另一个文件中),可以使用蓝图来实现。 有关蓝图的定义:A Blueprint is a way to organize a group of related views 阅读全文
posted @ 2019-07-09 17:23 sinatJ 阅读(4762) 评论(1) 推荐(2) 编辑
摘要:错误详情(错误详情如标题,图是网上找的): 解决方法: 在项目目录下 settings.py 的同级目录中的 __init__.py 中加入如下代码: 参考:python 报错 ModuleNotFoundError: No module named 'MySQLdb' 阅读全文
posted @ 2019-07-06 10:03 sinatJ 阅读(366) 评论(0) 推荐(0) 编辑
摘要:在开发 Python 应用程序的时候,每个项目所需要的python版本和各种包依赖都可能不完全一样,我们当然希望当前运行环境只包含对当前项目有用的包依赖,以保证运行环境的干净。virtualenv就是用来为一个应用创建一套“隔离”的Python运行环境。 首先,我们用pip安装virtualenv: 阅读全文
posted @ 2019-06-29 18:05 sinatJ 阅读(402) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示
主题色彩