10 2020 档案

摘要:前言: 之前学习了用python爬虫的基本知识,现在计划用爬虫去做一些实际的数据统计功能。由于前段时间演员的诞生带火了几个年轻的实力派演员,想用爬虫程序搜索某论坛中对于某些演员的讨论热度,并按照日期统计每天的讨论量。 这个项目总共分为两步: 1. 获取所有帖子的链接: 将最近一个月内的帖子链接保存到 阅读全文
posted @ 2020-10-06 19:55 湘九 阅读(1127) 评论(0) 推荐(0) 编辑
摘要:最近在学习Python,相对java来说python简单易学、语法简单,工具丰富,开箱即用,适用面广做全栈开发那是极好的,对于小型应用的开发,虽然运行效率慢点,但开发效率极高。大大提高了咱们的生产力。为什么python能够在这几年火起来,自然有他的道理,当然也受益于这几天大数据和AI的火。 据说网络 阅读全文
posted @ 2020-10-06 16:25 湘九 阅读(3116) 评论(0) 推荐(0) 编辑
摘要:二进制 核心思想: 冯诺依曼 + 图灵机 电如何表示状态 ,才能稳定? 计算机开始设计的时候并不是考虑简单,而是考虑能自动完成任务与结果的可靠性, 简单始终是建立再稳定、可靠基础上 经过尝试10进制,但很难检查电流的状态差异并且很难稳定状态,最稳定的检查是 通电和不通电状态,共两种状态那就规定 通电 阅读全文
posted @ 2020-10-06 15:51 湘九 阅读(613) 评论(0) 推荐(0) 编辑
摘要:多线程基础概念 并行与并发 并行:同时处理多个任务,必须在多核环境下 一段时间内同时处理多个任务,单核也可以并发 并发手段 线程:内核空间的调度 进程:内核空间的调度 协程:用户空间的调度 线程可以允许程序在同一进程空间中并发运行多个操作。本次主要介绍Python标准库中的多线程模块threadin 阅读全文
posted @ 2020-10-06 15:33 湘九 阅读(424) 评论(0) 推荐(0) 编辑
摘要:毕设的第二阶段,就是对融合后的图像进行目标检测,这里首先使用KITTI数据集的原始图像进行目标检测,代码使用的是u版pytorch-yolo : https://github.com/ultralytics/yolov3 一、环境配置 我使用的环境是 win10 + cuda 11.1 + pyth 阅读全文
posted @ 2020-10-06 15:09 湘九 阅读(1484) 评论(0) 推荐(0) 编辑
摘要:看了网上许多关于super、mro、C3的介绍感觉没有一份很容易初学者理解的文档,直接看C3算法的话,比较难理解,也没必要,如果掌握一套规律的话,会轻松许多。我将网上这些博主的文章进行一个梳理总结,最后形成一套实用的关于super、mro、C3的理解介绍。 1、super super()是一种将子类 阅读全文
posted @ 2020-10-06 14:25 湘九 阅读(420) 评论(0) 推荐(0) 编辑
摘要:一、文章概述 本文将要讲述的是Python环境下如何用OpenCV检测人脸,本文的主要内容分为: 1、检测图片中的人脸2、实时检测视频中出现的人脸3、用运设备的摄像头实时检测人脸 二:准备工作 提前做的准备: 安装好Python3 下载安装OpenCV库,方法是pip install opencv- 阅读全文
posted @ 2020-10-06 13:51 湘九 阅读(400) 评论(0) 推荐(0) 编辑
摘要:我们用Python在做爬虫的时候会遇到很多各式各样的乱码问题,不仅有中文乱码和编码转换,还包括一些如日文、韩文 、俄文、藏文之类的乱码处理,因为他们的解决方式是一致的,故统一说明。 网络爬虫出现乱码的原因 3.网页头中Document定义 Python chardet 字符编码判断 python代码 阅读全文
posted @ 2020-10-05 21:51 湘九 阅读(387) 评论(0) 推荐(0) 编辑
摘要:携程-eleven分析 一、eleven的位置 通过对旁边栈的分析,它是在另一个js文件中调用的。那个js文件是一个自调用的函数,所以我们可以直接copy下来,用浏览器执行看看 执行运行是会报错的, undefind没有call属性 经过调试发现,报错这里是想调用window下面的某一个函数,也就是 阅读全文
posted @ 2020-10-05 21:04 湘九 阅读(604) 评论(0) 推荐(0) 编辑
摘要:python作为一门高级编程语言,它的定位是优雅、明确和简单。我学用python差不多一年时间了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本。 这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些 阅读全文
posted @ 2020-10-05 20:32 湘九 阅读(570) 评论(0) 推荐(1) 编辑
摘要:先来看看今天的受害者: aHR0cDovL3d3dy5taWd1dmlkZW8uY29tL21ncy93ZWJzaXRlL3ByZC9pbmRleC5odG1s 一、分析密码加密 这次分析的是他登陆的三个参数,先分析登陆逻辑,抓个包看看。 可以看到这里用的是弹出的窗口登陆【图1-1】,为了避免主页其 阅读全文
posted @ 2020-10-05 18:53 湘九 阅读(1000) 评论(0) 推荐(1) 编辑
摘要:1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ 3)说明 url会有自动编码中文功能。所以火锅二字指的就是这一串我们不认识的代码%E7%81%AB% 阅读全文
posted @ 2020-10-05 16:26 湘九 阅读(6487) 评论(1) 推荐(0) 编辑
摘要:requests模块介绍 相对于python自带的urllib模块,requests模块提供了相对更高层的api来进行网页访问的工作。 对于requests模块,使用很简单,一般我们会用到两个函数: requests.get(url,params=None,**kwargs) 这里的params是我 阅读全文
posted @ 2020-10-05 15:39 湘九 阅读(770) 评论(0) 推荐(0) 编辑
摘要:不遵守编程规范的程序员,简直就是耍流氓,python为了抵制流氓,特意把核心规范加到了运行环境中。 但也有部分需要靠个人自觉遵守的。 1. 分号:不要在行尾加分号, 也不要用分号将两条命令放在同一行; 2. 字符串: 即使参数都是字符串, 使用%操作符或者格式化方法格式化字符串. 不过也不能一概而论 阅读全文
posted @ 2020-10-05 15:13 湘九 阅读(298) 评论(0) 推荐(0) 编辑
摘要:/1 前言/ 随着网购的兴起,使得很多传统店铺转型做线上生意,电子商务的产生极大便利了我们的生活。 /2 项目目标/ 通过Python程序一键搜索并直达目的地,爬取淘宝商品链接,商品名称,及商品的图片链接,并将每次的操作 记录在日志文件里。 / 3 项目准备/ 采用sublime text 3编辑器 阅读全文
posted @ 2020-10-05 14:32 湘九 阅读(1007) 评论(0) 推荐(0) 编辑
摘要:电子邮件自诞生到现在,依旧是重要的通讯工具.在日常工作大量的告警,自动化报表依旧是通过邮件来完成.以前一直是只发送html正文,前两天遇到了发附件的情况,顺道解决了邮件名乱码的问题,记录一下 正常发送邮件 电子邮件到今天这个时间点,处理垃圾邮件的管控,很多云服务商和电子邮件服务商已经不再支持smtp 阅读全文
posted @ 2020-10-05 13:56 湘九 阅读(602) 评论(0) 推荐(0) 编辑