文章分类 -  python-爬虫

爬虫
摘要:CS架构与BS架构 CS架构 是Client/Service这两个单词的首字母,指的是客户端服务器架构的意思,很多常见的软件都是这种架构。 解释: 对于CS架构,最为常见的例子就是网络游戏,比如LOL、WOW如果不联网无法使用,你在软件内的所有操作通过互联网能够传递到其他的玩家身上。 优点: 第一, 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(8) 评论(0) 推荐(0) 编辑
摘要:理论知识-操作系统 2022年7月25日 14:30 操作系统 现代的计算机系统主要是由一个或者多个处理器,主存,硬盘,键盘,鼠标,显示器,打印机,网络接口及其他输入输出设备组成。 一般而言,现代计算机系统是一个复杂的系统。 其一:如果每位应用程序员都必须掌握该系统所有的细节,那就不可能再编写代码了 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(10) 评论(0) 推荐(0) 编辑
摘要:发邮件 2022年7月31日 14:37 import os from openpyxl import load_workbook import win32com.client as win32 wb = load_workbook("``邮件地址``.xlsx") ws = wb.active a 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(4) 评论(0) 推荐(0) 编辑
摘要:Urllib 2021年12月9日 20:21 Python urllib Python urllib 库用于操作网页 URL,并对网页的内容进行抓取处理。 本文主要介绍 Python3 的 urllib。 urllib 包 包含以下几个模块: urllib.request - 打开和读取 URL。 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(9) 评论(0) 推荐(0) 编辑
摘要:sys模块 2022年7月12日 21:13 sys.argv: 参数字符串列表(动态对象),第一个参数为当前程序主文件的绝对路径或空字符串,如果在命令提示符界面给``Python``文件传了参数(不同的参数以空格分隔,无论传入的时候写的是什么类型,最终都会转成字符串),可以在这里面获取(从第二个位 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(57) 评论(0) 推荐(0) 编辑
摘要:基础知识 面对对象: 核心是“对象”二字 对象就是将程序高度整合 对象是“容器”,用来存放数据和功能 类也是容器:该容器用来存放同类对象的数据与功能,类的对象是类似于数据和功能的集合体,所以类中最常见的是变量和函数的定义,但是类体中可以包含其他代码 优点:提升程序的解耦合度,进而增强程序的可扩展性 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(14) 评论(0) 推荐(0) 编辑
摘要:编程风格 \#!/usr/bin/env python #在文件头部 ( 第一行 ) 加上 设置 Python 解释器 \# -*- coding: utf-8 -*- #在文件头部 ( 第二行 ) 加上 在编辑器中设置以 UTF-8 默认编码保存文件 \# Copyright (c) *** #版 阅读全文
posted @ 2022-11-17 12:40 小符玩代码 阅读(31) 评论(0) 推荐(0) 编辑
摘要:Selenium基础 2021年11月9日 17:12 selenium 自动化流程如下: 自动化程序调用Selenium 客户端库函数(比如点击按钮元素) 客户端库会发送Selenium 命令 给浏览器的驱动程序 浏览器驱动程序接收到命令后 ,驱动浏览器去执行命令 浏览器执行命令 浏览器驱动程序获 阅读全文
posted @ 2022-11-17 11:56 小符玩代码 阅读(109) 评论(0) 推荐(0) 编辑
摘要:爬虫面试题汇总 一.项目问题: 1.你写爬虫的时候都遇到过什么反爬虫措施,你最终是怎样解决的 1.你写爬虫的时候都遇到过什么反爬虫措施,你最终是怎样解决的 通过headers反爬虫:解决策略,伪造headers 基于用户行为反爬虫:动态变化去爬取数据,模拟普通用户的行为, 使用IP代理池爬取或者降低 阅读全文
posted @ 2022-11-16 17:39 小符玩代码 阅读(217) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示