08 2019 档案
摘要:安装 urllib库更适合写爬虫文件,scrapy更适合做爬虫项目。 步骤: 1. 先更改pip源,国外的太慢了,参考:https://www.jb51.net/article/159167.htm 2. 升级pip:python m pip install upgrade pip 3. pip i
阅读全文
摘要:题意 给你一个1~n的排列,由两种操作: 1 pos:将a[pos]+10 000 000 2 r k:求大于等于k且不等于a[1~r]的数的最小值。 强制在线。 思路 如果没有1操作,那么我们直接主席树就OK了。 考虑不真正的进行修改,每次1操作就把a[pos]插进set,因为加10 000 00
阅读全文
摘要:题意 链接:https://vjudge.net/problem/HDU 6586 给你一个字符串和k,还有每个字符出现次数的限制,求一个长度为k的字典序最小的满足限制的子序列。 思路 先构造出序列自动机,顺带把num(i,j)(下标为i后面的字符为j的个数)求出来。 题目要求字典序最小,我们就贪心
阅读全文
摘要:题意 链接:https://vjudge.net/problem/HDU 6582 给定一个有向图,可以有重边,每条边上有一个权值表示删掉这条边的代价,问最少花费多少代价能使从s到t节点的最短路径增大?1≤n,m≤10000 思路 容易想到应该是删最短路上的边,最短路可能不止一条,所以使原图1到n的
阅读全文
摘要:题意 https://nanti.jisuanke.com/t/A1955 求所有本质不同的回文串转成数后的和。 思路 如果了解回文树的构造原理,那么这题就很简单了,回文树每个结点代表一个回文串,每添加一个字符会在两端加上这个字符,我们只需要用res[]数组表示原串的前缀和,然后每添加一个字符的贡献
阅读全文
摘要:题意 链接:https://nanti.jisuanke.com/t/A1998 给出一个有根树(根是1),有n个结点。初始的时候每个结点的值都是0.下面有q个操作,操作有两种,操作1.将深度为L(根节点深度为0)的点的值全部增加X。操作2.查询以x为根的子树的结点值得和。其中N,Qblock。 对
阅读全文
摘要:用户代理池 用户代理池就是将不同的用户代理组建成为一个池子,随后随机调用。 作用:每次访问代表使用的浏览器不一样 IP代理与IP代理池的构建的两种方案 搜索西刺、大象代理IP 尽量选国外的IP。 IP代理池构建的第一种方式(适合代理IP稳定的情况) IP代理池构建的第二种方式(接口调用法,更适合代理
阅读全文
摘要:urllib基础 urlretrieve() urlretrieve(网址,本地文件存储地址) 直接下载网页到本地 urlcleanup() 清除缓存 info() 查看网页简介 getcode() 输出网页爬取状态码,200为正常,其他都不正常 geturl() 获取当前访问的网页的url 超时设
阅读全文
摘要:题意 链接:https://cn.vjudge.net/problem/HDU 4729 给你n个点,然你求两个点s和t之间的最大流.而且你有一定的钱k,可以进行两种操作 1.在任意连个点之间建立一个单位1的流,费用a 2.将原先的流扩大1个单位,费用b 思路 题目已经说了是一棵树,那么树上两点的最
阅读全文
摘要:原子 原子是正则表达式中最基本的组成单位,每个正则表达式中至少要包含一个原子。 常见的原子类型: 1. 普通字符作为原子 2. 非打印字符作为原子 3. 通用字符作为原子 4. 原子表 元字符 元字符是正则表达式中具有一些特殊含义的字符,比如重复N此前面的字符等。 1. ".":除换行符外任意一个字
阅读全文