摘要: 1、UA检测 UA,即 User-Agent,是HTTP请求头部信息的一个属性,它是用户访问网站时的浏览器标识,可以通过审查元素或者开发者工具中看到。一些网站通过检测UA从而确定请求的对象是脚本程序还是正常的用户通过浏览器请求,实现反爬虫的目的。 反反爬策略:构造自己的UA池,使得每次用程序向网站发 阅读全文
posted @ 2020-04-13 19:06 极限之旅 阅读(1076) 评论(0) 推荐(0) 编辑
摘要: 旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及坏掉的那些键,打出的结果文字会是怎样? 输入格式: 输入在 2 行中分别给出坏掉的那些键、以及应该输入的文字。其中对应英文字母的坏键以大写给出;每段文字是不超过105个字符的串。可用的字符包括字母[a- 阅读全文
posted @ 2020-04-13 13:21 极限之旅 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 为了用事实说明挖掘机技术到底哪家强,PAT 组织了一场挖掘机技能大赛。现请你根据比赛结果统计出技术最强的那个学校。 输入格式: 输入在第 1 行给出不超过 105 的正整数 N,即参赛人数。随后 N 行,每行给出一位参赛者的信息和成绩,包括其所代表的学校的编号(从 1 开始连续编号)、及其比赛成绩( 阅读全文
posted @ 2020-04-13 12:18 极限之旅 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 爬虫的概念 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。这是百度百科对爬虫的定义,其实,说简单点,爬虫就是利用写好的程序自动的提取网页的信息。 爬虫的价值 抓取互联网上的数据,为自己服务,有了大量的数据 阅读全文
posted @ 2020-04-13 00:22 极限之旅 阅读(698) 评论(0) 推荐(0) 编辑