摘要: 这个程序用来爬取我在博客园所有文章的标题,并用文件存起来。 from requests_html import HTMLSession base_url = 'https://www.cnblogs.com/lfri/default.html?page=' id = 1 def get_title( 阅读全文
posted @ 2020-01-15 21:04 Rogn 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 安装 pip install requests-html 使用 官方文档:https://pypi.org/project/requests-html/ 获取网页 requests-html和其他解析HTML库最大的不同点在于HTML解析库一般都是专用的,所以我们需要用另一个HTTP库先把网页下载下 阅读全文
posted @ 2020-01-15 16:55 Rogn 阅读(1460) 评论(1) 推荐(1) 编辑
摘要: 前不久 requests 的作者 kennethreitz 出了一个新库 requests-html ,它不仅可以请求网页,还可以解析 HTML 文档,话不多说,咱开始吧。 安装 安装很简单,只要执行: pip install requests-html 分析页面结构 通过浏览器审查元素可以发现这个 阅读全文
posted @ 2020-01-15 16:17 Rogn 阅读(681) 评论(0) 推荐(0) 编辑
摘要: 先来思考一个问题:有一个大小为 100 的数组,里面的元素是从 1 到 100 按顺序排列,怎样随机的从里面选择 1 个数? 最简单的方法是利用系统的方法 Math.random() * 100 ,这样就可以拿到一个 0 到 99 的随机数,然后去数组找对应的位置就即可。 接下来在思考一个问题: 有 阅读全文
posted @ 2020-01-15 10:44 Rogn 阅读(1364) 评论(0) 推荐(0) 编辑
摘要: 先介绍两个函数: setTimeout() 方法用于在指定的毫秒数后调用函数或计算表达式。 clearTimeout() 方法可取消由 setTimeout() 方法设置的定时操作。如果方法还未被执行,我们可以使用 clearTimeout() 来阻止它。 <!DOCTYPE html> <html 阅读全文
posted @ 2020-01-15 09:31 Rogn 阅读(5620) 评论(0) 推荐(0) 编辑
摘要: 先上代码: const A = [3, 1, 2, 5, 4, 0, 10] const res = [] A.forEach(n => setTimeout(() => res.push(n), n*10)) setTimeout(function(){console.log(res)}, 100 阅读全文
posted @ 2020-01-15 09:12 Rogn 阅读(385) 评论(0) 推荐(0) 编辑