2020 年 1月 15 日随笔档案 - Rogn

2020年1月15日

摘要：这个程序用来爬取我在博客园所有文章的标题，并用文件存起来。 from requests_html import HTMLSession base_url = 'https://www.cnblogs.com/lfri/default.html?page=' id = 1 def get_title( 阅读全文

posted @ 2020-01-15 21:04 Rogn 阅读(184) 评论(0) 推荐(0) 编辑

requests-html简介

摘要：安装 pip install requests-html 使用官方文档：https://pypi.org/project/requests-html/ 获取网页 requests-html和其他解析HTML库最大的不同点在于HTML解析库一般都是专用的，所以我们需要用另一个HTTP库先把网页下载下阅读全文

posted @ 2020-01-15 16:55 Rogn 阅读(1460) 评论(1) 推荐(1) 编辑

用requests-html爬取7000+PDF

摘要：前不久 requests 的作者 kennethreitz 出了一个新库 requests-html ，它不仅可以请求网页，还可以解析 HTML 文档，话不多说，咱开始吧。安装安装很简单，只要执行： pip install requests-html 分析页面结构通过浏览器审查元素可以发现这个阅读全文

posted @ 2020-01-15 16:17 Rogn 阅读(681) 评论(0) 推荐(0) 编辑

如何得到多个不同的随机数——洗牌算法

摘要：先来思考一个问题：有一个大小为 100 的数组，里面的元素是从 1 到 100 按顺序排列，怎样随机的从里面选择 1 个数？最简单的方法是利用系统的方法 Math.random() * 100 ，这样就可以拿到一个 0 到 99 的随机数，然后去数组找对应的位置就即可。接下来在思考一个问题：有阅读全文

posted @ 2020-01-15 10:44 Rogn 阅读(1364) 评论(0) 推荐(0) 编辑

js实现计数器

摘要：先介绍两个函数： setTimeout() 方法用于在指定的毫秒数后调用函数或计算表达式。 clearTimeout() 方法可取消由 setTimeout() 方法设置的定时操作。如果方法还未被执行，我们可以使用 clearTimeout() 来阻止它。 <!DOCTYPE html> <html 阅读全文

posted @ 2020-01-15 09:31 Rogn 阅读(5620) 评论(0) 推荐(0) 编辑

睡眠排序

摘要：先上代码： const A = [3, 1, 2, 5, 4, 0, 10] const res = [] A.forEach(n => setTimeout(() => res.push(n), n*10)) setTimeout(function(){console.log(res)}, 100 阅读全文

posted @ 2020-01-15 09:12 Rogn 阅读(385) 评论(0) 推荐(0) 编辑

Rogn

公告