随笔分类 -  node

摘要:puppeteer简介 puppeteer是Chrome团队开发的一个node库,可以通过api来控制浏览器的行为,比如点击,跳转,刷新,在控制台执行js脚本等等。有了这个神器,写个爬虫,自动签到,网页截图,生成pdf,自动化测试什么的,都不在话下。 puppeteer的简单例子 代码来自官网: 阅 阅读全文
posted @ 2018-03-18 21:28 饭特稠 阅读(11314) 评论(0) 推荐(0) 编辑
摘要:最近要做一个功能,导出动态生成的excel文件,这个普普通通的功能却让我折腾了半天。大致流程是这样的,将数据结合excel模板通过ejsExcel库,动态生成excel文件,并发送到客户端。 在express中有两个方法:res.sendFile()和res.download()都是用来发送文件的, 阅读全文
posted @ 2017-09-15 22:45 饭特稠 阅读(2343) 评论(0) 推荐(0) 编辑
摘要:这一个月以来,断断续续整理数据,制作了一份 "博客园排行榜" 。访问的时候加载时间可能比较长。数据根据博客园 "积分前三千名" 得到的数据 排序 点击各列标题可以对随笔数,园龄,最受欢迎的文章的阅读量,粉丝数进行排序。 由于中间可能有没有数据的情况,有时候可能要多点一次才能正确排序 搜索 用jets 阅读全文
posted @ 2017-05-03 22:38 饭特稠 阅读(2270) 评论(4) 推荐(3) 编辑
摘要:多了个尾巴 有时候,当你尝试在地址栏输入 的时候,会发现浏览器会重定向到 这个地址,也就是多了个 ,发生了重定向。有图为证: 上面这个图是在地址栏输入 的截图,根据这张图,可以分析,从开始请求到页面显示的过程是这样的: 1. 当在浏览器中输入上面的地址时,服务器首先返回一个状态码为301的响应,同时 阅读全文
posted @ 2017-04-22 22:07 饭特稠 阅读(1990) 评论(0) 推荐(1) 编辑
摘要:数说博客园之 随笔总数 前两天在博客园首页的一个角落里发现一个有意思的链接:这个页面汇总了博客园积分前3000名的用户。 "博客列表(按积分)" ,这里列出了博客园的积分前三千名。恰好这阵子在折腾爬虫,就想着从这张页面上能不能发现一些有意思的东西,就有了这篇文章。 先看一张图: 随笔10000+ 这 阅读全文
posted @ 2017-04-09 23:36 饭特稠 阅读(411) 评论(1) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2017-03-27 21:39 饭特稠 阅读(2314) 评论(0) 推荐(1) 编辑
摘要:话说,关于正则表达式有一个梗,大意是: 假如你有一个问题,想用正则来解决,于是你就有了两个问题 这句话侧面反映了精通正则是一件不容易的事。比如我今天遇到的诡异事件。 情景回放 这两天练手写了一个爬用户在博客园所有文章阅读量的简单爬虫。可以输出某用户的随笔总阅读量。如在命令行输入: 得到总阅读量是36 阅读全文
posted @ 2017-03-26 12:06 饭特稠 阅读(947) 评论(0) 推荐(0) 编辑
摘要:学习ES6的时候,没少看 "ES6入门" ,到现在也就明白了个大概(惭愧脸)。这里不谈ES6,只谈怎么把ES6的页面爬下来放到一起成为一个离线文档。 之前居然没注意过作者把这本书开源了。。瞎耽误功夫。。。 "地址" 通俗易懂_ 小白friendly _ node 爬虫入门 如果你之前没有用node写 阅读全文
posted @ 2017-03-17 22:32 饭特稠 阅读(637) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示