随笔分类 - nodejs

nodejs爬虫笔记(五)---利用nightmare模拟点击下一页

摘要：目标以腾讯滚动新闻为例，利用nightmare模拟点击下一页，爬取所有页面的信息。首先得感谢node社区godghdai的帮助，开始接触不太熟悉nightmare，感觉很高大上，自己写代码的时候问题也很多，多亏大神的指点。一、选择模拟的原因腾讯滚动新闻，是每六十秒更新一次，而且有下一页。要是直阅读全文

posted @ 2017-08-07 10:35 半夜打老虎阅读(9649) 评论(1) 推荐(0) 编辑

nodejs爬虫笔记(四)---利用nightmare解决加载更多问题

摘要：目标：解决页面加载更多问题。笔记三中，我们只爬取到网页的部分信息，而点击加载更多后的页面内容是没有提取到的。开始我的想法是找到加载更多的数据接口（可参照：http://www.jianshu.com/p/3fdb6ab47aef），但是我又发现一个问题，当我打开一个订阅号页面时，找到数据接口如下图阅读全文

posted @ 2017-08-02 11:03 半夜打老虎阅读(3896) 评论(0) 推荐(1) 编辑

nodejs爬虫笔记(三)---爬取YouTube网站上的视频信息

摘要：思路：通过笔记（二）中代理的设置，已经可以对YouTube的信息进行爬取了，这几天想着爬取网站下的视频信息。通过分析YouTube，发现可以从订阅号入手，先选择几个订阅号，然后爬取订阅号里面的视频分类，之后进入到每个分类下的视频列表，最后在具体到每一个视频，获取需要的信息。以订阅号YouTube 电阅读全文

posted @ 2017-07-30 19:10 半夜打老虎阅读(5504) 评论(0) 推荐(0) 编辑

nodejs爬虫笔记(二)---代理设置

摘要：node爬虫代理设置最近想爬取YouTube上面的视频信息，利用nodejs爬虫笔记(一)的方法,代码和错误如下由于国内访问youtube的时候需要FQ，而在代码里我们需要通过设置代理才能获取页面信息。 1、通过nodejs的http/https模块具体使用可以参考http://nodejs. 阅读全文

posted @ 2017-07-10 20:38 半夜打老虎阅读(3447) 评论(0) 推荐(0) 编辑

nodejs爬虫笔记(一)---request与cheerio等模块的应用

摘要：目标：爬取慕课网里面一个教程的视频信息，并将其存入mysql数据库。以http://www.imooc.com/learn/857为例。一、工具 1.安装nodejs：（操作系统环境：WiN 7 64位）在Windows环境下安装相对简单（ps:其他版本我也不太清楚，可以问度娘） http:// 阅读全文

posted @ 2017-07-06 10:50 半夜打老虎阅读(25064) 评论(2) 推荐(0) 编辑

公告

昵称：半夜打老虎
园龄： 7年8个月
粉丝： 52
关注： 5

+加关注

2025年3月

日

一

二

三

四

五

六

半夜打老虎

随笔分类 - nodejs

公告

搜索

常用链接

最新随笔

我的标签

随笔分类 (232)

随笔档案 (181)

阅读排行榜

评论排行榜

推荐排行榜

最新评论