摘要: 以爬慕课网Hadoop进阶课程为例,用Node写一个简单的爬虫: 先抓取这个网站的源码: 然后分析这个页面的Dom,如图: 每大章节都被一个chapter包围,抓取下来就是一个数组,对每个item,这张的大标题在strong里面,每章的小章节在video标签里,然后小标题就是J-media-item 阅读全文
posted @ 2017-09-24 16:44 Lawliet__zmz 阅读(177) 评论(0) 推荐(0) 编辑