背景
- 微信公众号的目录界面源码提取出来,然后进一步提取其中的链接,然后批量下载下来
| const fs = require('fs'); |
| const cheerio = require('cheerio'); |
| let path = `./html`; |
| fs.readdir(path, function (err, files) { |
| files.forEach((file) => { |
| console.log(file); |
| if (file.split('.')[1] === 'txt') { |
| fs.readFile(path + '/' + file, 'utf-8', (err, data) => { |
| const $ = cheerio.load(data); |
| |
| |
| const writeStream = fs.createWriteStream( |
| path + '/目录/' + file, |
| 'utf-8' |
| ); |
| $('#js_history_list h4').each((index, ele) => { |
| writeStream.write($(ele).attr('hrefs')); |
| writeStream.write('\n'); |
| }); |
| writeStream.end(); |
| }); |
| } |
| }); |
| }); |
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· 没有源码,如何修改代码逻辑?
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战