nodejs爬虫

1.安装cheerio npm install cheerio

2.加载网页源码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
function LoadHtml(url,callback){
    https.get(url, (res) => {
        var chunks = [];
        var size = 0;
        res.on('data', (chunk) => {
            chunks.push(chunk);
            size += chunk.length;
        });
        res.on('end', () => {
            var data = Buffer.concat(chunks, size);
            var html = data.toString();
            if(callback)
            {
                callback(html);
            }
        });
        res.on('error', () => {
            callback('');
        });
    });
}

3.开始获取节点数据 let $ = cheerio.load(html); let node= $('标签名.类名');

posted @   游戏鼻祖  阅读(7)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
历史上的今天:
2017-10-23 unity 同一标签里内容拥有不同颜色
点击右上角即可分享
微信分享提示