爬虫

爬虫技术

第一步

    新建一个文件夹,例如spider的文件夹

第二步

    cmd进入项目目录 实行以下命令
    npm init
    npm i puppeteer

第三部

    在项目中新建一个index.js
    并在js中写下:
    const puppeteer = require('puppeteer');

(async ()=>{

    const browse = await puppeteer.launch({headless:false}); //打开一个浏览器
    const page = await browse.newPage(); //在浏览器中打开一个空白页面(标签)
    await page.goto('http://www.xiaohongshu.com/discovery/item/5b17b70126c62449154ed5ab'); // 打开链接
    
})();

第四部

    在cmd中运行项目:
    node index

谷歌官方爬虫文档:
https://pptr.dev/#?product=Puppeteer&version=v1.5.0&show=api-class-browser

posted @ 2019-08-03 16:01  dobeco  阅读(93)  评论(0编辑  收藏  举报