爬虫
爬虫技术
第一步
新建一个文件夹,例如spider的文件夹
第二步
cmd进入项目目录 实行以下命令
npm init
npm i puppeteer
第三部
在项目中新建一个index.js
并在js中写下:
const puppeteer = require('puppeteer');
(async ()=>{
const browse = await puppeteer.launch({headless:false}); //打开一个浏览器
const page = await browse.newPage(); //在浏览器中打开一个空白页面(标签)
await page.goto('http://www.xiaohongshu.com/discovery/item/5b17b70126c62449154ed5ab'); // 打开链接
})();
第四部
在cmd中运行项目:
node index
谷歌官方爬虫文档:
https://pptr.dev/#?product=Puppeteer&version=v1.5.0&show=api-class-browser