使用 superagent 和 cheerio 爬取、解析网页(nodejs)
安装依赖:
npm install superagent cheerio --save
同步代码:
const superagent = require('superagent')
const cheerio = require('cheerio')
const fs = require('fs')
function getNews() {
return new Promise((resolve, reject) => {
superagent.get('https://a.b.c.cn/').end((err, data) => {
if (err) {
reject('error')
} else {
const $ = cheerio.load(data.text)
var lst = []
$('#blk_cjkjqcfc_011 a').each((index, item) => {
var tex = $(item).text()
if (tex && !tex.endsWith('|')) {
lst.push(tex.replaceAll('\n', ''))
}
})
resolve(lst)
}
})
})
}
async function main() {
var res = await getNews()
console.log(res)
}
main()
沉舟侧畔千帆过,病树前头万木春。