typescript 学习笔记 - 简单网页爬虫1:爬取整个网页的内容
1. 新建文件夹。 crowller
2. 在文件夹下,进行 npm init -y ,进行初始化,出现package.json文件。
3. 在文件夹下,进行 tsc --init , 新增typescript的配置文件 tsconfig.json
4. 安装typescript文件,ts-node工具
npm install typescript --save-dev
npm install ts-node --save-dev
5. 在crowller文件夹下,新建 src文件夹,src文件夹下,新建crowller.ts文件
打开package.json文件,在script{}中,写入命令行
"scripts": { "dev": "ts-node ./src/crowller.ts" },
6. 打开crowller.ts,进行编写代码。
过程中使用到 superagent 这个包,superagent 轻量的Ajax api。
superagent是js编写,在ts语法中直接引入这个类库,ts不知道这个类库会有什么方法。所以需要安装一个类型定义文件 *.d.ts :npm i @types/superagent
npm i superagent --save
npm i @types/superagent
import superagent from 'superagent' class Crowller { private _url: string; private rowHtml = ''; constructor(url:string){ this._url = url; this.getRawHtml(); }; async getRawHtml(){ const result = await superagent.get(this._url) this.rowHtml = result.text console.log(this.rowHtml); } get url(){ return this._url } set url(url){ this._url = url } } const r = new Crowller('https://www.cnblogs.com/shine-lovely/p/12777684.html')
7. 在终端中运行 npm run dev
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· DeepSeek 开源周回顾「GitHub 热点速览」
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了