clone web site

=============================

分析网站资源

=============================

Edge 打开一个网站, 在开发者工具的源代码中, 查看网站的各种资源文件, 尤其关注一下不常用见扩展名资源文件.

 

 

=============================

下载网站

=============================

使用软件 Win HTTrack Website Copier , 下载地址为 http://www.httrack.com/

set options 窗体中全选所有的扩展名, 并依要clone网站的资源文件适当增加对应的扩展名.

 

WinHTTrack 可支持rewrite link 路径, 缺省的那个设置自动会重写, 有时候反而会导致图片或link失效, 需要切换模式来验证.

 

 

下面是一个常用的扩展名设置.

+*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
+*.gif +*.jpg +*.jpeg +*.png +*.tif +*.bmp
+*.zip +*.tar +*.tgz +*.gz +*.rar +*.z +*.exe
+*.mov +*.mpg +*.mpeg +*.avi +*.asf +*.mp3 +*.mp2 +*.rm +*.wav +*.vob +*.qt +*.vid +*.ac3 +*.wma +*.wmv
+*.wasm

 

 

=============================

预览clone效果

=============================

步骤1: VS code 先安装 live server 插件.

 

 

步骤2: VS code 中使用菜单 file /open folder 的形式打开下载好的网站目录, 比如 d:\sites\www.abc.com

步骤3: VS code 中调用命令 live server: open with live server, 这时候会创建开启本地网站服务, http://127.0.0.1:5500/

   使用Edge浏览器打开该地址, 检查clone效果,

步骤4: 对于 web assembly 二进制文件, HTTrack 貌似下载不了, 我们可以使用edge下载, 下载过程edge会自动做base64 转码, 所以下载后需要手工解码.

 

 

  

 

posted @   harrychinese  阅读(66)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2018-03-05 几本不错的数据仓库和Hadoop书籍
2018-03-05 Kudu系列-基础
点击右上角即可分享
微信分享提示