Fork me on GitHub

wget获取整站

wget -m -e robots=off https://www.baidu.com
-m是克隆整个网站,-e robots=off是让wget忽视robots.txt

如果网站有中文路径，最好用以下命令

wget -r -p -np -k --restrict-file-names=nocontrol http://www.baidu.com

转自：http://blog.lanyus.com/archives/38.html

posted @ 2016-07-12 23:23 _落雨阅读(764) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中，后端往往是效率杀手？
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考

阅读排行：
· DeepSeek 解答了困扰我五年的技术问题。时代确实变了！
· PPT革命！DeepSeek+Kimi=N小时工作5分钟完成？
· What？废柴，还在本地部署DeepSeek吗？Are you kidding？
· 赶AI大潮：在VSCode中使用DeepSeek及近百种模型的极简方法
· DeepSeek企业级部署实战指南：从服务器选型到Dify私有化落地