【油猴脚本】百度-原创力-人人-豆丁-道客-豆丁建筑文档下载
【油猴脚本】百度-原创力-人人-豆丁-道客-豆丁建筑文档下载
描述
这是一个用于 Tampermonkey 或其他支持用户脚本的浏览器扩展的油猴脚本。
看到论坛经常有小伙伴们需要下载某创力文档-某人文库一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才能下载文档,该脚本就是为了解决您的烦恼而诞生,尽可能做到自动化。
安装
- 安装 Tampermonkey 浏览器扩展。
- 点击 脚本链接 或手动复制脚本代码。
- 在 Tampermonkey 中创建一个新脚本,将代码粘贴到编辑器中并保存。
原理说明
一般在线文档有以下几种方式展示在线文档预览功能:
- 将图片绘制成画布呈现
- 将二进制数据绘制画布
- 多种图片拼接页面渲染
- 直接图片渲染页面
所以该脚本只是将画布或图片在浏览器渲染时进行下载拼接成PDF文件,无法下载原始文件,并非破解,只要是你浏览器可以看到就可以下载。宗旨就是你能看到多少,就能下载多少。
核心技术点解决一个文档由多个域名提供图片,解决跨域问题。
以上两个文档库中的文档,大部分文档都是来自好几个域名,并且有跨域问题,也就是说如果在当前页面通过JavaScript
直接下载图片会产生跨域
问题,这也是为什么网上其他脚本针对这两个网站只能提供图片下载地址,不能直接下载的根本原因。
解决跨域最简单的办法就是同源,在脚本中动态添加 iframe
元素,通 iframe
内联元素框架打开当前图片所在域名,将需要下载的图片当 iframe
页面内下载,再通过 postMessage
方法将Blob
数据传回主页面进行保存。
当然也许有其他更好的办法解决,此脚本只是基于JavaScript进行处理,不借助额外第三方工具(下载,合并等exe文件)处理为前提。
平台/功能
📖 支持平台 | 支持 |
---|---|
百度文库 | ✅ |
原创力文档 | ✅ |
人人文库 | ✅ |
豆丁网 | ✅ |
道客巴巴 | ✅ |
📚 文档类型 | 百度文库 | 原创力文档 | 人人文库 | 豆丁网/豆丁建筑 | 道客巴巴 |
---|---|---|---|---|---|
✅ | ✅ | ✅ | ✅ | ✅ | |
WORD | ✅ | ✅ | ✅ | ✅ | ✅ |
PPT | ✅ | ✅ | ✅ | ✅ | ✅ |
TXT | ✅ | ❌ | ❌ | ❌ | ❌ |
💻支持功能 | 百度文库 | 原创力文档 | 人人文库 | 豆丁网/豆丁建筑 | 道客巴巴 |
---|---|---|---|---|---|
状态位 | ✅ | ✅ | ✅ | ✅ | ✅ |
自动预览 | ✅ | ✅ | ✅ | ✅ | ✅ |
停止预览 | ✅ | ✅ | ✅ | ✅ | ✅ |
下载图片 | ✅(PPT,图片PDF) | ✅ | ✅ | ✅ | ✅ |
下载PDF | ✅(PPT,图片PDF) | ✅ | ✅ | ✅ | ✅ |
获取文本 | ✅(WORD,可编辑PDF) | ❌ | ❌ | ❌ | ❌ |
打印PDF | ✅ | ❌ | ❌ | ❌ | ❌ |
获取地址 | ✅ 部分 | ✅ | ✅ | ❌ | ❌ |
1->2->3 执行优先级
功能 | 解释说明 |
---|---|
状态位 | 各个功能执行状态,当前进度。 |
(1)自动预览 | 就是替你滚动页面,让所有页面进入可视范围内。百度文库必须使用自动预览功能,其他手动也行。 |
(2)停止预览 | 顾名思义就是停下来,别动了 |
(3)下载图片 | 把所有图片打包成压缩包下载,方便你们后续二次处理,例如:OCR识别 |
(3)下载PDF | 把所有图片合并导出 PDF 文件 |
(3)获取文本 | 文本内容 |
(3)打印PDF | 浏览器本身打印功能,Ctrl+P 键也可以拉起来,“目标打印机处”点击另存为PDF即可 |
(3)获取地址 | 把所有图片地址导出来自己处理,不一定有数据取决于文档类型 |
注意事项
F5
刷新能解决大部分问题- 功能按钮要依次执行不要到处乱点,需等待上一个功能执行完成再执行下一个功能
平台 | 注意事项 |
---|---|
百度文库 | PDF 格式分为:可编辑,不可编辑,图片格式,下载PDF只支持图片格式。当遇到下载空白页时使用打印PDF功能。可编辑PDF 文件可以点击编辑文档,再自动预览打印PDF,这样就得到了一个可以复制内容的PDF文件。支持复制文本内容和全局文档复制功能(左上角展示当前复制内容文本框)。text 类型点击自动预览后点击获取全文 即可,可以使用过打印。其他类型文件自行探索大部分都支持。 word/PDF 自动预览后就不能复制文本了,若要复制文本就不要执行自动预览。可编辑文档优先使用可编辑下预览 |
原创力文档 | PPT 下载过程中如果点击停止预览后,想要继续预览全文需要刷新页面从头开始。全屏预览不要缩小浏览器。 |
人人文库 | 从侧边栏“相似文档”点击切换文档可能无法下载,需要 F5 刷新后就可以了 |
豆丁网/豆丁建筑 | 想要获取更多文章内容需要登录自己账号,默认只展示一部分内容。 |
道客巴巴 | 没啥注意的 |
示例
📚 示例文档 | 百度文库 | 原创力文档 | 人人文库 | 豆丁网/豆丁建筑 | 道客巴巴 |
---|---|---|---|---|---|
图片格式 可编辑 | |||||
WORD | word word | word | word | word | |
PPT | ppt | ppt | ppt | ppt 建筑 | |
TXT | TXT | ❌ | ❌ | ❌ | ❌ |
授权
@license Apache-2.0
兼容性
谷歌浏览器
注意事项
注意: 请确保遵循网站的使用条款和政策。自行承担风险。
- 本脚本完全免费。
- 仅供学习交流,严禁用于商业用途,请勿传播下载的数据。
- 本脚本所获取的资源完全合法,与浏览器能直接获得的资源一致,不存在逆向破解。
- 使用脚本造成的影响由使用者承担。
哇!又赚了一天人民币
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 本地部署 DeepSeek:小白也能轻松搞定!
· 如何给本地部署的DeepSeek投喂数据,让他更懂你
· 在缓慢中沉淀,在挑战中重生!2024个人总结!
· 大人,时代变了! 赶快把自有业务的本地AI“模型”训练起来!
· 从 Windows Forms 到微服务的经验教训