如何自由地复制网页上的内容?轻松破解网页限制和某度文库付费内容

网上冲浪时,少不了有复制网页内容的情况。

但如今的情况是怎么样的呢?很多网站禁止复制,禁止右键菜单,甚至弹框、要求开会员、......

这不欺负老实人吗?真想复制还能拦得住?

​​

本文就分享一些在浏览器中关于复制的技巧,例如复制网址,解除复制限制的原生方法,解除限制的扩展和脚本(推荐),复制表格、图片里的文字,剪贴板消毒等内容。

‍‍> ‍如果你会用扩展,前面的原生方法可以略过

复制网址

你可能会觉得,复制个网址,谁还不会了?

如果你的网址中,带有中文、日文等非英文字符,就会被浏览器通过 URL 编码,转换为一堆数字 + 英文字母 + 符号。

举个例子,在百度里搜索 “中文” 这两个字,网址是这样的:

但如果你此时去到地址栏,按下 Ctrl + A 全选网址,然后 Ctrl + C 复制,粘贴到一个记事本之类的地方,你会发现是这样的:

https://www.baidu.com/s?wd=%E4%B8%AD%E6%96%87

这行字符串,就是经过 URL 编码后的内容。这是为了防止某些服务器不支持中文、日文等字符。

所以,当你直接复制网址给他人看的时候,可读性是很差的:

个人建议:复制网址时,不要全选然后复制,可以少复制一个字符(例如开头的 h),例如:

ttps://zh.vietnamplus.vn/越共中央政治局要求研究取消县级行政单位合并部分省级行政单位-post235800.vnp

然后在前面加上 h 即可,这样复制出来的网址不会经过 URL 编码。

当然,你也可以在开头加个单引号之类的也行,效果是一样的。

此外,我搜了下,好像没有解决类似需求的扩展和脚本。

想了解更多关于编码、URL 编码的内容,可以看我写的博客《编码系列之 URL 编码

基本技巧

先介绍几个基本的技巧。

最简单的技巧,就是直接用鼠标选中要复制的文字:

mouse-click

如果要复制的内容比较长,用鼠标选的话太多,我们可以用 Shift + 左键的方式:先用鼠标左键点一下文字开头,然后把鼠标移动到文字结尾,按下 Shift + 左键,中间的内容就会被选中。

mouse-shift+click

虽然还可以按下 Ctrl + A 全选网页内容,但这种情况比较少见。

还有的时候,我们要复制超链接上的文字。但用鼠标拖动会直接把链接拖出来,用鼠标点又容易直接跳转到新页面:

mouse-link

这个时候只需要按住 Alt 键,就可以对界面上的文字任意选中了:

mouse-alt-link

Alt + 左键单击链接,还能把对应的网页下载下来(相当于 Ctrl + S),碰到喜欢的网站就可以这样把它保存到本地,永久收藏。

禁止复制的情况

但很多国内的网站,对复制功能做了限制,经常要登录:

就连代码块,都要登录后才能复制(这是当着程序员的面,骑脸输出啊):

下面分享几个解决办法。

使用打印预览

在菜单里点击打印:

在打印模式中复制内容:

注意,有些网站修改了 Ctrl + P 快捷键,按了后不会激活打印模式,为的就是不让你保存(没错,就是某数字公司的网站)。

但这样很麻烦,而且打印页面排版容易乱,不方便看:

禁用 JS

JS 是前端开发编程语言,很多禁用复制的功能就是靠它实现的。

所以,禁用它,大部分情况就可以复制了。

先按下 F12 打开「开发者工具」,或者在浏览器菜单 → 更多工具 → 开发者工具

然后点击弹出页面右上角的齿轮按钮,往下找到「停用 JavaScript」,然后勾选上:

然后再尝试复制,一般都能成功。

你也可以可以在浏览器地址栏输入 javascript:void ($={});​,然后回车,也能起到类似的结果。

注意:该命令不能复制粘贴,因为复制上去你会发现前面 javascript 被删除了,因此只能手动输入.

从源代码复制

同样的,打开开发者工具,点击左上角的图标(或者快捷键 Ctrl + Shift + C):

然后用鼠标,选中要复制的内容,能在开发者工具中看到源代码,然后再复制即可:

还可以:

  • 按下 Ctrl + U,打开源码,找到对应的文字
  • 将网页保存下来(Ctrl +S),然后用文本文件打开,也能复制源代码。

使用阅读模式

有些浏览器(例如 Edge),可以在网址前加上 read:​ 来启动阅读模式,从而轻松复制网页内容。

image

注意

  • 别漏了 read 后面的英文冒号
  • 部分网站不适用该功能

使用 OCR

OCR,全称 Optical Character Recognition,光学字符识别,就是识别图片上的文字。

你可以直接用 OCR 软件去识别网页上的内容,遇到图片就截图保存。

OCR 功能其实很常见,微信 / QQ 就有,截图时有个「提取文字」的选项:

使用第三方扩展 / 脚本

相信看到这,你会觉得以上介绍的方法都很麻烦。

如果用扩展或脚本的方式解决,就可以很轻松地解决。

扩展:

  • Simple Allow Copy:安装后,在要网站上单击扩展图标,变成彩色,就可以轻松复制了。用户有 70w+
  • code-box:开源,用来解除各种博客网站的限制(不仅包括复制),有着 2w+ 用户
  • 网页万能复制:一键破解禁止右键、破解禁止选择、解除禁止全选、解除禁止复制、解除禁止粘贴
  • Force Copy:有 5000+ 用户
  • SuperCopy:有 60w+ 用户,Chrome 精选插件,但是被 V2EX 用户曝劫持流量,目前还未下架,不推荐使用
  • ......

脚本:

复制表格

复制页面中的表格,并不是一个非常高频的需求,但总有可能遇上。

一般来说,如果你有使用 Markdown,直接复制网页表格,然后粘贴到 Markdown 文件即可。

或者,我们可以用一些表格处理工具。

专业的表格处理网站:https://tableconvert.com,能轻松转换 Excel、CSV、XML、JSON 等格式的内容为 Markdown

浏览器扩展:Table Copier,可以快速将网页中的表格以 Markdown​、HTML​、Excel​ 等格式拷贝到剪贴板

复制图片里的文字

在网黑哥的 文章 里看到一个不错的扩展:Project Naptha,有着 30w 用户。

有的时候我们在浏览网页时,想复制网页里的图片中的文字,又懒得调用 OCR 软件进行文字识别,就可以用它。

安装后,鼠标移动到图片里的文字上面,就可以直接进行选中然后复制了。

Project-Naptha-copy

它还有一个很强的功能:擦除文字。选中不要想的文字后,右键,选择在 Translate—Erase Text 即可:

Project-Naptha-erase

是不是有点哈利波特魔法世界的感觉?

但想要擦除文字后的照片的话,就只能进行截图了,直接下载图片还是有文字的。

复制文字和擦除文字是 Project Naptha 最好用的两个功能,它还有其他功能:高亮,编辑,标注,翻译(不太好用)。

剪贴板消毒

很多网站,会在用户复制后,再后面加上一些信息,例如广告,网站信息,版权声明等,非常烦人。

相应的,也有几个脚本能去除这些限制:

拷贝猫

拷贝猫 支持将复制的内容,转为其他格式,例如:

  • 复制标签页标题
  • 复制标签页链接为:纯文本,富文本,HTML,Markdown,Org-Mode,AsciiDoc,BBCode
  • 复制链接文本
  • 复制链接为:纯文本,富文本,HTML,Markdown,Org-Mode、AsciiDoc,BBCode,
  • 复制选中内容为:纯文本,JSON,Markdown,HTML,BBCode
  • 复制图片为:HTML,Markdown,BBCode,Data URL
  • 复制原生音频为HTML
  • 复制原生视频为HTML

使用方式:选中内容,在鼠标上右键即可选择

该扩展对开发者来说应该用得上,普通用户可能没这样的需求。

最后

相信通过本文,你能彻底解决在网页中复制相关的问题,也欢迎补充其他技巧 😃

原文:如何自由地复制网页上的内容?轻松破解网页限制和某度文库付费内容

posted @   peterjxl  阅读(184)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
点击右上角即可分享
微信分享提示