百度URL链接中文转码
百度搜索链接规则为:
http://www.baidu.com/s?wd=[搜索词目]&cl=3
有多个搜索词通过加号进行链接:
http://www.baidu.com/s?wd=keyword1+keyword2&cl=3
如果关键词中有中文的话,百度就会将其转码为%开始的编码。常用的编码格式主要有utf-8
、gbk
两种,二者的转码结果是不一样的,下面通过Python
的urllib
库进行测试。
# 百度URL链接转码
import urllib
keyword = '测试'
kwd = urllib.parse.quote(keyword, encoding = 'utf-8', errors = 'replace')
print(kwd)
kwd = urllib.parse.quote(keyword, encoding = 'gbk', errors = 'replace')
print(kwd)
结果如下:
%E6%B5%8B%E8%AF%95
%B2%E2%CA%D4
对比浏览器的网址,可知百度采用的是utf-8编码。
参考链接1:关于url链接包含中文编码问题
参考链接2:百度搜索链接中的汉字转码
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)