百度URL链接中文转码

百度搜索链接规则为:

http://www.baidu.com/s?wd=[搜索词目]&cl=3

有多个搜索词通过加号进行链接:

http://www.baidu.com/s?wd=keyword1+keyword2&cl=3

如果关键词中有中文的话,百度就会将其转码为%开始的编码。常用的编码格式主要有utf-8gbk两种,二者的转码结果是不一样的,下面通过Pythonurllib库进行测试。

# 百度URL链接转码
import urllib
keyword = '测试'
kwd = urllib.parse.quote(keyword, encoding = 'utf-8', errors = 'replace')
print(kwd)
kwd = urllib.parse.quote(keyword, encoding = 'gbk', errors = 'replace')
print(kwd)

结果如下:

%E6%B5%8B%E8%AF%95
%B2%E2%CA%D4

对比浏览器的网址,可知百度采用的是utf-8编码。

参考链接1:关于url链接包含中文编码问题

参考链接2:百度搜索链接中的汉字转码

posted @   Hider1214  阅读(3164)  评论(0编辑  收藏  举报
编辑推荐:
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示