随笔分类 -  爬虫

数据挖掘
摘要:因为爬虫要解析 &#x880cc这种字体编码的值,下载到一个ttf文件,用百度字体编辑器 打开,可以看到每个字符对应的Unicode (数字下方 $23、$2A...这些), 我需要拿到这些映射关系,才能解析对应数字。所以我百度搜索C# 读取ttf文件的unicode但是没有找到答案。直到用goog 阅读全文
posted @ 2020-09-12 16:34 超难微猫 阅读(2524) 评论(0) 推荐(0) 编辑
摘要:想去抓取一个网站的html源码,但是用Chrome调试工具打开,发现Preview里是乱码,那为什么网页能正常显示呢?我用.net 请求,得到的依旧是乱码,搜索了很多篇文章都没解决问题,直到看了这篇文章: https://blog.csdn.net/zh453030035/article/detai 阅读全文
posted @ 2020-09-03 09:03 超难微猫 阅读(2508) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示