摘要: 在抓取下来的网页源码显示的是如下的内容,而不是可读性的汉字 经查资料后得知, 在网页中以四开头的是HTML实体,具体什么是HTML实体,请百度:http://baike.baidu.com/view/4757776.htm 如何把汉字转换成HTML实体呢? 其实很简单,汉字的HTML实体由三部分组成 阅读全文
posted @ 2018-07-20 17:06 python许三多 阅读(6305) 评论(1) 推荐(0) 编辑