02 2021 档案
摘要:HTML DOM 是定义了访问和操作 HTML 文档的标准方法。DOM 将 HTML 文档表达为树结构,如下图结构。通过对对象名(name)或对象id的获取来去对象进行操作。 通常用的两种方式:1;document.getElementById(“对象id“);2;document.getEleme
阅读全文
摘要:爬取的网页信息出现乱码问题,一般都是网页本身编码的问题。例如百度是GBK编码,在爬取百度数据是一定要注意网页本身编码问题。 如果使用requests.get(url).text方式爬取的网页信息是乱码,类似这种 ¾åº¦ä¸ä¸ï¼ä½ å°±ç¥éç¾åº¦ ">æ°é»å
阅读全文