摘要: Day2 今天主要是摸清html代码结构和编码。 赞的html结构如下: 评论的html结构如下: 其实结构都不太重要,xpath直接找class=‘’相关值的就行了 至此,网页结构全部摸清。可以开始编码了。 现在的问题是解析不规范json太费时间了QAQ,所以爬起来很慢。 程序结构如下: Netw 阅读全文
posted @ 2020-03-01 21:03 DengHaoyu 阅读(110) 评论(0) 推荐(0) 编辑