2018年2月4日

摘要: 我今天弄了一下午修改这个代码,最后还是弄好了.原因是正则表达式的筛选不够准确,有时候是会带http:baidu这些东西的.所以需要一个正则表达式的断言,然后还有一点是如果his里面只有一个元素就不要再pop了.最后我把代码放上去.为了突出问题我选的开始网址很特殊他没有子链接.from urllib. 阅读全文
posted @ 2018-02-04 18:09 张博的博客 阅读(208) 评论(0) 推荐(0) 编辑

导航