摘要: 1、任务简介 本次任务是爬取IJCAI(国际人工智能联合会议)最新2018年的pdf论文文件。 本次编码用到了正则表达式从html里面提取信息,如下对正则表达式匹配规则作简要的介绍。 2、正则表达式规则 \w匹配字母数字及下划线 \W匹配非字母数字及下划线 \s匹配任意空白字符,等价于 [\t\n\ 阅读全文
posted @ 2018-08-07 15:42 J.mg 阅读(2749) 评论(1) 推荐(2) 编辑