摘要: 在python的格式输出时常使用format()方法,其中的多余空间默认使用英文空格作为占位符,不方便中英混合时的格式输出,因此我们要为其中的中文字符串使用占字符较大的中文空格符作为多余空间的占位符。 chr(12288)返回的是中文空格符,因此我们在格式输出时可以使用chr(12288)作为for 阅读全文
posted @ 2019-02-08 22:44 路漫漫我不畏 阅读(2291) 评论(0) 推荐(0) 编辑
摘要: 我们需要爬取的网站:最好大学网 我们需要爬取的内容即为该网页中的表格部分: 该部分的html关键代码为: 其中整个表的标签为<tbody>标签,每行的标签为<tr>标签,每行中的每个单元格的标签为<td>标签,而我们所需的内容即为每个单元格中的内容。 因此编写程序的大概思路就是先找到整个表格的<tb 阅读全文
posted @ 2019-02-08 19:02 路漫漫我不畏 阅读(1160) 评论(0) 推荐(0) 编辑