摘要: 看了《Python项目案例开发从入门到实战》(清华大学出版社 郑秋生 夏敏捷主编)中爬虫应用——校园网搜索引擎,这一章节涉及到的内容有: 数据库的基本使用 正则表达式 中文分词 我详细注释了其中关于校园网搜索引擎的代码,分享给大家: 1 import sys 2 from collections i 阅读全文
posted @ 2020-07-16 20:44 ttweixiao9999 阅读(2855) 评论(0) 推荐(1) 编辑
摘要: (1)按照空格分割出单词 (i)使用 split 切分 In [3]: letter = 'a b c' In [4]: letter.split(' ') Out[4]: ['a', 'b', '', '', 'c'] (ii)使用 re.split 切分 In [5]: import re In 阅读全文
posted @ 2020-07-16 13:25 ttweixiao9999 阅读(4565) 评论(0) 推荐(0) 编辑