摘要:
1 import os 2 3 ls =[] 4 for root, dirs, files in os.walk('d:\\test'): root 是str dirs 是list files 是list 5 for file in files: 6 ls.append(os.path.join(root,file)) 7 print(ls) 阅读全文
摘要:
思路:从上述三个来源获取大学名称,清洗并去重,统计后得到结果 步骤: 首先思考获取数据要不要用爬虫去做? (适合爬虫的不要用手工去做,适合手工的也不要用爬虫去做) 适合手工完成:一次性的,数量较少的,数据不复杂 适合爬虫完成:周期性采集,爬取站点较多,数据结构复杂但有规律 这里采用手工的方法, 对于 阅读全文