摘要: 需求描述 爬虫每天会爬取很多公司信息,将这些公司的最新信息保存下来,并记录每个公司信息发生了哪些变化。对比最近爬取的两次数据,如果最新的数据里某个公司没爬取到,则将该公司的状态设为"注销"。 爬虫一天爬一次。 公司信息的格式: 新增字段的概率还是比较大的 表结构设计 最初设计 需要两张表,一张存放公 阅读全文
posted @ 2020-03-30 15:11 liu_whut 阅读(293) 评论(0) 推荐(0) 编辑