周进度报告(三)

本周利用进行了DataX和kettle的实战,利用dataX和kettle对csv格式的数据源进行了清洗,将其导入到了MySQL数据库中,并对数据进行了查重。利用自己学习了一些Python的爬虫,爬取了新闻网站的标题和地址。

posted on 2020-03-08 20:21  一往无前!  阅读(75)  评论(0编辑  收藏  举报