本周利用进行了DataX和kettle的实战,利用dataX和kettle对csv格式的数据源进行了清洗,将其导入到了MySQL数据库中,并对数据进行了查重。利用自己学习了一些Python的爬虫,爬取了新闻网站的标题和地址。
posted on 2020-03-08 20:21 一往无前! 阅读(75) 评论(0) 编辑 收藏 举报