摘要: 今天在采集58-二手市场数据时,遇到一个问题:网页的样式不够规范导致采到的数据奇形怪状,具体的数据表如下: 这种数据不利于观察,也无法用于分析。我是用case-when来进行初步的清洗。(substr中的startindex和endindex需要自己数~) 这样得到的数据就比较规范了: 由此,可以总 阅读全文
posted @ 2017-03-23 17:46 Aaron_Guo237 阅读(1480) 评论(0) 推荐(0) 编辑