随笔分类 -  数据

摘要: 阅读全文
posted @ 2020-05-07 10:12 小学弟- 阅读(150) 评论(0) 推荐(0) 编辑
摘要:Python3的URL编码解码 前言 最近在用python3练习一些爬虫脚本的时候,发现一些url的编码问题,在浏览器提交请求api时,如果url中包含汉子,就会被自动编码掉。呈现的结果是 ==> %xx%xx%xx。如果出现3个百分号为一个原字符则为utf8编码,如果2个百分号则为gb2312编码 阅读全文
posted @ 2020-04-07 15:31 小学弟- 阅读(579) 评论(0) 推荐(0) 编辑
摘要:数据清洗基本概念 1 基本概念 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。 因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误 阅读全文
posted @ 2019-01-16 14:54 小学弟- 阅读(1126) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示