2021 年 6月 15 日随笔档案 - Lu-顺

2021年6月15日

摘要：数据源： df= pd.DataFrame({'k1': [ 's1']* 3 + ['s2']* 5,'k2' : [1, 1, 2, 3, 3, 4, 4,4]}) df 1 重复值判断和查看 df.duplicated(subset=None, keep='first') 功能：指定列数据重阅读全文

posted @ 2021-06-15 15:35 Lu-顺阅读(1569) 评论(0) 推荐(0) 编辑

pandas数据处理清洗案例：中文地址拆分

摘要：一、案例场景字段login_place，一共267725行记录,随机15条记录如下：后续数据分析工作需要用到地理维度进行分析，所以需要把login_place字段进行拆分成：国家、省份、地区。二、初步方案第三方中文分词库：jieba，可以对文本进行拆分。使用参考资料：jieba库的使用。初阅读全文

posted @ 2021-06-15 11:55 Lu-顺阅读(840) 评论(0) 推荐(1) 编辑

数据の变异

今天你又博学了吗？多走前人的路，让后人少走路！

公告