摘要: 因为某个话题在网上引发围观,看到如此火爆,就想把数据拿下来做分析。 第一天搞定抓包,工具选择、工具使用和简单的调试。 克服困难:网络代理配置 输出工具:花瓶、安卓模拟器 第二天搞定采集,数据异常值处理 克服困难:json嵌套解析 输出文档:多个excel文档 第三天搞定数据分析,分析数据指标 克服困 阅读全文
posted @ 2020-06-21 18:22 HuaBro 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 需求:统计每个用户下的评论,合并在一起 原评论 内容有点刺激 合并后是list 再次转为字符串,有的中间是连续两个标点符号,这种先不管,后续清理 最后的代码 最后源码 df_comms_merge=df1.groupby('fromUserUid').apply(lambda x: ','.join 阅读全文
posted @ 2020-06-21 11:24 HuaBro 阅读(1408) 评论(0) 推荐(0) 编辑