摘要:
pandas 一维台账数据与二维表格数据的转换:https://www.cnblogs.com/cycxtz/p/13394583.html 使用pivot_table或多或少会遇到,分机构空行不显示的问题,导致数据样式有点不统一,部分表的机构数量比较少。 可以使用解决: pd.merge(left 阅读全文
摘要:
需求:低版本excel对于使用透视表后,索引方向会出现合并,需要将其恢复为“台账”样式。 解决方法:可以使用reset_index()。 在Pandas中如何给多层索引降级: https://blog.csdn.net/qq_36387683/article/details/86616367 pan 阅读全文
摘要:
对前文 https://www.cnblogs.com/cycxtz/p/13378922.html 思路1进行补充。 可以考虑jieba分词库,不过需要先进行训练。 依赖库:jieba 提前准备:国家统计局所有地区信息,以及地区简写。 下来,对使用jieba分词库的add_word。参考使用网站: 阅读全文
摘要:
需求:由于业务检查需求,需要将一个结构化地址,如”XX省XX市XX区XXX号“地区转化为对应国家统计区行政划分的 省、市、区(县)、镇(街道)、乡结构。 解决思路: 1、自行编制文本解析方法,考虑比较复杂,很多情况不能覆盖,暂时不考虑,如果能解析,则速度会比较快。 2、通过爬虫,在百度搜索“百度百科 阅读全文
摘要:
目的:基于办公与互联网隔离,自带的office软件没有带本地帮助工具,因此在写vba程序时比较不方便(后来发现07有自带,心中吐血,瞎折腾些什么)。所以想到通过爬虫在官方摘录下来作为参考。 目标网站:https://docs.microsoft.com/zh-cn/office/vba/api/ov 阅读全文
摘要:
转载:https://blog.csdn.net/HYESC/article/details/95459783?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=dis 阅读全文
摘要:
转载:https://www.cnblogs.com/lianggege123/articles/9282218.html 在编写爬虫进行网页数据的时候,大多数情况下,需要在请求是增加请求头,下面介绍一个python下非常好用的伪装请求头的库:fake-useragent,具体使用说明如下: 安装f 阅读全文
摘要:
转载:https://www.cnblogs.com/lanyinhao/p/9634742.html 1、模块说明 requests是使用Apache2 licensed 许可证的HTTP库。 用python编写。 比urllib2模块更简洁。 Request支持HTTP连接保持和连接池,支持使用 阅读全文
摘要:
https://www.cnblogs.com/gufengchen/archive/2019/05/31/10956009.html zipfile是python里用来做zip格式编码的压缩和解压缩的,由于是很常见的zip格式,所以这个模块使用频率也是比较高的, 在这里对zipfile的使用方法做 阅读全文
摘要:
参考:Django 模型中一些自定义的总结https://www.jianshu.com/p/2bc5b7c4275d https://www.cnblogs.com/weihengblog/p/9029602.html 查询分页:https://www.cnblogs.com/songdanlee 阅读全文