摘要: 1.什么时候应该开始“重构代码”? 阅读一个功能代码时,如果你自己都觉得 “有点绕”,“怎么这么复杂”,“总感觉怪怪的”,那么请一定静下心来重构他,优秀的代码一定都是逻辑简单且清晰的。 2.编码结束后开发工作就结束了吗? 开发工作中,“编码”,“联调”其实只是比较少的一部分工作,一个开发人员还应该有 阅读全文
posted @ 2020-12-04 14:50 周周和奇奇 阅读(130) 评论(0) 推荐(0) 编辑
摘要: mysql group by 以后默认返回每组中的第一条数据,所以无法达到“查询每个月最后一个日期” 这个要求 SELECT id, DATE_FORMAT(DD,'%Y-%m') AS datestr FROM AAA GROUP BY datestr 要适应在group by 语句中配合max( 阅读全文
posted @ 2020-12-02 17:01 周周和奇奇 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 匹配 yyyy-mm-dd 格式字符串 re.match(r"^(\d{4})(-\d{2}){2}$", "2020-20-00") 匹配 yyyy-mm 格式字符串 re.match(r"^(\d{4})(-\d{2})$", "2020-20") 匹配 yyyy-mm或者yyyy或者yyyy- 阅读全文
posted @ 2020-12-02 16:37 周周和奇奇 阅读(425) 评论(0) 推荐(0) 编辑
摘要: A(.*?)B 表示截取 A/B 中间的字符串 import relambda x: re.findall("<(.*?)>", x)[0] 表示截取 <> 之间的字符串 阅读全文
posted @ 2020-11-27 15:34 周周和奇奇 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 1.复制表: 拷贝原表的建表语句,修改表名以后执行2.从原表查询数据并插入新表insert into A select * from B; (两张表结构一致)insert into A(col1, col2) select col1, col2 from B; (两张表结构不一致) insert i 阅读全文
posted @ 2020-11-26 10:10 周周和奇奇 阅读(312) 评论(0) 推荐(0) 编辑
摘要: 1.优化性能的第一步:检查sql查询的次数。因为程序一不小心就会导致大量的sql查询,明明一次查询可以解决的就不要分两次去查。 2.优化性能的第二部:检查sql语句的筛选条件是否有冗余。“查询出来很多数据是多余的,在后面的程序中筛选”这种想法是极其幼稚的,因为会平白增加数据库的IO。优化性能,减少数 阅读全文
posted @ 2020-11-13 10:24 周周和奇奇 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值 阅读全文
posted @ 2020-11-09 14:58 周周和奇奇 阅读(4235) 评论(0) 推荐(0) 编辑
摘要: 可能是因为pycharm的bug,程序异常终止以后,再启动会报端口已被占用的问题,故整理方法如下 -> 查看windows 上当前使用的端口进入 cmd , 查看端口使用情况 netstat -ano查看占用端口的进程id netstat -aon|findstr "5041"查看进程信息 task 阅读全文
posted @ 2020-11-06 11:31 周周和奇奇 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 当数据库中缺失某些数据(类型为deciaml)时, 用sql语句sum() ... groupby ... 求和时,查询出来的dataframe 这一列数据的类型为object,而object类型是无法再在dataframe中groupby 以后进行聚合计算的。 此时,如果先将数据查出来,在data 阅读全文
posted @ 2020-11-02 15:40 周周和奇奇 阅读(920) 评论(0) 推荐(0) 编辑
摘要: ->删除第1、2列有空值的行 datapd.dropna(axis='index', subset=[1,2]) 阅读全文
posted @ 2020-11-01 15:17 周周和奇奇 阅读(46) 评论(0) 推荐(0) 编辑