摘要: refer to: https://blog.csdn.net/bitcarmanlee/article/details/51622263 阅读全文
posted @ 2019-01-18 20:10 清源居士 阅读(322) 评论(0) 推荐(0) 编辑
摘要: (Timestamp('2018-08-01 00:00:00'), <class 'pandas._libs.tslibs.timestamps.Timestamp'>) 注意这里面的Timestamp的用法, 请参考: https://pandas.pydata.org/pandas-docs/ 阅读全文
posted @ 2019-01-18 11:46 清源居士 阅读(5386) 评论(0) 推荐(0) 编辑
摘要: 1.[column for column in df] 2.df.columns.values 返回 array 3.list(df) 4.df.columns 返回Index,可以通过 tolist(), 或者 list(array) 转换为list 阅读全文
posted @ 2019-01-15 15:36 清源居士 阅读(6272) 评论(0) 推荐(0) 编辑
摘要: apply 是一个好方法. 阅读全文
posted @ 2019-01-08 16:34 清源居士 阅读(3837) 评论(0) 推荐(0) 编辑
摘要: 关键是找出坐标. 阅读全文
posted @ 2019-01-07 20:33 清源居士 阅读(5428) 评论(0) 推荐(0) 编辑
摘要: refer to: https://www.zhihu.com/question/54631460 阅读全文
posted @ 2019-01-07 15:02 清源居士 阅读(2272) 评论(0) 推荐(0) 编辑
摘要: refer to: http://dougaoyang.github.io/2017/09/22/pandas-bool-compare.html df[(df['pop']>3) and (df['pop']<4)] ValueError: The truth value of a Series 阅读全文
posted @ 2019-01-07 14:47 清源居士 阅读(965) 评论(0) 推荐(0) 编辑
摘要: Python中是有查找功能的,四种方式:in、not in、count、index,前两种方法是保留字,后两种方式是列表的方法。 下面以a_list = ['a','b','c','hello'],为例作介绍: 阅读全文
posted @ 2018-12-10 19:56 清源居士 阅读(5216) 评论(0) 推荐(0) 编辑
摘要: 1、向下取整 向下取整直接用内建的 int() 函数即可: >>> a = 3.75 >>> int(a) 3 2、四舍五入 对数字进行四舍五入用 round() 函数: >>> round(3.25); round(4.85) 3.0 5.0 3、向上取整 向上取整需要用到 math 模块中的 c 阅读全文
posted @ 2018-12-04 09:09 清源居士 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 关键函数:twinx() refer to: https://www.cnblogs.com/Atanisi/p/8530693.html 阅读全文
posted @ 2018-12-04 02:03 清源居士 阅读(676) 评论(0) 推荐(0) 编辑
摘要: 假设有这样一个 转化为下面这个样子 我们可以使用map函数 在Python2中这样操作: 在Python3中这样操作: 阅读全文
posted @ 2018-07-04 17:23 清源居士 阅读(3559) 评论(1) 推荐(0) 编辑
摘要: #coding:utf8 if __name__ == '__main__': srcfile = u"D:/测试路径/测试文件.txt" f = open(srcfile.encode('gbk')) for text in f.readlines(): print text.decode('gbk') f.close() 阅读全文
posted @ 2018-07-04 13:14 清源居士 阅读(641) 评论(0) 推荐(0) 编辑
摘要: http://www.runoob.com/python/os-walk.html https://www.cnblogs.com/dreamer-fish/p/3820625.html 阅读全文
posted @ 2018-07-04 11:31 清源居士 阅读(1498) 评论(0) 推荐(0) 编辑
摘要: It's also available on a DatetimeIndex: 阅读全文
posted @ 2018-07-02 17:50 清源居士 阅读(8985) 评论(0) 推荐(2) 编辑
摘要: 不要用math.isnan() pandas里专门有一个函数: 阅读全文
posted @ 2018-07-01 23:38 清源居士 阅读(3389) 评论(0) 推荐(0) 编辑
摘要: pd.to_csv('your.csv', index=False) 阅读全文
posted @ 2018-06-30 21:55 清源居士 阅读(639) 评论(0) 推荐(0) 编辑
摘要: s为字符串 s.isalnum() 所有字符都是数字或者字母 s.isalpha() 所有字符都是字母 s.isdigit() 所有字符都是数字 s.islower() 所有字符都是小写 s.isupper() 所有字符都是大写 s.istitle() 所有单词都是首字母大写,像标题 s.isspa 阅读全文
posted @ 2018-06-30 19:52 清源居士 阅读(2517) 评论(0) 推荐(0) 编辑
摘要: 中位数 median 1.中位数,数据从小到大排序,中间位置的那个数字。奇数,+1除以2;偶数,则用除以2,除以2然后+1,这两项的和,再除以2求个平均 2.不容易受到数据两端的异常值影响,不受组距影响;在直方图上,左右面积大概相等的位置点。比如5出现10次,然后6 7 8 9 9 9 9 ,这样5 阅读全文
posted @ 2018-06-30 16:52 清源居士 阅读(2294) 评论(0) 推荐(0) 编辑
摘要: refer to: https://www.cnblogs.com/darkknightzh/p/6117528.html 阅读全文
posted @ 2018-06-29 17:36 清源居士 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 碰到各种编码混用, 则需要搞清楚. http://blog.csdn.net/lxdcyh/article/details/4018054. https://www.jianshu.com/p/a5b847ea4bab 如何检测一个字符(串)的类型, 可以用chardet模块 http://www. 阅读全文
posted @ 2018-02-15 00:38 清源居士 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 当一个excel文件的sheet比较多时候, 这时候需要获取所有的sheet的名字. 也可以直接读取所有的sheet, 将sheetname设置为None. 这时候得到的是一个dict结果. "df" are all sheets as a dictionary of DataFrames, you 阅读全文
posted @ 2018-02-15 00:33 清源居士 阅读(43336) 评论(0) 推荐(0) 编辑
摘要: 这种效率比较高 refer to: http://www.pythoner.com/13.html 阅读全文
posted @ 2018-02-15 00:28 清源居士 阅读(661) 评论(0) 推荐(0) 编辑
摘要: 貌似用遍历最方便. http://www.cnblogs.com/tudas/p/python-delete-duplicate-element-from-list.html 阅读全文
posted @ 2018-02-14 22:34 清源居士 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 在Adobe Acrobat Professional 7.0版本后里单击所插入的文本框,会出现文本框属性,此时只能改文本框的属性,不能修改文本框内的字体大小 要改字体很简单,左键选中要改的文本,按Ctrl+E, 会弹出一个工具栏. 然后就很简单了. 在Adobe Acrobat Professio 阅读全文
posted @ 2018-02-12 18:00 清源居士 阅读(4642) 评论(0) 推荐(0) 编辑
摘要: 这是python的难点和特点, 有很多的和c/cpp不一样的地方. 它的灵活易用性造成不习惯之处. refer to: http://blog.csdn.net/cc7756789w/article/details/46635383 https://docs.lvrui.io/2016/07/12/ 阅读全文
posted @ 2018-02-04 19:04 清源居士 阅读(155) 评论(0) 推荐(0) 编辑
摘要: super 是用来解决多重继承问题的,直接用类名调用父类方法在使用单继承的时候没问题,但是如果使用多继承,会涉及到查找顺序(MRO)、重复调用(钻石继承)等种种问题。总之前人留下的经验就是:保持一致性。要不全部用类名调用父类,要不就全部用 super,不要一半一半。 好处就是可以避免直接使用父类的名 阅读全文
posted @ 2018-02-04 17:51 清源居士 阅读(163) 评论(0) 推荐(0) 编辑
摘要: functools.partial 用一些默认参数包装一个可调用对象,返回结果是可调用对象,并且可以像原始对象一样对待 冻结部分函数位置函数或关键字参数,简化函数,更少更灵活的函数参数调用 refer to: http://wiki.jikexueyuan.com/project/explore-p 阅读全文
posted @ 2018-02-04 17:10 清源居士 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 究竟是使用 time.clock() 精度高,还是使用 time.time() 精度更高,要视乎所在的平台来决定。总概来讲,在 Unix 系统中,建议使用 time.time(),在 Windows 系统中,建议使用 time.clock()。 refer to: http://www.cnblog 阅读全文
posted @ 2018-02-04 17:01 清源居士 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 1, add 2, 用list的extend方法,L1.extend(L2),该方法将参数L2的全部元素添加到L1的尾部,例如: 3, 用切片(slice)操作,L1[len(L1):len(L1)] = L2和上面的方法等价, 但切片方法用起来更灵活,可以插入到头部,或其他任意部位,也可以加到中间 阅读全文
posted @ 2018-02-03 16:59 清源居士 阅读(6505) 评论(0) 推荐(0) 编辑
摘要: 第一种是格式化的 refer to: http://www.pythonclub.org/python-basic/print 另外一种是用字符串的格式化 refer to: http://www.pythondoc.com/pythontutorial3/inputoutput.html 阅读全文
posted @ 2018-02-03 10:34 清源居士 阅读(212) 评论(0) 推荐(0) 编辑