05 2019 档案

代码
摘要:#!/usr/bin/python # -*- coding:utf-8 -*- import pandas as pd import numpy as np import matplotlib as mpl import math import warnings import gc from gensim import corpora, models, similarities from s... 阅读全文

posted @ 2019-05-30 13:18 吃我一枪 阅读(250) 评论(0) 推荐(0) 编辑

分块读取大文件方法
摘要:1 以下两种方法类似,第一种更简洁 两种方法的input类型完全相同,当最后一次不够7行时,两种方法都会取出来 2 利用get_chunck()函数 loop为真时,get_chunck()函数会一直从文件中取数据,直到最后一次try不能执行了,执行except,loop置为假。 阅读全文

posted @ 2019-05-25 14:49 吃我一枪 阅读(1126) 评论(0) 推荐(0) 编辑

装饰器统计函数执行次数
摘要:当用apply处理大文件时,无法知道程序处理了多少行,可以用装饰器统计函数执行次数。 注意这里的apply()函数在pandas版本0.20.3中好用,其它不清楚,在这个版本中,当返回的list长度与dataframe的列数相同时,可直接赋给对应的列,当不同时,会生成一个series。 有的版本的p 阅读全文

posted @ 2019-05-24 13:12 吃我一枪 阅读(530) 评论(0) 推荐(0) 编辑

饼状图
摘要:1 plt.pie( ) 注意无论饼状图、柱状图还是折线图,纵轴的数据类型可以是list,numpy和series。 参考:https://blog.csdn.net/captain811/article/details/79248912 当画饼状图时,类别太多,label比较拥挤时,可用如下方法设 阅读全文

posted @ 2019-05-22 15:56 吃我一枪 阅读(442) 评论(0) 推荐(0) 编辑

箱线图
摘要:1 sns.boxplot( ) 完整参数如下:seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, satura 阅读全文

posted @ 2019-05-21 12:19 吃我一枪 阅读(256) 评论(0) 推荐(0) 编辑

dataframe指定位置插入行
摘要:1 loc( ) 函数可以定位行后,并直接赋值插入。 如下可见loc函数对直接改变原来行的值 2 当不想改变原来行的值时,可以先将表格分开,添加行后再合并。 如下将羊9插入到例如第二行,当未改变原先第二行的值。 参考: http://www.360doc.com/content/17/0225/23 阅读全文

posted @ 2019-05-21 11:14 吃我一枪 阅读(9359) 评论(0) 推荐(0) 编辑

删除或替换字符串中特定字符
摘要:1 replace( ) replace()函数只有三个参数,第三个参数是最大替代次数 特别注意replace()函数作用完后,并没有改变原字符串 参考:https://www.runoob.com/python/att-string-replace.html 2 strip( ) strip() 阅读全文

posted @ 2019-05-17 12:40 吃我一枪 阅读(1070) 评论(0) 推荐(0) 编辑

折线图平滑
摘要:1这里7个点中插了300个点,对于点多的情况效果不是很好 https://blog.csdn.net/cdqn10086/article/details/70143616 阅读全文

posted @ 2019-05-16 13:30 吃我一枪 阅读(286) 评论(0) 推荐(0) 编辑

Matplotlib字体大小设置
摘要:参考:https://blog.csdn.net/henkekao/article/details/72871882 阅读全文

posted @ 2019-05-15 14:12 吃我一枪 阅读(21389) 评论(0) 推荐(2) 编辑

折线图
摘要:标记格式大小设置:https://blog.csdn.net/qq_40260867/article/details/95310956 1 plt.plot( ) 与画柱状图类似,只不过将bar( )函数改成了plot( ) #!/usr/bin/env.python #*._ * _.coding 阅读全文

posted @ 2019-05-15 12:11 吃我一枪 阅读(161) 评论(0) 推荐(0) 编辑

柱状图
摘要:1 plt.bar bar()函数中可直接设置标签,label = '' 。 当两个堆叠时,加上参数bottom可以设置那个在下面,这时便不会发生一个覆盖另一个的情况。 特别注意这里的bottom参数设置时应该是第一次画的bar中的数据,不能用第二次,否则会出错。 # !/usr/bin/env.p 阅读全文

posted @ 2019-05-14 20:10 吃我一枪 阅读(295) 评论(0) 推荐(0) 编辑

zip()函数
摘要:zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。 https://www.runoob.com/python/python-func-zip.html 阅读全文

posted @ 2019-05-14 19:19 吃我一枪 阅读(115) 评论(0) 推荐(0) 编辑

matplotlib基础
摘要:1 figure( ) 常用来设置图的大小,名称及颜色。 https://blog.csdn.net/m0_37362454/article/details/81511427 2 subplot( ) Matplotlib的可以把很多张图画到一个显示界面,即设置画布划分以及图像在画布上输出的位置 当 阅读全文

posted @ 2019-05-14 15:50 吃我一枪 阅读(187) 评论(0) 推荐(0) 编辑

unique()函数
摘要:unique()函数可输出列表,元组和series中的不同元素。 且只能输出dataframe的某一列series中的不同元素,不能同时输出。 返回的都是一个ndarry,但不能输出ndarry中的不同元素,即对ndarry无效。 参考: https://blog.csdn.net/yangyuwe 阅读全文

posted @ 2019-05-14 13:03 吃我一枪 阅读(1384) 评论(0) 推荐(0) 编辑

sorted()与sort()函数
摘要:一 sorted()函数 有三个参数: 第一个是iterable,必选,待排序的集合,可以是list,tuple,set,dict等 第二个是reverse,可选,默认为False按升序排列,True按降序排列 第三个是key,可选,这是一个函数,返回一个key,可以看做是排序的标准,注意这里的ke 阅读全文

posted @ 2019-05-14 12:29 吃我一枪 阅读(324) 评论(0) 推荐(0) 编辑

Oracle数据库文件导出为CSV格式的方法
摘要:1 安装PLSQL Developer,并连接Oracle数据库。 2 执行sql语句,将要导出的表格显示出来。 3 如下点击导出查询结果,选择数据格式,即可导出数据。 阅读全文

posted @ 2019-05-13 18:55 吃我一枪 阅读(7378) 评论(1) 推荐(0) 编辑

Numpy和Pandas
摘要:NumPy是高性能科学计算和数据分析的基础包。数据结构为ndarray,一般有三种方式来创建。ndarray是N-Dimensions-Array(N维数组)的简称,ndarray要求元素数据类型一致. ndarry和list的同: 1 都可以进行切片操作 异: ndarry和list的外在区别是n 阅读全文

posted @ 2019-05-13 15:31 吃我一枪 阅读(195) 评论(0) 推荐(0) 编辑

Series
摘要:1 dataframe中的每一列,每一行都是一个series类型 参考: https://blog.csdn.net/brucewong0516/article/details/79196902 2 series与dict类似,但稍有不同,series的键是index,值是values,可通过切片来 阅读全文

posted @ 2019-05-12 16:37 吃我一枪 阅读(490) 评论(0) 推荐(0) 编辑

truncate()函数
摘要:1 truncate()方法用于截断文件,如果指定了可选参数 size,则表示截断文件为 size 个字符,截断之后 size 后面的所有字符被删除。 参考: https://www.runoob.com/python/file-truncate.html 2 可以筛选时间 先要将日期用to_dat 阅读全文

posted @ 2019-05-11 12:32 吃我一枪 阅读(5462) 评论(0) 推荐(0) 编辑

dao层
摘要:dao全称 data access object,即数据连接层,也叫持久层,是数据库和web服务器的连接层。 包含两个基本java文件,一个文件是专门写接口,另一个是写接口的实现,专门写接口程序为了方便contraller调用。 接口程序: 接口实现: 阅读全文

posted @ 2019-05-10 14:17 吃我一枪 阅读(778) 评论(0) 推荐(0) 编辑

fillna()函数
摘要:method: pad/ffill:用前一个非缺失值去填充该缺失值,用左边的非缺失值去填充该缺失值 backfill/bfill:用下一个非缺失值填充该缺失值,用右边的非缺失值去填充该缺失值 None:指定一个值去替换缺失值(默认这种方式) limit参数:限制填充个数 axis参数:修改填充方向, 阅读全文

posted @ 2019-05-08 13:11 吃我一枪 阅读(2581) 评论(0) 推荐(0) 编辑

shift()函数
摘要:用于对dataframe中的数整体上移或下移, 当为正数时,向下移。 当为负数时,向上移。 缺少的会填充NaN 参考: https://blog.csdn.net/kizgel/article/details/78333833 阅读全文

posted @ 2019-05-08 12:45 吃我一枪 阅读(1947) 评论(0) 推荐(0) 编辑

tail()函数
摘要:与head()函数类似,默认是取dataframe中的最后五行。 函数源码: 在pycharm中按Ctrl用鼠标点击函数名即可找到 在用groupby()函数时,可用tail()函数选择融合的行 当tail()的参数为1时,此时实际上没有融合,直接是选择的要groupby的最后一行 阅读全文

posted @ 2019-05-07 19:51 吃我一枪 阅读(1044) 评论(0) 推荐(0) 编辑

无重复字符的最长字符串
摘要:题目:https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/ 给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 法一: def lengthOfLongestSubstring( 阅读全文

posted @ 2019-05-05 10:29 吃我一枪 阅读(280) 评论(0) 推荐(0) 编辑

两数之和
摘要:题目:https://leetcode-cn.com/problems/two-sum/ 给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。 示例 阅读全文

posted @ 2019-05-04 18:55 吃我一枪 阅读(92) 评论(0) 推荐(0) 编辑

dict用法
摘要:1 dict.items() https://www.runoob.com/python3/python3-att-dictionary-items.html 2 setdefault的用法 注意setdefault方法第一次对某个key设置默认值后,之后再设置不起作用. d = {1:'数学',2 阅读全文

posted @ 2019-05-03 19:28 吃我一枪 阅读(126) 评论(0) 推荐(0) 编辑

xgboost
摘要:参考:https://blog.csdn.net/han_xiaoyang/article/details/52665396 https://dnc1994.com/2016/04/rank-10-percent-in-first-kaggle-competition/ http://www.mux 阅读全文

posted @ 2019-05-03 19:17 吃我一枪 阅读(78) 评论(0) 推荐(0) 编辑

导航