随笔分类 - Python
摘要:1.问题:在本地用matplotlib绘图可以,但是在ssh远程绘图的时候会报错 RuntimeError: Invalid DISPLAY variable 2.原因:matplotlib的默认backend是TkAgg,而FltkAgg, GTK, GTKAgg, GTKCairo, TkAgg
阅读全文
摘要:一.setuptools - 官方文档: Building and Distributing Packages with Setuptools- 中文文档: Python包管理工具setuptools详解 1.使用过程 2. setuptools工具的setup.py的模板 声明依赖包的语法: Th
阅读全文
摘要:通过set()获取两个数组的交/并/差集:
阅读全文
摘要:报错:'0.80454153 is not JSON serializable' 输出y_pred_prob的类别:<type 'numpy.float32'> 参考https://stackoverflow.com/questions/27050108/convert-numpy-type-to-
阅读全文
摘要:1.安装 sudo apt-get install python-virtualenv 2.使用 创建虚拟环境: virtualenv [虚拟环境名称] 例如: virtualenv env_test 指定python版本: virtualenv env_test --python=python2.
阅读全文
摘要:from itertools import islice start = 1 # 跳过第一行idx=0,从idx=1开始读取文件 with codecs.open('data.json', encoding='utf-8') as fr: for idx, line in enumerate(islice(fr, start, None)): print i...
阅读全文
摘要:对dataframe绘图并保存: 可以制定列,对该列各取值作统计:
阅读全文
摘要:图的基本结构 通常,使用 numpy 组织数据, 使用 matplotlib API 进行数据图像绘制。 一幅数据图基本上包括如下结构: 详细的结构图如下图所示: 画法 按照绘图结构,可将数据图的绘制分为如下几个步骤: 导入 matplotlib 包相关工具包 准备数据,numpy 数组存储 绘制原
阅读全文
摘要:利用awk分析data.csv中label列各取值的分布. 在终端执行head data.csv查看数据: 因为行内包含换行符的项会被分成多行(例如上面的第3,4行),所以需要结合正则匹配 -F ',' 表示根据逗号分隔; $(NF-1)~/^[A-Z][0-9]/ 表示分隔后的倒数第二项(在此指取
阅读全文
摘要:1. DataFrame 处理缺失值 dropna() 把在ToC列有缺失值的行去掉 补充:还可以用df.fillna()来把缺失值替换为某个特殊标记 2. 根据某维度计算重复的行 duplicated()、value_counts() duplicated()方法返回一个布尔型的Series,显示
阅读全文
摘要:把数据集随机切分为训练集和测试集 method 1: method 2(推荐):
阅读全文