摘要:
报错:'0.80454153 is not JSON serializable' 输出y_pred_prob的类别:<type 'numpy.float32'> 参考https://stackoverflow.com/questions/27050108/convert-numpy-type-to- 阅读全文
摘要:
1.安装 sudo apt-get install python-virtualenv 2.使用 创建虚拟环境: virtualenv [虚拟环境名称] 例如: virtualenv env_test 指定python版本: virtualenv env_test --python=python2. 阅读全文
摘要:
from itertools import islice start = 1 # 跳过第一行idx=0,从idx=1开始读取文件 with codecs.open('data.json', encoding='utf-8') as fr: for idx, line in enumerate(islice(fr, start, None)): print i... 阅读全文
摘要:
对dataframe绘图并保存: 可以制定列,对该列各取值作统计: 阅读全文
摘要:
图的基本结构 通常,使用 numpy 组织数据, 使用 matplotlib API 进行数据图像绘制。 一幅数据图基本上包括如下结构: 详细的结构图如下图所示: 画法 按照绘图结构,可将数据图的绘制分为如下几个步骤: 导入 matplotlib 包相关工具包 准备数据,numpy 数组存储 绘制原 阅读全文
摘要:
利用awk分析data.csv中label列各取值的分布. 在终端执行head data.csv查看数据: 因为行内包含换行符的项会被分成多行(例如上面的第3,4行),所以需要结合正则匹配 -F ',' 表示根据逗号分隔; $(NF-1)~/^[A-Z][0-9]/ 表示分隔后的倒数第二项(在此指取 阅读全文
摘要:
1. DataFrame 处理缺失值 dropna() 把在ToC列有缺失值的行去掉 补充:还可以用df.fillna()来把缺失值替换为某个特殊标记 2. 根据某维度计算重复的行 duplicated()、value_counts() duplicated()方法返回一个布尔型的Series,显示 阅读全文
摘要:
1.只显示当前目录 找到位置: 将这两个小写的w换成大写W,然后source ~/.bashrc即可 2.终端颜色美化 vim ~/.bashrc 然后下面这行的注释去掉,打开这个变量的开关,即可使用彩色的命令行提示符 关闭force_color_prompt的的效果如下图: 而打开后的效果如下图: 阅读全文
摘要:
1.keras模型可视化 keras.utils.vis_utils模块提供了画出Keras模型的函数(利用graphviz) 该函数将画出模型结构图,并保存成图片: plot_model接收两个可选参数: show_shapes:指定是否显示输出数据的形状,默认为False show_layer_ 阅读全文
摘要:
把数据集随机切分为训练集和测试集 method 1: method 2(推荐): 阅读全文