摘要: matplotlib 数据可视化图像中文字体数据集存在的问题#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/3/16import pandas as pdimport matplotlib.pyplot as pltfrom matplotlib import stylestyle.use('ggpl... 阅读全文
posted @ 2017-03-16 23:45 keven0526 阅读(234) 评论(0) 推荐(0) 编辑
摘要: from bokeh.io import output_notebook, output_file, showfrom bokeh.charts import Scatter, Bar, BoxPlot, Chordfrom bokeh.layouts import rowimport seaborn as sns# 导入数据exercise = sns.load_dataset('exer... 阅读全文
posted @ 2017-03-16 19:30 keven0526 阅读(587) 评论(0) 推荐(0) 编辑
摘要: 单变量分布x1 = np.random.normal(size=1000)sns.distplot(x1);直方图sns.distplot(x1, bins=20, kde=False, rug=True)核密度估计sns.distplot(x2, hist=False, rug=True)sns.kdeplot(x2, shade=True)sns.rugplot(x2)双变量分布d... 阅读全文
posted @ 2017-03-16 18:54 keven0526 阅读(508) 评论(0) 推荐(0) 编辑
摘要: figure /subplot# 创建figurefig = plt.figure()ax1 = fig.add_subplot(2,2,1)ax2 = fig.add_subplot(2,2,2)ax3 = fig.add_subplot(2,2,3)ax4 = fig.add_subplot(2,2,4)直方图、散点图、柱状图plt.hist(np.random.rand... 阅读全文
posted @ 2017-03-16 16:23 keven0526 阅读(515) 评论(0) 推荐(0) 编辑
摘要: 当 n 大于100 nn > n100 n > e , en n! > en > n100 阅读全文
posted @ 2017-03-16 14:26 keven0526 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 回归问题常用均方误差分类问题错误率与精度其中 m 为样本的个数查准率、查全率、F1对于二分问题:P-R曲线A优于C(A完全‘包住’C)A B 的比较可以比较图形下的面积也可以基于平衡点(BEP)比较 A优于B 更好的比较实用下面的方式:F1加权形式:ROC AUC参考链接:ROC和AUC介绍以及如何计算AUCROC 受访者工作特征曲线可以发现 TPR真正例率: 是真正例/正例... 阅读全文
posted @ 2017-03-16 00:12 keven0526 阅读(203) 评论(0) 推荐(0) 编辑