上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 24 下一页
摘要: raise TypeError("参数q_type 错误 ") 阅读全文
posted @ 2019-04-11 11:16 yjy888 阅读(109) 评论(0) 推荐(0) 编辑
摘要: 1、准确率,反映的是所有测试样本,假设一共100个测试样本,预测对了90个,则准确率是90%。 2、准确率适用于所有分类,包括二分类和多分类。 3、但是精确率与召回率,只适用于二分类。其中精确率描述了一个类别被判的准不准,而召回率描述了,测试集中,这个类的召回情况。 举例: 100个样本,由75个正 阅读全文
posted @ 2019-04-11 11:15 yjy888 阅读(674) 评论(0) 推荐(0) 编辑
摘要: 实际使用分类器的时候,经常遇到分类样本不均衡的问题。而只有分类样本较为均衡,才可以达到比较好的分类效果。 1、如果各个类别的样本数量都非常多,则对于样本少的类,使用全部样本。 而对于样本多的类,进行采样。采样可以随机采样,或者如果有某一类别里,有一部分数据非常接近,比如奈雪的茶、koi在茶饮里占了几 阅读全文
posted @ 2019-04-10 15:43 yjy888 阅读(483) 评论(0) 推荐(0) 编辑
摘要: Way:from tqdm import tqdmimport pandas as pdtqdm.pandas(desc='pandas bar')df['title_content'] = df.progress_apply(lambda x: _title_content(x['title'], 阅读全文
posted @ 2019-04-10 14:32 yjy888 阅读(3300) 评论(0) 推荐(0) 编辑
摘要: 使用at 查看当前任务 at -l 或者atq 查看任务执行什么 at -c 配置任务 at 02:00 #离现在最近的02:00的时候 run supervisorctl stop AITalk run supervisorctl restart AITalk 关闭任务 at -d 9 (9是作业 阅读全文
posted @ 2019-04-09 14:28 yjy888 阅读(1068) 评论(0) 推荐(0) 编辑
摘要: pprint = pretty printer 经常用来打印 字典、json 打印出的格式会是较为标准的格式 目的:方便调试,查看中间结果,因为觉得设断点调试相对麻烦。 【运行环境:macOS 10.13.3,PyCharm 2017.2.4】 老手: 选中代码行,Alt+Shift+E。 或选中, 阅读全文
posted @ 2019-04-08 13:34 yjy888 阅读(269) 评论(0) 推荐(0) 编辑
摘要: https://www.jianshu.com/p/2d49cb87626b df.groupby('A').size() 阅读全文
posted @ 2019-04-03 10:45 yjy888 阅读(540) 评论(0) 推荐(0) 编辑
摘要: a = np.array([1,2,3,4,5,1,2,2,2])c = np.unique(a)print(c)对于很大的稀疏矩阵,我们不能用a[a>0]去取大于0的元素,而应该使用np.where(a>0),得到索引[2,5,67,,100]然后通过索引直接获取元素,这样会很快如果要实现两个ar 阅读全文
posted @ 2019-03-29 13:35 yjy888 阅读(213) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2019-03-13 09:58 yjy888 阅读(35) 评论(0) 推荐(0) 编辑
摘要: Kmeans 43.681665182113654275 Kmeans 40.180066108703614314 max_iter增加,时间会增加,但是增加的不明显 阅读全文
posted @ 2019-03-08 16:04 yjy888 阅读(504) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 24 下一页