摘要: 贝叶斯分类首先准备好数据材料 第一次获取20newsgroups时会花费数分钟时间来获取数据,通过获得target_names可以查看其中的类型。 为了进行分类,采用词袋模型的方法,即统计每篇新闻的单词,不考虑单词间的联系,仅仅考虑它们出现的频率。 11314代表有11314篇文章,130107意思 阅读全文
posted @ 2018-07-13 21:33 冷血无情康纳酱 阅读(5322) 评论(0) 推荐(0) 编辑
摘要: 本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作 首先导入库 其次导入数据,这里使用的是sklearn中内置的数据集 使用pandas整理数据 pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关 阅读全文
posted @ 2018-07-13 19:38 冷血无情康纳酱 阅读(627) 评论(0) 推荐(0) 编辑
摘要: Linux中的anaconda和windows下有些许区别,这里做下介绍 1.安装 官网上下载.sh文件,通过bash进行安装 2.添加环境变量 为了使用conda指令,我们需要将它添加到环境变量 3.conda的使用 和windows10中不同,conda不再是一个命令行,而是单纯一个功能语句了, 阅读全文
posted @ 2018-07-13 00:29 冷血无情康纳酱 阅读(4265) 评论(0) 推荐(0) 编辑