摘要:
贝叶斯分类首先准备好数据材料 第一次获取20newsgroups时会花费数分钟时间来获取数据,通过获得target_names可以查看其中的类型。 为了进行分类,采用词袋模型的方法,即统计每篇新闻的单词,不考虑单词间的联系,仅仅考虑它们出现的频率。 11314代表有11314篇文章,130107意思 阅读全文
摘要:
本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作 首先导入库 其次导入数据,这里使用的是sklearn中内置的数据集 使用pandas整理数据 pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关 阅读全文
摘要:
Linux中的anaconda和windows下有些许区别,这里做下介绍 1.安装 官网上下载.sh文件,通过bash进行安装 2.添加环境变量 为了使用conda指令,我们需要将它添加到环境变量 3.conda的使用 和windows10中不同,conda不再是一个命令行,而是单纯一个功能语句了, 阅读全文