摘要: 相关概念: MRO Method Resolution Order):方法解析顺序。 Python多继承就会涉及到类的继承顺序,虽然我们可以调用类的魔法方法 __mro__打印出来类的继承顺序,但是在我们去面试的时候,大多数是不会给我们一台计算机进行操作的,这里就分享一种快速简单的计算mro顺序的方 阅读全文
posted @ 2020-01-20 16:21 springionic 阅读(476) 评论(0) 推荐(0) 编辑
摘要: 数据来源 通过爬虫,爬取腾讯新闻三个分类每个分类大约1000条左右数据,存入excel 以上是大体的数据,三列分别为title、content、class;由于这里讲的的不是爬虫,爬虫部分省略 项目最终结构 其中主要逻辑在native_bayes.py文件中实现,utils.py为部分工具函数,tr 阅读全文
posted @ 2019-11-12 19:25 springionic 阅读(1011) 评论(0) 推荐(0) 编辑
摘要: 分类算法-k近邻算法(KNN): 定义: 如果一个样本在特征空间中的k个最相似 (即特征空间中最邻近) 的样本中的大多数属于某一个类别,则该样本也属于这个类别 来源: KNN算法最早是由Cover和Hart提出的一种分类算法 计算距离公式: 两个样本的距离可以通过如下公式计算,又叫欧氏距离,比如说 阅读全文
posted @ 2019-11-03 15:59 springionic 阅读(1030) 评论(0) 推荐(0) 编辑
摘要: 数据集划分: 机器学习一般的数据集会划分为两个部分 训练数据: 用于训练,构建模型 测试数据: 在模型检验时使用,用于评估模型是否有效 sklearn数据集划分API: 代码示例文末! scikit-learn数据集API: 获取数据集的返回类型: 数据集进行分割: 代码示例: 1 import o 阅读全文
posted @ 2019-11-02 16:20 springionic 阅读(1149) 评论(0) 推荐(0) 编辑
摘要: 明确: 算法是核心,数据和计算是基础 机器学习开发流程图: 机器学习模型是什么: 定义:通过一种映射关系从输入值到输出值 机器学习算法分类: 监督学习: 分类:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络 回归:线性回归、岭回归 标注:隐马尔可夫模型 无监督学习: 聚类 k-mea 阅读全文
posted @ 2019-10-30 18:16 springionic 阅读(208) 评论(0) 推荐(0) 编辑
摘要: 特征选择: 特征选择的原因: 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对预测结果有负影响 特征选择是什么: 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也可以不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一 阅读全文
posted @ 2019-10-30 17:21 springionic 阅读(381) 评论(0) 推荐(0) 编辑
摘要: 爬取内容: 简书中每一篇文章的具体数据,主要包括文章标题、钻石数、发表日期、文章字数、文章阅读量、文章的评论量和点赞量等,这里爬取2000条左右保存至数据库 代码实现在文末! 分析思路: 首先,谷歌浏览器抓包,获取简书首页加载新文章的方式,当我们点击主页的加载更多的按钮的时候,后台发送了一个异步的P 阅读全文
posted @ 2019-10-30 09:57 springionic 阅读(562) 评论(0) 推荐(0) 编辑
摘要: 特征处理是什么: 通过特定的统计方法(数学方法)将数据转化成为算法要求的数据 sklearn特征处理API: sklearn.preprocessing 代码示例: 文末! 归一化: 公式: 注意:作用于每一列,max为一列的最大值,min为一列的最小值,那么X''为最终结果,mx、mi分别为指定区 阅读全文
posted @ 2019-10-28 17:51 springionic 阅读(754) 评论(0) 推荐(0) 编辑
摘要: 机器学习库scikit-learn,进行特征抽取 特征工程: 特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性 特征工程意义: 直接影响模型的预测结果 字典特征抽取: ['city=上海', 'city=北京', 'city=深圳', 'tempe 阅读全文
posted @ 2019-10-08 19:38 springionic 阅读(457) 评论(0) 推荐(0) 编辑
摘要: findall 函数: 在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。 注意: match 和 search 是匹配一次 findall 匹配所有,match 和 search 的区别也很大,可以自行网上查找! 这里主要需要讨论的是其返回值的展现方式,即 阅读全文
posted @ 2019-08-09 14:56 springionic 阅读(23648) 评论(0) 推荐(0) 编辑