摘要: import numpy as np from sklearn.datasets import load_breast_cancer import sklearn.linear_model from numpy.linalg import inv # numpy.linalg 是处理线性代数的包,inv为矩阵求逆 #sigmoid函数 def sigmoid(x): # Sigm... 阅读全文
posted @ 2018-09-20 09:26 진조우 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 文本分类任务框架: 文本→特征工程(决定着模型分类的上界)→分类器(逼近模型的上限)→类别 文本特征提取: 1.经典的文本特征(前人的研究的成熟理论) 2.手工构造新的特征(手工提取,看数据集中是否有好的性特征) 3.用神经网络提取(神经网络仅作为特征提取器来用) 经典的文本特征: TF、TFIDF 阅读全文
posted @ 2018-09-03 19:42 진조우 阅读(1013) 评论(0) 推荐(0) 编辑
摘要: 第七章 贝叶斯分类器 7.1 贝叶斯决策论 贝叶斯决策论就是在概率框架下实施决策的基本方法。类比于最小二乘法。对于分类任务,在所有相关概率已知的情况下,贝叶斯决策轮考虑如何基于概率和误判损失来选择最优的类别标记。 对于有N种可能的标记类别的预测,是将一个真实标记为cj的样本误分类为ci样本所产生的损 阅读全文
posted @ 2018-08-28 13:49 진조우 阅读(1468) 评论(0) 推荐(0) 编辑
摘要: 今天在学习廖雪峰老师官网的git教程“添加远程库”时发现总是推送失败,下边提示“Permission denied (publickey) 这个问题” 传送门:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8 阅读全文
posted @ 2018-08-23 15:26 진조우 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 第3章 线性模型 3.2 线性回归 将训练集中的特征和标记拟合到某个线性函数上,然后运用此线性函数寻找测试集中特征对应的标记(预测)。 对属性(特征)的描述:对离散属性,若属性值间存在“序”关系,可通过连续化将其转化为连续值。如属性“身高”的取值高、中、低可转化为{1.0, 0.5, 0.0};若属 阅读全文
posted @ 2018-08-22 16:03 진조우 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 梯度下降算法的简单理解 1 问题的引出 在线性回归模型中,先设一个特征x与系数θ1,θ0,最后列出的误差函数如下图所示: 手动求解 目标是优化得到其最小化的J(θ1),下图中的×为y(i),下面给出TrainSet:{(1,1),(2,2),(3,3)}通过手动寻找来找到最优解,由图可见当θ1取1时 阅读全文
posted @ 2018-08-21 14:05 진조우 阅读(10850) 评论(0) 推荐(1) 编辑
摘要: 【转】 PRML笔记 - 1.1介绍 模式识别的目标 自动从数据中发现潜在规律,以利用这些规律做后续操作,如数据分类等。 模型选择和参数调节 类似的一族规律通常可以以一种模型的形式为表达,选择合适模型的过程称为模型选择(Model Selection)。模型选择的目的只是选择模型的形式,而模型的参数 阅读全文
posted @ 2018-07-19 18:21 진조우 阅读(435) 评论(0) 推荐(0) 编辑
摘要: 装饰器 装饰器的本质是一个python函数,它的作用是在不对原函数做任何修改的同时,给函数添加一定的功能。装饰器的返回值也是一个函数对象。 分类: 1、不带参数的装饰器函数: 其中wrapper()就是装饰器函数,func()为被装饰函数,被装饰之后func()可以实现inner中的一部分功能。 2 阅读全文
posted @ 2018-07-12 14:27 진조우 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 机器学习 概论 什么是机器学习 机器学习应用较多的领域 软件 R、Weka、Matlab、Python 具有代表性的算法 阅读全文
posted @ 2018-04-25 14:55 진조우 阅读(175) 评论(0) 推荐(0) 编辑