12 2021 档案
摘要:绘制散点图 import matplotlib.pyplot as plt fig=plt.figure() ax = fig.add_subplot(111) ax.scatter(x,y, s,c,marker) #x,y 可以是可迭代对象 plt.show() scatter:(x, y, s
阅读全文
摘要:官方英文文档地址:http://scikit-learn.org/dev/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression 导包: from s
阅读全文
摘要:分类(0 or 1)和回归(多少范围内) 可以用来预测 目标:找到θ矩阵的最优解 【不建议将线性回归用于分类问题】 机器学习:需要用到的数据,怎样学(目标函数),逐渐达成目标 偏置项作用:微调最终结果 目标是:误差项最小 数据在独立同分布的情况下,联合概率密度=边缘概率密度的乘积,(下面的似然函数)
阅读全文
摘要:机器学习中,人工选择数据(数据获取)、提取特征(特征工程)、选择算法(建立模型)、得到结果(评估应用) 深度学习解决了机器学习中特征工程的问题 怎样去选取特征,比如面对图像数据、文本数据的时候怎么办 深度学习能自动学习到目标什么特征是最合适的 深度学习应用:90%计算机视觉(人脸识别),对移动端支持
阅读全文
摘要:用多种分类器一起完成同一份任务 Bagging策略(有放回的,随机的,子集大小一样的,m个训练集用同一个模型) Boosting-提升策略(串联) AdaBoost算法
阅读全文
摘要:不用设值K个簇的值 需要设置两个值:minPts和半径r的值 可视化展示 核心对象,传销组织头头 传销方式发展下线,在某一个子组织内,一个不是首领的人没有任何下线,就称这个人为‘’边界点‘’ 圈圈圈圈圈圈 需要指定的参数:
阅读全文
摘要:可视化 聚类 最简单实用的聚类算法:K-MEANS算法 K值:数据分成几份 质心:簇的中心点 优化目标:K个簇的(每个簇中的每个点距离质心的距离)的和最小 ci中心点,x个别点 工作流程: 设置K值,初始化K个点(随机?),然后计算每个点距离这K个点的距离,视距离最近的那个点为主,然后分成K个家族
阅读全文
摘要:线性支持向量机公式推导 找出什么向量(最近距离最大的两个点)来支撑分割的超平面 上面三个图,b图的决策面划分更加合理,‘间距’更大,如何具体分类问题中的找到这条线? 雷就是点 通过计算点到直线的距离,找出距离直线最近最远的那个点(两个点) 点到直线的距离如何计算? 转行成点到平面的距离,设置一个超平
阅读全文