摘要:卓越源于坚持,努力须有方向。 如上图所示,有一堆训练数据的正负样本,标记为:,假设有一个超平面H:,可以把这些样本正确无误地分割开来,同时存在两个平行于H的超平面H1和H2: 使离H最近的正负样本刚好分别落在H1和H2上,这样的样本就是支持向量。那么其他所有的训练样本都将位于H1和H2之外,样本距离
阅读全文
摘要:希望大家还是在实践当中感受效率,理解效率,写出高质量的代码和算法,仅仅作为参考,不要误导大家。排版尽量舒服吧,尽力了。 一般而言分析算法效率的方式有两种,即:时间效率和空间效率。时间效率也称为时间复杂度;空间效率也称为空间复杂度。在计算机技术发展的几十年中,空间资源变得不是非常重要了,因此在一般的算
阅读全文
摘要:算法工程师的责任不仅是提出算法,而是提出更稳定的算法 1. 计算的稳定性(Computational Stability) 计算稳定性特指模型运算性能的鲁棒性(Robustness),我猜计算机背景的朋友肯定不会对此感到陌生。举个简单例子,如果我们让整数型(int)的变量来储存的一个浮点变量(flo
阅读全文
摘要:不要总是掉包欧,真的丢人啊,一起码起来! '''函数的功能:单层决策树分类函数参数说明: xMat:数据矩阵 i:第i列,第几个特征 Q:阈值返回分类结果: re'''import numpy as npimport pandas as pddef classify0(xMat,i,Q,S): re
阅读全文
摘要:小伙伴你的程序还是停留在糊墙吗?优化代码可以显示程序员的素质欧! 普及一下基础了欧: 一层for简写:y = [1,2,3,4,5,6],[(i*2) for i in y ] 会输出 [2, 4, 6, 8, 10, 12] ,标准形式为: [ 对i的操作 for i in 列表 ] 两层for循
阅读全文
摘要:点滴积累,厚积薄发,做好每一天,向时间要效率,向生命要质量。 一、深度优先搜索和广度优先搜索DFS(Depth-First-Search),是盲目搜索算法的一种。常常用在树的遍历及图的处理上。假设当前搜索的节点记为k,深度优先搜索表示,继续探寻k节点的所有的边。搜索过程中,遇到满足条件的k+1节点,
阅读全文
摘要:一、聚类(无监督)的目标 使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。 二、层次聚类 层次聚类算法实际上分为两类:自上而下或自下而上。自下而上的算法在一开始就将每个数据点视为一个单一的聚类,然后依次合并(或聚集)类,直到所有类合并成一个包含所有数据点的单一聚类。因此,自下而上的
阅读全文
摘要:给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 实例输入: [0,1,0,3,12] 输出: [1,3,12,0,0] 说明: 必须在原数组上操作,不能拷贝额外的数组。 尽量减少操作次数。 思路:从左到右遍历数组存在数字把是0的逐一的替换,左右更替,最
阅读全文
摘要:https://github.com/lmq070466/ML/tree/master/analysis_and_prediction_for_diabetes-master更新开源了糖尿病项目以及自己的论文。 更新spark基础知识
阅读全文
摘要:(1)nohup nohup命令用于不挂断地运行命令(关闭当前session不会中断改程序,只能通过kill等命令删除)。使用nohup命令提交作业,那么在缺省情况下该作业的所有输出都被重定向到一个名为nohup.out的文件中,除非另外指定了输出文件。 (2)&&用于后台执行程序,但是关闭当前se
阅读全文