摘要:
187. Repeated DNA Sequences 求重复的DNA序列 public List<String> findRepeatedDnaSequences(String s) { Set seen = new HashSet(), repeated = new HashSet(); for 阅读全文
摘要:
(2017腾讯实习生校招笔试题)Calvin和David正在玩取纽扣游戏,桌上一共有16个纽扣,两人轮流来取纽扣,每人每次可以选择取1个或3个或6个(不允许不取),谁取完最后的纽扣谁赢。Cavin和David都非常想赢得这个游戏,如果Cavin可以先取,Cavin的必胜策略下第一步应该取 A、1个 阅读全文
摘要:
不均衡学习的抽样方法 通常情况下,在不均衡学习应用中使用抽样方法的目的就是为了通过一些机制改善不均衡数据集,以期获得一个均衡的数据分布。 研究表明,对于一些基分类器来说,与不均衡的数据集相比一个均衡的数据集可以提高全局的分类性能。数据层面的处理方法是处理不均衡数据分类问题的重要途径之一,它的实现方法 阅读全文
摘要:
16. 3Sum Closest 这道题让我们求最接近给定值的三数之和,是在之前那道 3Sum 三数之和的基础上又增加了些许难度,那么这道题让我们返回这个最接近于给定值的值,即我们要保证当前三数和跟给定值之间的差的绝对值最小,所以我们需要定义一个变量result用来记录当前最小三个数的和,然后我们还 阅读全文
摘要:
黑塞矩阵是由目标函数 在点X处的二阶偏导数组成的 阶对称矩阵 数据科学家需要了解的45个回归问题测试题(附答案) 1.L1与L2区别?L1为啥具有稀疏性? L1是向量各元素的绝对值之和,L2是向量各元素的平方和 l1求导(弱导数)后,在x=0附近其系数相比l2的导数2x大,导致l1罚产生了主导作用, 阅读全文
摘要:
GoJS是一个实现交互类图表(比如流程图,树图,关系图,力导图等等)的JS库 gojs提供了angular的基本例子,不过是离线版 https://github.com/NorthwoodsSoftware/GoJS/tree/master/projects/angular-basic 下图是运行结 阅读全文
摘要:
排序 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。 堆 堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结 阅读全文
摘要:
详解 Kaggle 房价预测竞赛优胜方案:用 Python 进行全面数据探索 方法框架: 理解问题:查看每个变量并且根据他们的意义和对问题的重要性进行哲学分析。 单因素研究:只关注因变量( SalePrice),并且进行更深入的了解。 多因素研究:分析因变量和自变量之间的关系。 基础清洗:清洗数据集 阅读全文
摘要:
把字符串转换成整数 class Solution { public: int StrToInt(string str) { int n = str.size(), s = 1; long long res = 0; if(!n) return 0; if(str[0] == '-') s = -1; 阅读全文
摘要:
高维数据的聚类分析 高维聚类研究方向 高维数据聚类的难点在于: 1、适用于普通集合的聚类算法,在高维数据集合中效率极低 2、由于高维空间的稀疏性以及最近邻特性,高维的空间中基本不存在数据簇。 在高维聚类的研究中有如下几个研究重点: 1)维度约简,主要分为特征变换和特征选择两大类。前者是对特征空间的变 阅读全文