10 2020 档案
摘要:648. 单词替换在英语中,我们有一个叫做 词根(root)的概念,它可以跟着其他一些词组成另一个较长的单词——我们称这个词为 继承词(successor)。例如,词根an,跟随着单词 other(其他),可以形成新的单词 another(另一个)。现在,给定一个由许多词根组成的词典和一个句子。你需
阅读全文
摘要:10. 正则表达式匹配 给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。 '.' 匹配任意单个字符 '*' 匹配零个或多个前面的那一个元素 所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。 示例 1: 输入:s = "aa" p = "a"
阅读全文
摘要:7、整数反转:给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。 示例 1: 输入: 123输出: 321 示例 2: 输入: -123输出: -321示例 3: 输入: 120输出: 21 思路:假设我们的环境只能存储 32 位有符号整数,其数值范围是 [−2^31, 2^3
阅读全文
摘要:1、测模型标记语言(Predictive Model Markup Language,以下简称PMML),来实现跨平台的机器学习模型部署 https://www.cnblogs.com/pinard/p/9220199.html 2、tensorflow机器学习模型的跨平台上线 https://ww
阅读全文
摘要:什么是召回 召回系统,本质上是个信息漏斗,负责快速从海量信息中筛选出有价值的信息,缩小排序算法的搜素范围(解决了信息过载的问题); 也负责将多路召回的数据,进行融合(相当于一个信息融合器,解决了单路召回特征单一,信息量小,多样性差的问题),得到一个精简的候选集。 怎么衡量一个召回系统的好坏 召回算法
阅读全文
摘要:在对不平衡数据进行训练时,通常会考虑一下怎么处理不平衡数据能使训练出来的结果较好。能想到的比较基础的方法是过采样和下采样来缓解数据中的正负样本比。 在用xgboost训练二分类模型时,除了直接使用过采样和下采样,xgboost接口还提供一些处理不平衡数据的方法,有scale_pos_weight参数
阅读全文
摘要:数据平衡 为什么要对数据进行采样 是否一定需要对原始数据进行采样平衡 有哪些常见的采样方法 能否避免采样 你平时怎么用采样方法 异常点处理 统计方法 矩阵分解方法 特征值和特征向量的本质是什么 矩阵乘法的实际意义 密度的离群点检测 聚类的离群点检测 如何处理异常点 缺失值处理 是不是一定需要对缺失值
阅读全文
摘要:常见决策树 模型ID3C4.5CART 结构 多叉树 多叉树 二叉树 特征选择 信息增益 信息增益率 Gini系数/均方差 连续值处理 不支持 支持 支持 缺失值处理 不支持 支持 支持 枝剪 不支持 支持 支持 简述决策树构建过程 构建根节点,将所有训练数据都放在根节点 选择一个最优特征,按照这一
阅读全文