2020 年 10月随笔档案 - 静悟生慧

leetcode 648 单词替换

摘要：648. 单词替换在英语中，我们有一个叫做词根(root)的概念，它可以跟着其他一些词组成另一个较长的单词——我们称这个词为继承词(successor)。例如，词根an，跟随着单词 other(其他)，可以形成新的单词 another(另一个)。现在，给定一个由许多词根组成的词典和一个句子。你需阅读全文

posted @ 2020-10-30 14:13 静悟生慧阅读(133) 评论(0) 推荐(0) 编辑

leetcode 10 正则表达式匹配(c++)

摘要：10. 正则表达式匹配给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。 '.' 匹配任意单个字符 '*' 匹配零个或多个前面的那一个元素所谓匹配，是要涵盖整个字符串 s的，而不是部分字符串。示例 1：输入：s = "aa" p = "a" 阅读全文

posted @ 2020-10-30 10:18 静悟生慧阅读(266) 评论(0) 推荐(0) 编辑

数字操作题目汇总

摘要：7、整数反转：给出一个 32 位的有符号整数，你需要将这个整数中每位上的数字进行反转。示例 1: 输入: 123输出: 321 示例 2: 输入: -123输出: -321示例 3: 输入: 120输出: 21 思路：假设我们的环境只能存储 32 位有符号整数，其数值范围是 [−2^31, 2^3 阅读全文

posted @ 2020-10-26 10:18 静悟生慧阅读(224) 评论(0) 推荐(0) 编辑

机器学习模型跨平台上线

摘要：1、测模型标记语言(Predictive Model Markup Language,以下简称PMML)，来实现跨平台的机器学习模型部署 https://www.cnblogs.com/pinard/p/9220199.html 2、tensorflow机器学习模型的跨平台上线 https://ww 阅读全文

posted @ 2020-10-23 10:58 静悟生慧阅读(134) 评论(0) 推荐(0) 编辑

推荐系统--召回

摘要：什么是召回召回系统，本质上是个信息漏斗，负责快速从海量信息中筛选出有价值的信息，缩小排序算法的搜素范围（解决了信息过载的问题）；也负责将多路召回的数据，进行融合（相当于一个信息融合器，解决了单路召回特征单一，信息量小，多样性差的问题），得到一个精简的候选集。怎么衡量一个召回系统的好坏召回算法阅读全文

posted @ 2020-10-15 12:49 静悟生慧阅读(480) 评论(0) 推荐(0) 编辑

xgboost 数据不平衡处理方式

摘要：在对不平衡数据进行训练时，通常会考虑一下怎么处理不平衡数据能使训练出来的结果较好。能想到的比较基础的方法是过采样和下采样来缓解数据中的正负样本比。在用xgboost训练二分类模型时，除了直接使用过采样和下采样，xgboost接口还提供一些处理不平衡数据的方法，有scale_pos_weight参数阅读全文

posted @ 2020-10-15 11:23 静悟生慧阅读(4384) 评论(0) 推荐(0) 编辑

数据预处理基本方法

摘要：数据平衡为什么要对数据进行采样是否一定需要对原始数据进行采样平衡有哪些常见的采样方法能否避免采样你平时怎么用采样方法异常点处理统计方法矩阵分解方法特征值和特征向量的本质是什么矩阵乘法的实际意义密度的离群点检测聚类的离群点检测如何处理异常点缺失值处理是不是一定需要对缺失值阅读全文

posted @ 2020-10-14 19:55 静悟生慧阅读(514) 评论(0) 推荐(0) 编辑

常见决策树对比

摘要：常见决策树模型ID3C4.5CART 结构多叉树多叉树二叉树特征选择信息增益信息增益率 Gini系数/均方差连续值处理不支持支持支持缺失值处理不支持支持支持枝剪不支持支持支持简述决策树构建过程构建根节点，将所有训练数据都放在根节点选择一个最优特征，按照这一阅读全文

posted @ 2020-10-12 14:40 静悟生慧阅读(520) 评论(0) 推荐(0) 编辑

静悟生慧

10 2020 档案

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论