06 2018 档案

xgboost学习
摘要:1、原理 https://www.cnblogs.com/zhouxiaohui888/p/6008368.html 2、实战 xgboost中比较重要的参数介绍: (1)学习率:learning rate :一般设置比较低,0.1以下 (2)tree: max_depth min_child_we 阅读全文

posted @ 2018-06-30 21:14 吱吱了了 阅读(327) 评论(0) 推荐(0) 编辑

Python笔记24-----迭代器、生成器的使用(如嵌套列表的展开、树的遍历等)
摘要:一、递归yield使用 可把yield当做return,其作用是把一个函数变成一个迭代器。 1、嵌套列表展开 def flatten(nested): if type(nested)==list: for sublist in nested: for i in flatten(sublist): y 阅读全文

posted @ 2018-06-24 17:36 吱吱了了 阅读(761) 评论(0) 推荐(0) 编辑

算法20-----卡诺兰数
摘要:1、卡诺兰概念: 卡诺兰数列的递推关系:h(n)= h(0)*h(n-1) + h(1)*h(n-2) + ... + h(n-1)h(0) (其中n>=2),这是n阶递推关系; 数列的通项:F(n)=C(2n,n)/(n+1) 2、可以解决的问题: 参考链接:https://www.cnblogs 阅读全文

posted @ 2018-06-21 19:31 吱吱了了 阅读(310) 评论(0) 推荐(0) 编辑

正则表达式小知识点
摘要:1、()、[ ] 、{ } 小括号、中括号、大括号区别 小括号就是括号内看成一个整体 ,中括号就是匹配括号内的其中一个,大括号就是匹配几次 {n}n是一个非负整数。匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o。 {n,}n是一个非负整数。至少匹配n 阅读全文

posted @ 2018-06-17 13:38 吱吱了了 阅读(252) 评论(0) 推荐(0) 编辑

贝叶斯算法
摘要:1、贝叶斯要解决的问题: 正向概率:已知袋子中有N个白球和M个黑球,摸到白球的概率多大? 逆向概率:事先不知道袋子中黑白球的比例,通过摸出来球的颜色来判断球的比例。 贝叶斯是在概率的框架下实施决策的节本方法。对分类来说,在所有相关概率都已知的理想情形下,贝叶斯考虑如何基于这些概率和误判损失来按着最优 阅读全文

posted @ 2018-06-17 11:55 吱吱了了 阅读(456) 评论(0) 推荐(0) 编辑

sklearn学习8-----GridSearchCV(自动调参)
摘要:一、GridSearchCV介绍: 自动调参,适合小数据集。相当于写一堆循环,自己设定参数列表,一个一个试,找到最合适的参数。数据量大可以使用快速调优的方法 坐标下降【贪心,拿当前对模型影响最大的参数调优,直到最优,但可能获得的是全局最优】。 二、参数使用 class sklearn.model_s 阅读全文

posted @ 2018-06-16 11:29 吱吱了了 阅读(13193) 评论(0) 推荐(0) 编辑

sklearn学习7-----决策树(tree)
摘要:1、使用示例 2、树模型参数:【很多参数都是用来限制树过于庞大,即担心其过拟合】 # 1.criterion gini or entropy:用什么作为衡量标准 ( 熵值或者Gini系数 )。 # 2.splitter best or random 前者是在所有特征中找最好的切分点 后者是在部分特征 阅读全文

posted @ 2018-06-10 10:45 吱吱了了 阅读(495) 评论(0) 推荐(0) 编辑

广义线性模型------逻辑回归和softmax回归
摘要:1、广义线性模型 2、逻辑回归 3、softmax回归 阅读全文

posted @ 2018-06-07 13:20 吱吱了了 阅读(353) 评论(0) 推荐(0) 编辑

Python数据分析------例子1(信用卡欺诈)
摘要:1、读取数据 2、认识数据 ①数据特征的量纲差距(即归一化/标准化处理) ②数据分布不均衡(比方说分类,0-1分类,0的数据远远大于1的数据) 处理方式:下采样、过采样。 下采样:将多的数据变得和少的数据一样少。 过采样:将少的数据变得和多的数据一样多。 以下是下采样: 过采样:SMOTE算法、AD 阅读全文

posted @ 2018-06-06 14:24 吱吱了了 阅读(2696) 评论(0) 推荐(0) 编辑

sklearn学习6----交叉验证
摘要:1、kfold:自己分样本来交叉验证迭代 导入模块:from sklearn.model_selection import KFold 参数: 导入模块:from sklearn.model_selection import KFold 参数: n_splits:就是将样本分成多少份。进行k折验证 阅读全文

posted @ 2018-06-05 15:36 吱吱了了 阅读(965) 评论(0) 推荐(0) 编辑

sklearn学习5-----模型评估(1) 分类度量
摘要:一、分类度量 1、混淆矩阵: 2、classification_report 3、汉明损失 4、jaccard相似系数得分 5、准确率、召回率和F_measure 3、 阅读全文

posted @ 2018-06-05 15:07 吱吱了了 阅读(392) 评论(0) 推荐(0) 编辑

sklearn学习4----预处理(1)标准化
摘要:一、【标准化】scale: 1、导入模块 from sklearn.preprocessing import scaler 2、作用:直接将给定数据进行标准化 3、使用代码 二、【标准化】StandardScaler 1、导入模块 from sklearn.preprocessing import 阅读全文

posted @ 2018-06-05 14:25 吱吱了了 阅读(873) 评论(0) 推荐(0) 编辑

树(6)-----DFS
摘要:1、二叉树的反向层次遍历 2、最长同值路径 给定一个二叉树,找到最长的路径,这个路径中的每个节点具有相同值。 这条路径可以经过也可以不经过根节点。 注意:两个节点之间的路径长度由它们之间的边数表示。 示例 1: 输入: 输出: 3、找到出现最多值的节点。【递归+Counter字典】 阅读全文

posted @ 2018-06-05 10:05 吱吱了了 阅读(212) 评论(0) 推荐(0) 编辑

sklearn学习3----模型选择和评估(1)训练集和测试集的切分
摘要:来自链接:https://blog.csdn.net/zahuopuboss/article/details/54948181 1、sklearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:http://scikit-learn.org/sta 阅读全文

posted @ 2018-06-04 22:02 吱吱了了 阅读(387) 评论(0) 推荐(0) 编辑

数据分析常用的函数(2)
摘要:1、df.describe():该函数主要对数据进行一个基本的统计,输出数据的总数量(count)、平均值(mean)、标准差(std)、最小值和最大值(min、max)、分位数(四分位) 2、sort_values(by="列名/行名"):对该列或该行进行值排序 3、df.replace(to_r 阅读全文

posted @ 2018-06-04 21:53 吱吱了了 阅读(382) 评论(0) 推荐(0) 编辑

sklearn学习2-----LogisticsRegression
摘要:1、官网地址: http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html 2、class sklearn.linear_model.LogisticRegression 阅读全文

posted @ 2018-06-04 20:40 吱吱了了 阅读(1586) 评论(0) 推荐(0) 编辑

sklearn学习汇总
摘要:该博主总结的很好,https://www.cnblogs.com/hellcat/p/7531789.html 1、kaggle给出的导图 2、转化成树图: 3、sklearn工具导图 阅读全文

posted @ 2018-06-04 20:34 吱吱了了 阅读(384) 评论(0) 推荐(0) 编辑

sklearn学习1----sklearn.SVM.SVC
摘要:1、SVM有两种作用:分类和回归,分类是用SVC,回归用SVR。 2、SVC:(中文官网) 重点在svm.SVC(),fit(X,Y),以及SVC中的参数。 3、SVC参数: ①C,C是控制软间隔中的松弛变量是否起作用,C越大表明越宽松,对松弛变量更容忍,C越小越严格,等于0时表示不允许有数据在支持 阅读全文

posted @ 2018-06-04 19:14 吱吱了了 阅读(1325) 评论(0) 推荐(0) 编辑

树(5)-----判断两颗树一样或者一棵树是否是另外一颗的子树
摘要:1、判断两颗树是否一样。(递归) 2、判断一颗树是否为另外一颗的子树:【在判断是否一样树之上还加一层循环】(递归加循环) 法二:转化成字符串,判断字符串1是否在字符串2之中。 3、寻找重复的子树 给定一棵二叉树,返回所有重复的子树。对于同一类的重复子树,你只需要返回其中任意一棵的根结点即可。 两棵树 阅读全文

posted @ 2018-06-04 16:01 吱吱了了 阅读(873) 评论(0) 推荐(0) 编辑

树(4)-----树的高度
摘要:1、最大深度:(递归) 2、树的直径长度【对每个节点进行一个左子树高度加右子树高度的计算】 给定一棵二叉树,你需要计算它的直径长度。一棵二叉树的直径长度是任意两个结点路径长度中的最大值。这条路径可能穿过根结点。 示例 : 给定二叉树 返回 3, 它的长度是路径 [4,2,1,3] 或者 [5,2,1 阅读全文

posted @ 2018-06-04 11:58 吱吱了了 阅读(1141) 评论(0) 推荐(0) 编辑

面试题1-----SVM和LR的异同
摘要:1、异(加下划线是工程上的不同) (1)两者损失函数不一样 (2)LR无约束、SVM有约束 (3)SVM仅考虑支持向量。 (4)LR的可解释性更强,SVM先投影到更高维分类再投影到低维空间。 (5)SVM不能给出概率结果。 (6)SVM是自带有约束条件的正则,泛化能力比LR好。LR是无约束正则。 ( 阅读全文

posted @ 2018-06-03 16:20 吱吱了了 阅读(890) 评论(0) 推荐(0) 编辑

算法19-----(位运算)找出数组中出现只出现一次的数
摘要:题目: 前三题都可以用集合和来求。【sum(set(nums))*N-sum(nums)】 1、数组中别的数都出现2次,只有一个数出现1次,找出该数。 2、数组中别的数都出现3次,只有一个数出现1次,找出该数。 3、数组中别的数都出现N次,只有一个数出现1次,找出该数。 4、数组中别的数都出现2次, 阅读全文

posted @ 2018-06-02 10:48 吱吱了了 阅读(1183) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示