摘要:
1.数据竞赛流程 数据分析主要目的是分析数据原有的分布和内容; 特征工程目的是从数据中抽取出有效的特征; 模型训练与验证部分包括数据划分的方法以及数据训练的方法; 模型融合参考我的另一篇介绍模型融合的博客。 1.1.数据分析 在拿到数据之后,首先要做的就是要数据分析(Exploratory Data 阅读全文
摘要:
写在前面:相关模型的具体介绍请阅读我的另一篇博客机器学习算法岗面试与提问总结 1.请你介绍一下逻辑回归模型LR LR(Logistic Regression)虽然是回归模型,但却是经典的分类方法。 对比一下SVM,在二分类问题中,如果你问SVM,它只会回答你该样本是正类还是负类;而你如果问LR,它则 阅读全文
摘要:
给你一个长度为 n 的整数数组 nums,其中 n > 1,返回输出数组 output ,其中 output[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积。 示例: 输入: [1,2,3,4]输出: [24,12,8,6] 提示:题目数据保证数组之中任意元素的全部前缀元素和后缀( 阅读全文
摘要:
d={"ok":1,"no":2} #对字典按键排序,用元组列表的形式返回 d1 = sorted(d.items(), key=lambda d:d[0],reverse = False) #[('no', 2), ('ok', 1)] #对字典按值排序,用元组列表的形式返回 d2 = sorte 阅读全文
摘要:
Counter中文意思是计数器,也就是我们常用于统计的一种数据类型,在使用Counter之后可以让我们的代码更加简单易读。 我们先看一个简单的例子: #统计词频 colors = ['red', 'blue', 'red', 'green', 'blue', 'blue'] result = {} 阅读全文
摘要:
题目描述:给定一个整数数组 a,其中1 ≤ a[i] ≤ n (n为数组长度), 其中有些元素出现两次而其他元素出现一次。找到所有出现两次的元素。你可以不用到任何额外空间并在O(n)时间复杂度内解决这个问题吗? 示例: 输入:[4,3,2,7,8,2,3,1] 输出:[2,3] 思路1:这个题目开头 阅读全文