上一页 1 2 3 4 5 6 7 8 9 ··· 25 下一页
摘要: 看这一篇就够了: http://www.powerxing.com/install-hadoop-in-centos/ 阅读全文
posted @ 2018-05-13 11:41 stAr_1 阅读(85) 评论(0) 推荐(0) 编辑
摘要: *无法联网的明显表现会有: 1、yum install出现 Error: cannot find a valid baseurl or repo:base 2、ping host会提示unknown host 方法一、 1、打开 vi /etc/sysconfig/network-scripts/i 阅读全文
posted @ 2018-05-12 16:30 stAr_1 阅读(1309) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-05-02 17:35 stAr_1 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 一、项目介绍 这是拍拍贷举办的一个风控算法比赛,目标是根据用户历史行为数据来预测用户在未来6个月内是否会逾期还款。评价指标为AUC。 然后给出的数据有贷款记录、借款人登录信息,借款人修改信息,主要进行的工作是: 1.数据预处理 1.1缺失值的处理 按列统计:作图分析各列缺失值的比例 缺失值比例过高的 阅读全文
posted @ 2018-04-30 13:00 stAr_1 阅读(604) 评论(0) 推荐(0) 编辑
摘要: 一、字符串操作 去空格及特殊符号 查找字符 大小写:upper()和lower()方法 删除字符串:分片的方式 比价字符串:cmp() 分割 二、正则表达式 https://regexr.com/验证网站,FQ进 https://alf.nu/RegexGolf练习网站 字符: .:匹配除换行符外所 阅读全文
posted @ 2018-04-26 18:03 stAr_1 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 一、数据预处理 1.数据采集 2.数据格式化(存储格式等) 3.数据清洗:去掉脏数据 简单直观可以看出的不可能数据 组合或统计属性判定 缺失值处理 1.删除元祖:删除这一条记录或者一列特征,适合记录或者特征占总样本比例很小,或者缺失值非常多。但是会造成数据少很多,有可能造成性能下降 2.数据补齐:这 阅读全文
posted @ 2018-04-23 18:03 stAr_1 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 在机器学习领域中,梯度下降的方式有三种,分别是:批量梯度下降法BGD、随机梯度下降法SGD、小批量梯度下降法MBGD,并且都有不同的优缺点。 下面我们以线性回归算法(也可以是别的算法,只是损失函数(目标函数)不同而已,它们的导数的不同,做法是一模一样的)为例子来对三种梯度下降法进行比较。 1. 线性 阅读全文
posted @ 2018-04-17 10:55 stAr_1 阅读(319) 评论(0) 推荐(0) 编辑
摘要: 贪心算法是动态规划的一个特例,动态规划是贪心算法的泛化 动态规划类似于穷举法,只是记录了之前的结果,不需要进行重复的计算,可以利用前边的结果(状态方程),一般复杂度比贪心高 贪心算法每次只考虑当前,不保证能得到全局最优,只保证当前最优,应用前一般需要证明,一般复杂度比较低 动态规划的例子:凑钱问题, 阅读全文
posted @ 2018-04-16 15:31 stAr_1 阅读(589) 评论(0) 推荐(0) 编辑
摘要: 转自知乎链接:https://www.zhihu.com/question/20416888/answer/15076251 1、CPM 收费最科学的办法是按照有多少人看到你的广告来收费。按访问人次收费已经成为移动广告平台的惯例。CPM(千人成本)指的是广告投放过程中,听到或者看到某广告的每一人平均 阅读全文
posted @ 2018-04-10 17:10 stAr_1 阅读(3073) 评论(0) 推荐(0) 编辑
摘要: 隐语义模型是通过隐含特征,联系用户和物品,基于用户的特征对物品进行自动聚类,然后在用户感兴趣的类中选择物品推荐给用户。 对于推荐系统,常用的算法: USER-CF:给用户推荐和他兴趣相似的用户喜欢的物品 ITEM-CF:给用户推荐他们感兴趣物品的相似物品 LFM:得到用户感兴趣的分类,从该分类中挑选 阅读全文
posted @ 2018-04-10 15:49 stAr_1 阅读(348) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 25 下一页