摘要:
#查找index函数的帮助 help(str.index) #for循环和break语句from math import sqrtfor i in range(2,101): flag=1 k=int(sqrt(i)) for j in range(2,k+1): if i%j==0: flag=0 阅读全文
摘要:
今天看完了一本之前别人推荐的书《长尾理论》~还是很不错呢~推荐给大家,尽管书中的很多例子和现象都在我们现在的生活中已经习以为常,但我以前没有思考过,这种演变,背后推动它发展的原理是什么,这本书算是打开我思考的思路~书中提到的消费者长尾的崛起,营销碎片化,也是现在我们这个时代所需要思考的问题,电视广告 阅读全文
摘要:
听了一个Talkingdata的首席金融行业专家鲍忠铁老师的分享,收益良多,把讲的一些笔记写下来了~以后分析可以提供一些思路~要学的东西是在太多。。。感觉我要看的书都可以堆个20本。。。时间不够用555555555555555 一、金融行业数据分析思路 数字化运营、精准营销、数据风控(以前银行对于大 阅读全文
摘要:
本文转载自http://mp.weixin.qq.com/s?__biz=MzA5ODUxOTA5Mg==&mid=401860790&idx=1&sn=8720a2a1d83f407087b665c753fc9fc9&scene=1&srcid=0811KwT9hjyqcbJYMISXaLbc#r 阅读全文
摘要:
今天看到有个同学分享了关于算法学习的思路,觉得对于我来说启发很大,因此决定把他说的一些东西写下来以提醒自己: 首先是算法的产生背景,适用场合(数据规模,特征维度,是否有Online算法,离散/连续特征处理) 原理推导(最大间隔,软间隔,对偶) 求解方法(随机梯度下降,拟牛顿法等优化算法); 优缺点, 阅读全文
摘要:
前面博客中讲到的聚类,聚类是对客户的一些特征进行分群,属于描述,不涉及客户价值的判断,然而在营销中,其实第一步应该是搞清楚谁才是你的关键客户,哪些用户的价值较高,这就需要用到RFM模型。RFM模型是众多的客户关系管理(CRM)分析模式中,被广泛提到和应用的模型之一。通过R(Recency,表示最后一 阅读全文
摘要:
异常值是模型优化的关键点之一,离均值远的是异常值,可是多远才算足够远呢,其实不同的模型有着不同的考量,基于模型所受的影响不同,所以所能忍受的异常值也不同。 1、异常值的类型 从二维的角度来说,其实异常值有三种类型,一是影响垂直方向Y的异常值,叫垂直特异性,对应探测该类异常的指标为标准化残差(学生化残 阅读全文
摘要:
在说明线性回归前,想先讲几个与线性回归密切相关的知识点。 一、散点图 散点图主要需要看四个方面,一是散点的疏密程度,越密表示相关性越大;二是看散点的趋势;三是看数据的主体模式在哪一部分;四是趋势之外的异常值分布在哪里(建模时考虑剔除)。在回归分析之前,需要先绘制变量间的散点图,以此判断各变量间是否为 阅读全文
摘要:
在接触数据挖掘之前,一直比较疑惑的事情是,现在这么流行神经网络、聚类等等算法,那我们以前大学课程学习的线性回归、方差分析这些传统的统计学有什么作用呢。最近听一个老师讲课,才明白,其实是不用领域、不同情况,进行数据分析的工具不同而已。我们获取的数据通常分为三类,第一类是实验数据,这类数据的数据量大小往 阅读全文
摘要:
参考书籍《 MySQL数据库基础与实例教程》 --孔祥盛 SQL(structured query language)结构化查询语言,应用最为广泛的关系型数据库语言。 MYSQL属于关系型数据库管理系统中的一种,数据库用户必须使用关系型数据库管理系统,才能调用操作系统的进程管理、内存管理、设备管理以 阅读全文