[置顶] 基于外部数据的用户信用评估

摘要: 社交和移动互联网快速的促进互联网金融的发展,支付宝,P2P,众筹等。金融中一个比较重要的问题则是信用评估,即对借债人进行信用评估,并以此来决定是否向用户贷款,贷款额,利率等。有的公司当做一个二分类来做,更多公司直接预测是贷款额度,本身也是一个多分类问题。传统信用评估主要根据银行历史信息,信用卡记录,... 阅读全文

posted @ 2015-06-09 14:06 keketse 阅读(565) 评论(0) 推荐(1) 编辑

2015年6月15日

Python 函数参数问题

摘要: Python的传递究竟是值传递还是引用传递?在回答这个问题之前,需要知道python中的变量只是一个对象的引用。赋值操作不会改变对象指向的内容,而是把变量从一个对象的引用,改为指向另一个对象的引用。对一个变量重新复制后,复制前后的变量id会发生改变。而在变量直接进行操作情况,分可变对象(list d... 阅读全文

posted @ 2015-06-15 14:07 keketse 阅读(126) 评论(0) 推荐(0) 编辑

2015年6月12日

Python 知识点

摘要: 1. python是解释型语言,也就是边执行边解释,而java/c则是编译型语言,执行之前先编译成机器可执行的机器码,再执行,解释型语言的速度比编辑型语言的速度要慢。python中常见的解释器有 cpython,ipython,pypy。严格来说,python也算是半编译半解释语言,比如python... 阅读全文

posted @ 2015-06-12 11:32 keketse 阅读(156) 评论(0) 推荐(0) 编辑

2015年6月11日

几种排序算法

摘要: 1. 冒泡排序:比较前后两个相邻的元素,如果大于则进行交换,这样每次遍历一篇数组后,最大的一个数据就沉到了数组的N-1位置上。 两种改进:a. 如果当前遍历,没有发生交换,则已经有序;b. 记录最后发生数据交换的位置i,这个位置之后的数据显然已经有序,则下一次遍历只需要对i之前的数据冒泡即可。vo... 阅读全文

posted @ 2015-06-11 14:32 keketse 阅读(176) 评论(0) 推荐(0) 编辑

2015年6月10日

海盗分金问题

摘要: 1. 有5个海盗,按照等级从5到1排列。最大的海盗有权提议他们如何分享100枚金币。但其他人要对此表决,如果多数(所有人中的多数)反对,那他就会被杀死。他应该提出怎样的方案,既让自己拿到尽可能多的金币又不会被杀死? 分配方案是98,0,1,0,1 5级海盗会不会被杀死,取决于5级海盗死后其他海盗... 阅读全文

posted @ 2015-06-10 19:08 keketse 阅读(238) 评论(0) 推荐(0) 编辑

谷歌面试题目

摘要: 1. 求两个数或N个数的最小公倍数和最大公约数int gcd(int a,int b){ if(a0) { int r = a%b; a = b; b = r; } return a;} // 最大公约数,最小公倍数 = a*b/gc... 阅读全文

posted @ 2015-06-10 18:59 keketse 阅读(247) 评论(0) 推荐(0) 编辑

大数据生态开源工具

摘要: 1. Flume:日志收集软件,里面的重要概念是agent,包括 source -> channel -> slink,sourc,slink 可以为hdfs,jdbc ... 一个简单的场景是用Flume监测一个文件夹fdir的数据变化,这时fdir就是source,并将变化传送到hdfs_pat... 阅读全文

posted @ 2015-06-10 14:52 keketse 阅读(308) 评论(0) 推荐(0) 编辑

2015年6月9日

统计相关知识

摘要: 1. 高斯分布 pdf = 1/√2\phi \thea exp(-(x-u)^2/2\thea^2),其中\thea是标准差2. x1 ~ N(u1,v1) x2 ~ N(u2,v2) E(x1 + x2) = u1 + u2 Var(x1 + x2) = E((x1+x2)^2) - E(x1+... 阅读全文

posted @ 2015-06-09 21:34 keketse 阅读(227) 评论(0) 推荐(0) 编辑

网易面试题目

摘要: 1. 如果一个数字十进制表达时,不存在连续两位相同,则称之为“不重复数”。例如,105,1234,12121都是“不重复数”,而11,100,1225不是。给定一个long long类型数字A,返回大于A的最小“不重复数”。 Constraints:A 取值范围是[0, 10^17],注意是闭区间... 阅读全文

posted @ 2015-06-09 20:22 keketse 阅读(358) 评论(0) 推荐(0) 编辑

排列组合 - 卡塔兰数的应用

摘要: 卡塔兰数,是组合数学中一个常出现在各种计数问题中出现的数列。输入一个整数n,计算h(n)。h(n)= h(0)*h(n-1)+h(1)*h(n-2) + ... + h(n-1)h(0) (其中n>=2,h(0) = h(1) = 1)该递推关系的解为:h(n)=C(2n,n)/(n+1) (n=1... 阅读全文

posted @ 2015-06-09 13:30 keketse 阅读(502) 评论(0) 推荐(0) 编辑

导航