10 2015 档案
摘要:北美IT公司大致分档(from mitbbs.com)第一档: Uber, Snapchat, Airbnb, Dropbox, Pinterest第二档:Facebook, LinkedIn, Google, Twitter, Apple第三档: Square, Yelp, Netflix, Sk...
阅读全文
摘要:1.推荐系统中的算法: 协同过滤: 基于用户 user-cf 基于内容 item –cf slop one 关联规则 (Apriori 算法,啤酒与尿布) 2.slope one 算法 slope one 算法是基于不同物品之间的评分差的线性算法,预测用户对物品评分的个性化算法。slope one 算法是由daniel 教授在2005年提出。主要分为2步 1. ...
阅读全文
摘要:1. 你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法? 答:推荐中用过CF,LR 分类中用过SVM,GBDT; 一般用法是什么,是不是自己实现的,有什么比较知名的实现,使用过程中踩过哪些坑; 优缺点分析。 2.你熟悉的机器学习/数据挖掘算法主要有哪些? 基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法,也适当说说应用场合; 答:协同过滤,聚类,分类, 3. ...
阅读全文
摘要:0.支持度与置信度《mahout实战》与《机器学习实战》一起该买的记录数占所有商品记录总数的比例——支持度(整体)买了《mahout实战》与《机器学习实战》一起该买的记录数占所有购买《mahout实战》记录数的比例——置信度(局部)支持度、置信度越大,商品出现一起购买的次数就越多,可信度就越大。支持...
阅读全文
摘要:1.能用set 不用list ~$ python -m timeit -n 1000 "[x for x in range(1000) if x in range(500, 1500)]" 1000 loops, best of 3: 28.2 msec per loop ~$ python -m timeit -n 1000 "set(range(1000)).intersection(ran...
阅读全文
摘要:在Python中集合set是基本数据类型的一种,它有可变集合(set)和不可变集合(frozenset)两种。创建集合set、集合set添加、集合删除、交集、并集、差集的操作都是非常实用的方法。 1.创建集合 set类是在python的sets模块中,大家现在使用的python2.3中,不需要导入sets模块可以直接创建集合。>>>set('boy')set(['y', 'b', 'o'])...
阅读全文
摘要:2015-10-04周日7:00 How to design a system? Full-statck tech solution for startups System design is 100% waiting for you in the job/promotion interview. 2.What’s a good design? *Healthiness Executio...
阅读全文
摘要:独孤九剑:总诀式:心法总纲 1.破剑式 2.破刀式 3.破枪式 4.破索式 5.破掌式 6.破箭式 7.破气式 1.二分查找的时间复杂度是O(logn) 1.算法面试中如果需要优化O(n)的时间复杂度,那么只能是O(logn)的二分法 2.Recursion or while –loop? 如果问题不复杂,能用递归就用递归。 如果问题比较复杂,那就用递归。 3.避免死循环,条件 st...
阅读全文
摘要:0.设置而 vimium 的默认搜索引擎:http://www.baidu.com/s?wd=j: 向下细微滚动窗口。 k:向上细微滚动窗口。gg:跳转到页面的顶部。G:跳转到页面的底部。r:重新载入该页。u:向上移动半个屏幕(相当于PageUp)。d:向下滚动半个屏幕。1. j: 向下细微滚动窗...
阅读全文
摘要:答: facebook, linkedin, alphabeta,airbnb,amazon,apple, google
阅读全文
摘要:假设集合A={a, b},集合B={0, 1, 2},则两个集合的笛卡尔积为{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}。
阅读全文
摘要:1.检测邮箱valide http://www.cplusplus.com/forum/general/65108/ 2.检测手机号valide https://leetcode.com/problems/valid-phone-numbers/
阅读全文
摘要:各位工程师累了吗? 推荐一篇可以让你技术能力达到出神入化的网站["宅男门诊"](https://zhainanmenzhen.com/) 1、使用机器学习来解决问题,我们用数学语言来描述它,然后建立一个模型,例如回归模型或者分类模型等来描述这个问题; 2、通过最小化误差、最大似然、最大后验概率等等建
阅读全文
摘要:1. 如果有一个新的面积,假设在销售价钱的记录中没有的,而我们又想知道房屋的售卖价格,我们怎么办呢?图中绿色的点就是我们想要预测的点。 假设我们知道了红色的这条直线,那么给出房屋的面积,马上就可以给出房屋的售价。因此,我们需要找到这样的一条红色直线。 2.模型建立 刚才我们认为房屋的售价只与面积相关。实际生活中,影响房价的因素非常多,如房屋的面积、朝向、所在小区、房间的个数等。考虑更多的情况,...
阅读全文
摘要:1.Hbase+k-means (G级别) 2.k-means+mr (T级别) 1. 2.canopy 2.贝叶斯算法 决策,分类,文档分类 3.推荐系统 4.图书推荐系统 1.需求 付完款的用户90%都要回到购物车看看自己买的东西是否少买/多买 猜你喜欢 购买组合 内部推荐系统测试jps查询
阅读全文