摘要:
1. 原理和理论基础(参考) 2. Spark代码实例: 1)windows 单机 2)集群模式 需要打包,然后通过spark-submit 提交到yarn client或者cluster中: spark-submit --class myNaiveBayes --master yarn Scala 阅读全文
摘要:
1. 原理和理论基础(参考) 2. Spark代码实例: 1)windows 单机 2)集群模式 需要打包,然后通过spark-submit 提交到yarn client或者cluster中: spark-submit --class myNaiveBayes --master yarn Scala 阅读全文
摘要:
先了解下广告的产业链有哪些人群: DSP,SSP,DMP的含义(参考) 1. DSP 也就是Demand Side Platform 需求方平台; 为广告主提供跨竞价市场、跨平台、跨终端的程序化广告投放平台,通过数据整合、分析实现基于受众的精准投放。 2. SSP 是Supply Side Plat 阅读全文
摘要:
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术 第五章:荣耀之钥:度量成功 我们的分析师常常得不到我们应得的喜欢,尊重和资金,因为我们没有充分地衡量一个黄金概念:成果。因为我们拥有大量的数据,我们投入去对访问量、时间和回报进行报告。但是只有我们在关心这些指标。然而,我们的老板 阅读全文
摘要:
Spark开发中遇到了一些小问题,都是大神随便一个手指头帮我解决的。保持学习,积累吧! 一. 基于Intellij IDEA编辑器 1. 快捷键 注释/去注释 Ctrl+Shift+? 2. repository 依赖 不同的公司可能有自己的私服,是同事们已经下载的jar包等,可以在 .m2/set 阅读全文
摘要:
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术 第四章:点击流分析的奇妙世界:实际的解决方案 到开始实际工作的时候了。哦耶! 在本章中,您将了解到一些最重要的网络分析报告,我将介绍如何对SEO、网站搜索、微件分析等应用酷炫而有效的报告。 然后你将进入分析忍者的下一个段位。您将 阅读全文
摘要:
艾玛,果然一个破的小问题也能纠结好久!不过终于过去了。。。 1. 机器上的host文件目录一般是 /etc/hosts 主要可能会涉及一些网站的安全访问,把网站加入hosts也就意味着 加入了白名单; 访问机器ip 试图访问网页 11.11.11.11 baidu.com 2. windows的ho 阅读全文
摘要:
1. 内积和外积 向量内积(点乘): a.b = x1*y1+x2*y2 其中a(x1,x2) b(y1,y2) 结果是标量 一个数值向量外积(叉乘): a×b= |a|*|b|*sin 结果是一个向量(矢量),按右手法则判断。 2. Cauchy–Schwarz inequality 柯西施瓦兹不 阅读全文
摘要:
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术 第三章:点击流分析的奇妙世界:指标 新的Web Analytics 2.0心态:搞定它。新的闪亮系列工具:是的。准备好了吗?当然! 现在是时候开始构建度量和关键绩效指标(KPI)模块来探索Clickstream分析这个美呆了的世 阅读全文
摘要:
参考资料: 在线免费书籍 http://neuralnetworksanddeeplearning.com/chap1.html Chapter 1 1. perceptron 感知机 it's a device that makes decisions by weighing up evidenc 阅读全文
摘要:
1. 几个表进行join,然后过滤 等价于 分别过滤为小表后,再join? 并不完全。 2)确实比1)效率高, 但要注意一些NULL值过滤。否则2)得到的结果比1)多 2. left join 的 不等值连接 等价于 left join where 不等值条件? 并不。 可以把不等值挪到case w 阅读全文
|