飞鸟各投林

导航

2016年4月11日 #

2016.4.11-关于失败的一点思考

摘要: 睡觉之前突然想到马云说过的一句话:我们要习惯于拒绝,习惯失败,如果我们还没成功,那是因为我们的失败还不够 2016.4,11 以此自勉 阅读全文

posted @ 2016-04-11 23:46 飞鸟各投林 阅读(138) 评论(0) 推荐(0) 编辑

Hadoop的IO操作

摘要: Hadoop的API官网:http://hadoop.apache.org/common/docs/current/api/index.html 相关的包 org.apache.hadoop.io org.apache.hadoop.io.compress org.apache.hadoop.io. 阅读全文

posted @ 2016-04-11 23:31 飞鸟各投林 阅读(518) 评论(0) 推荐(0) 编辑

Hadoop MapReduce InputFormat基础

摘要: 有时候你可能想要用不同的方法从input data中读取数据。那么你就需要创建一个自己的InputFormat类。 InputFormat是一个只有两个函数的接口。 1 public interface InputFormat<K, V> { 2 InputSplit[] getSplits(Job 阅读全文

posted @ 2016-04-11 23:27 飞鸟各投林 阅读(283) 评论(0) 推荐(0) 编辑

数据分析师常见的10道面试题解答

摘要: 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用h 阅读全文

posted @ 2016-04-11 23:21 飞鸟各投林 阅读(3755) 评论(0) 推荐(0) 编辑

推荐系统中常用算法 以及优点缺点对比

摘要: 推荐系统中常用算法 以及优点缺点对比 在 推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。 一、基于内 阅读全文

posted @ 2016-04-11 23:19 飞鸟各投林 阅读(670) 评论(0) 推荐(0) 编辑

创业股权究竟如何分配--新浪创业训练营

摘要: 大众创业万众创新,一个好汉三个帮,但是股权怎么分? 股权架构和相关问题,可能是创业里最重要、最基础,但又在初期最不被重视的问题。正是如此,才导致了众多创业项目在未来隐患难除,发展遇阻。 什么样的股权架构是合理的股权架构?一个拥有13年经验的股权法务律师对此有怎样的建议?在新浪创业训练营的股权法务课程 阅读全文

posted @ 2016-04-11 22:45 飞鸟各投林 阅读(475) 评论(0) 推荐(0) 编辑

创业者要处理好的10大关系

摘要: 本文是蓝港互动董事长、斧子科技CEO王峰在2016新浪创业训练营上长达四小时的分享实录,由新浪科技整理。 大家好,我是王峰,现在主要有三个身份。 第一个身份,是港股上市公司蓝港互动集团(8267.HK)的创始人、董事长兼首席执行官,公司成立于2007年,历经近8年艰苦创业,2014年12月30日终于 阅读全文

posted @ 2016-04-11 22:40 飞鸟各投林 阅读(515) 评论(0) 推荐(0) 编辑

洪泰基金投资经理殷鹏:肯定不投的八类项目

摘要: 对于创业者来说,寻找合适的投资机构拿到相应的融资是创业中必须要经历的一个过程;然而,对于机构投资人来说,每周需要投入超过100个小时来研究并寻找优秀的创业团队。 成立仅半年的洪泰基金截止目前,投资了50余个项目,其中,互联网+概念的部分几乎100%。在新创课的课堂上,洪泰基金资深投资经理殷鹏分享了他 阅读全文

posted @ 2016-04-11 22:37 飞鸟各投林 阅读(274) 评论(0) 推荐(0) 编辑

创业初期股权如何分配-------陈楠心血总结

摘要: 被自己创立的公司踢出局?听起来像个玩笑,但被创业者和果粉奉若神明的乔布斯,当年就被自己一手创立的苹果公司踢出了苹果。所以如果你是创业者,在新浪创业训练营,米律创始人、13年股权法务律师郑明龙分享了法律方面的专业经验:如何实现对公司的控制。 对于一个创业公司来讲,控制权是绕不开的话题。但关于公司控制权 阅读全文

posted @ 2016-04-11 22:34 飞鸟各投林 阅读(724) 评论(0) 推荐(0) 编辑

排序总结

摘要: (1)快速排序:O(nlogn)~O(n^2): 小的放在该元素前面,大的放在该元素后面。 快速排序的比较时间最短,可以理解为其要比较该元素的前后,所以效率最高。 平均时间和最好时间:O(nlogn) 最坏时间退化成冒泡: O(n^2) (2)选择排序:不受初始数据序列的影响,时间复杂度不变 直接选 阅读全文

posted @ 2016-04-11 22:28 飞鸟各投林 阅读(128) 评论(0) 推荐(0) 编辑

如何快速进入一门领域,学习新的知识

摘要: 1:买书:淘宝便宜 2:买视频:淘宝买后下载保存到网盘 3:电子书:下载对应的纸质版 4:百度文库搜索相关文档,学习笔记,学习总结,课件,PPT等 5:微博上加人,关注大牛 6:知乎上关注话题和牛人 7:QQ搜索相关群,并加入后,下载资料 8:官网和API,查看学习 9:相关论坛和社区,参与讨论,经 阅读全文

posted @ 2016-04-11 22:26 飞鸟各投林 阅读(267) 评论(0) 推荐(0) 编辑

虚拟机的设置

摘要: Vmware1: host-only (方式不可以连接外网) Vmware8: NAT (方式可以连接外网) 所以使用Vmware8,关闭Vmware1 密码:root 465213a 密码:chennan 465213a 先以root的(原密码:hadoop)进入后删除原来的hadoop用户 us 阅读全文

posted @ 2016-04-11 22:21 飞鸟各投林 阅读(442) 评论(0) 推荐(0) 编辑

华为大数据项目fusionInsight

摘要: 项目简述:基于开源Hadoop2.0架构的集群网络,进行海量数据的分布式计算。由于Hadoop集群规模不断扩大,而搭建一个同等规模的测试集群需要一笔昂贵的开销。目前有100台左右物料,期望预测计算节点1500+的集群网络性能,目前考虑通过模拟仿真或数学建模的方法来预测大规模集群极限性能,以及对大规模 阅读全文

posted @ 2016-04-11 22:01 飞鸟各投林 阅读(941) 评论(0) 推荐(0) 编辑

2016.4.10-科比退出江湖之个性

摘要: 个性决定命运,或许正是科比的个性有了今天的他。然而处女座的科比拥有绝对特立独行甚至令人不能接受的个性,不管是队友、媒体、对手或者主教练,都有过对科比个性深恶痛绝的时候,科比的偏执,自私,孤独,恐惧交织在一起,才有了黑曼巴。 1.早熟precocious 当时创造NBA各种最年轻纪录的科比,24岁就三 阅读全文

posted @ 2016-04-11 21:51 飞鸟各投林 阅读(161) 评论(0) 推荐(0) 编辑

Dijkstra 算法初探

摘要: 一、Dijkstra 算法的介绍 Dijkstra 算法,又叫迪科斯彻算法(Dijkstra),算法解决的是有向图中单个源点到其他顶点的最短路径问题。举例来说,如果图中的顶点表示城市,而边上的权重表示著城市间开车行经的距离,Dijkstra 算法可以用来找到两个城市之间的最短路径。 三、Dijkst 阅读全文

posted @ 2016-04-11 17:18 飞鸟各投林 阅读(179) 评论(0) 推荐(0) 编辑

海量数据处理之Bloom Filter详解

摘要: 前言 : 即可能误判 不会漏判 一、什么是Bloom Filter Bloom Filter是一种空间效率很高的随机数据结构,它的原理是,当一个元素被加入集合时,通过K个Hash函数将这个元素映射成一个位阵列(Bit array)中的K个点,把它们置为1。检索时,我们只要看看这些点是不是都是1就(大 阅读全文

posted @ 2016-04-11 17:16 飞鸟各投林 阅读(840) 评论(0) 推荐(0) 编辑

红黑树

摘要: 一、红黑树的介绍 先来看下算法导论对R-B Tree的介绍: 红黑树,一种二叉查找树,但在每个结点上增加一个存储位表示结点的颜色,可以是Red或Black。 通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出俩倍,因而是接近平衡的。 红黑树,作为一棵二叉查 阅读全文

posted @ 2016-04-11 17:13 飞鸟各投林 阅读(299) 评论(0) 推荐(0) 编辑

堆排序算法

摘要: 1.堆排序是利用堆的特性对记录序列进行排序的一种排序方法。好的那么堆得特性是什么呢?堆得定义: 堆是满足下列性质的数列{r1, r2, …,rn}: 堆是满足下列性质的数列{r1, r2, …,rn}: 阅读全文

posted @ 2016-04-11 17:12 飞鸟各投林 阅读(267) 评论(0) 推荐(0) 编辑

快速排序算法C语言版

摘要: 快速排序(Quicksort)是对冒泡排序的一种改进。 快速排序由C. A. R. Hoare在1962年提出。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以 阅读全文

posted @ 2016-04-11 17:09 飞鸟各投林 阅读(1186) 评论(0) 推荐(0) 编辑

快速排序算法Java版

摘要: 网上关于快速排序的算法原理和算法实现都比较多,不过java是实现并不多,而且部分实现很难理解,和思路有点不搭调。所以整理了这篇文章。如果有不妥之处还请建议。首先先复习一些基础。 1、算法概念。 快速排序(Quicksort)是对冒泡排序的一种改进。由C. A. R. Hoare在1962年提出。 2 阅读全文

posted @ 2016-04-11 17:05 飞鸟各投林 阅读(151) 评论(0) 推荐(0) 编辑