2019雏鹰训练营第三次作业

热身
1.安装VMware
2.下载Ubuntu(我下的是18.04的版本)
3.在虚拟机中安装VMware
4.编写运行程序helloworld

编译运行后回事这样,不知道是哪里出了问题

散列:
就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

sketch:
一种基于散列的数据结构,可以在高速网络环境中,实时地存储流量特征信息。

Count-min sketch算法过程:
创建一个长度为 x 的数组,用来计数,初始化每个元素的计数值为 0;
对于一个新来的元素,哈希到 0 到 x 之间的一个数,比如哈希值为 i,作为数组的位置索引;
这是,数组对应的位置索引 i 的计数值加 1;
那么,这时要查询某个元素出现的频率,只要简单的返回这个元素哈希后对应的数组的位置索引的计数值即可。
算法特点:估算只会偏大,不会偏小。

实现新技术:
这一块没有成功。
试着弄过Samba,但是过程中的某一步出了差错,导致后面的步骤无法进行,我觉得我可能需要重新弄一个虚拟机。

posted @ 2019-11-27 20:25  独影阑珊c  阅读(159)  评论(0编辑  收藏  举报