07 2017 档案
摘要:shell脚本实现将文件中的几行输出合并成一行显示 现在有一个文件aa.txt ,其实现格式如下,而我想实现的结果是192.168.1.17 down [root@localhost shell]# cat aa.txt192.168.1.17down192.168.1.103open192.168
阅读全文
摘要:1. 采用awk awk BEGIN{RS=EOF}'{gsub(/\n/," ");print}' file 说明:awk默认将记录分隔符(record separator即RS)设置为\n,此行代码将RS设置为EOF(文件结束),也就是把文件视为一个记录,然后通过gsub函数将\n替换成空格,最
阅读全文
摘要:此算法中的DCT变换是从 http://blog.csdn.net/luoweifu/article/details/8214959抄过来的,因为这种需要大量的复杂的数学运算,我看不来,完全不懂...都已经还给老师了...
阅读全文
摘要:from http://blog.csdn.net/luoweifu/article/details/8214959 图像处理中常用的正交变换除了傅里叶变换外,还有其他一些有用的正交变换,其中离散余弦就是一种。离散余弦变换表示为DCT( Discrete Cosine Transformation)
阅读全文
摘要:In previous article we have installed MySQL Version 5.6. In this article I will show you the installation of MySQL Server 5.7 on Ubuntu 14.04. MySQL i
阅读全文
摘要:MySQL is very popular database system for a small to medium size web project. It is developed, distributed, and supported by Oracle Corporation. We ca
阅读全文
摘要:from https://zhuanlan.zhihu.com/p/27103956 1. SimHash与传统hash函数的区别 2. SimHash算法思想 3. SimHash流程实现 4. SimHash签名距离计算 5. SimHash存储和索引 6. SimHash存储和索引7. 参考内
阅读全文
摘要:通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集
阅读全文
摘要:http://www.lanceyan.com/tech/arch/simhash_hamming_distance_similarity2-html.html 在前一篇文章 《海量数据相似度计算之simhash和海明距离》 介绍了simhash的原理,大家应该感觉到了算法的魅力。但是随着业务的增长
阅读全文
摘要:灰度化,在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值。 因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。 一般有以下四种方法对彩色图像进行灰度化处理: 灰度化方法简介 灰度化方法简介 1.分量法 将彩色图像中的三分量的
阅读全文