上一页 1 ··· 240 241 242 243 244 245 246 247 248 ··· 273 下一页
摘要: 来源:http://my.oschina.net/pathenon/blog/65210 1.概述 跟SimHash一样,MinHash也是LSH的一种,可以用来快速估算两个集合的相似度。MinHash由Andrei Broder提出,最初用于在搜索引擎中检测重复网页。它也可以应用于大规模聚类问题。 阅读全文
posted @ 2017-02-21 11:34 bonelee 阅读(2217) 评论(0) 推荐(0)
摘要: 什么是Progressive Web App? Progressive Web App是一个利用现代浏览器的能力来达到类似APP的用户体验的技术,由Google实现,让浏览器打开的网址像APP一样运行在手机上。让Web App和Native App之间的差距更小。 概览特性: 添加到屏幕 从屏幕点击 阅读全文
posted @ 2017-02-21 10:20 bonelee 阅读(1567) 评论(0) 推荐(0)
摘要: 先说和虚拟化技术的区别: 难道虚拟技术就做不到吗? 不不不,虚拟技术也可以做到,但是会有一定程度的性能损失,灵活度也会下降。容器技术不是模仿硬件层次,而是 在Linux内核里使用cgroup和namespaces来打造轻便的、将近裸机速度的虚拟技术操作系统环境。因为不是虚拟化存储,所以容器技术不会管 阅读全文
posted @ 2017-02-21 09:51 bonelee 阅读(2163) 评论(0) 推荐(0)
摘要: 1.LXC是什么? LXC是Linux containers的简称,是一种基于容器的操作系统层级的虚拟化技术。 2.LXC可以做什么? LXC可以在操作系统层次上为进程提供的虚拟的执行环境,一个虚拟的执行环境就是一个容器。可以为容器绑定特定的cpu和memory节点,分配特 定比例的cpu时间、IO 阅读全文
posted @ 2017-02-21 09:41 bonelee 阅读(1151) 评论(0) 推荐(0)
摘要: 摘自:http://aircconline.com/ijdkp/V4N6/4614ijdkp04.pdf In the syntactical approach we define binary attributes that correspond to each fixed length subs 阅读全文
posted @ 2017-02-20 18:03 bonelee 阅读(544) 评论(0) 推荐(0)
摘要: 摘 要 在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detect near-Duplicate WebPages )。试验证明,比起其他网页去重算法(I-Matc 阅读全文
posted @ 2017-02-20 17:22 bonelee 阅读(1516) 评论(0) 推荐(0)
摘要: UDP Communication Contents UDP Communication Sending Receiving Using UDP for e.g. File Transfers Multicasting? Contents See also SoapOverUdp, TcpCommu 阅读全文
posted @ 2017-02-20 16:39 bonelee 阅读(395) 评论(0) 推荐(0)
摘要: 什么是 Glances? Glances 是一个由 Python 编写,使用 psutil 库来从系统抓取信息的基于 curses 开发的跨平台命令行系统监视工具。 通过 Glances,我们可以监视 CPU,平均负载,内存,网络流量,磁盘 I/O,其他处理器 和 文件系统 空间的利用情况。 Gla 阅读全文
posted @ 2017-02-20 15:00 bonelee 阅读(2659) 评论(0) 推荐(0)
摘要: Learn how you can maximize big data in the cloud with Apache Hadoop. Download this eBook now. Brought to you in partnership with Hortonworks. In Febru 阅读全文
posted @ 2017-02-20 11:47 bonelee 阅读(910) 评论(0) 推荐(0)
摘要: shingling算法用于计算两个文档的相似度,例如,用于网页去重。维基百科对w-shingling的定义如下: In natural language processing a w-shingling is a set of unique "shingles"—contiguous subsequ 阅读全文
posted @ 2017-02-17 18:43 bonelee 阅读(5628) 评论(0) 推荐(0)
上一页 1 ··· 240 241 242 243 244 245 246 247 248 ··· 273 下一页