摘要: 前言 由于需要做一个快速匹配敏感关键词的服务,为了提供一个高效,准确,低能耗的关键词匹配服务,我进行了漫长的探索。这里把过程记录成系列博客,供大家参考。 在一开始,接收到快速敏感词匹配时,我就想到了 KMP 翻译过来叫“看毛片“的算法,因为大学的时候就学过它。听说到它的效率非常高。把原本字符串匹配效 阅读全文
posted @ 2019-08-12 14:46 ylaoda 阅读(1146) 评论(0) 推荐(0) 编辑
摘要: 二叉查找树(BST:Binary Search Tree)是一种特殊的二叉树,它改善了二叉树节点查找的效率。二叉查找树有以下性质: (1)若左子树不空,则左子树上所有节点的值均小于它的根节点的值 (2)若右子树不空,则右子树上所有节点的值均大于它的根节点的值 (3)左、右子树也分别为二叉排序树 (4 阅读全文
posted @ 2019-08-12 14:34 ylaoda 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 网络流 网络流是模仿水流解决生活中类似问题的一种方法策略,来看这么一个问题,有一个自来水厂S,它要向目标T提供水量,从S出发有不确定数量和方向的水管,它可能直接到达T或者经过更多的节点的中转,目前确定的是每条水管中水流的流向是确定的(单向),且每个水管单位时间内都有属于自己的水流量的上限(超过会爆水 阅读全文
posted @ 2019-08-12 14:33 ylaoda 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 一、Kafka简介 1.1 什么是kafka kafka是一个分布式、高吞吐量、高扩展性的消息队列系统。kafka最初是由Linkedin公司开发的,后来在2010年贡献给了Apache基金会,成为了一个开源项目。主要应用在日志收集系统和消息系统,相信大家之前也听说过其他的消息队列中间件,比如Rab 阅读全文
posted @ 2019-08-12 14:32 ylaoda 阅读(2459) 评论(0) 推荐(0) 编辑
摘要: 最近一直在研究textCNN算法,准备写一个系列,每周更新一篇,大致包括以下内容: TextCNN基本原理和优劣势 TextCNN代码详解(附Github链接) TextCNN模型实践迭代经验总结 TextCNN模型部署Tf Serving实践总结 今天主要讲TextCNN的基本原理和优劣势,包括网 阅读全文
posted @ 2019-08-12 14:28 ylaoda 阅读(17027) 评论(1) 推荐(3) 编辑
摘要: 在网上观摩了一些大佬关于线程池的实现后,我决定也亲手写一下简单线程池,首先先解释一下什么是线程池,简单的来说,就是预先创建一些线程,使它们处于睡眠状态,当任务来临时,唤醒线程让它们去执行。使用线程池的好处有很多,比如,1.线程的创建和销毁的开销,无论从时间还是空间上来说是巨大的,而通过线程池的重用大 阅读全文
posted @ 2019-08-12 14:21 ylaoda 阅读(285) 评论(0) 推荐(0) 编辑
摘要: linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、信号(signal)、消息队列、共享内存、信号量、套接字(socket)。 管道 管道是单向、先进先出的无结构的字节流。用于父子进程之间的通信。关键系统调用如下: int pipe( int fd[2] );fd数组用于返回两个f 阅读全文
posted @ 2019-08-12 14:20 ylaoda 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 1. 什么是CNN 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。 我们先来看卷积神经网络各个层级结 阅读全文
posted @ 2019-08-12 14:13 ylaoda 阅读(5919) 评论(2) 推荐(2) 编辑
摘要: 日常开发中,我们经常需要在服务器上进行各种文本,日志的查看操作,本文主要对常用的文本,日志查看技巧进行了一番总结和归纳,方便大家收藏起来后续查看使用: tail命令查看日志信息 实时监控日志: tail f filename 实时监控10行日志信息: tail 10f filename 查看日志尾部 阅读全文
posted @ 2019-08-12 13:46 ylaoda 阅读(178) 评论(0) 推荐(0) 编辑