2020年12月25日

机器学习之排序学习

摘要: Learn to Rank 排序学习主要用于搜索引擎,推荐系统等领域。 对于传统的排序算法,一般只能根据少量特征,然后通过人为设定的规则,来进行文档的全量排序。 然而对于排序涉及大量的特征,而且这些特征难以人为的编辑规则来进行文档和文档之间的比较,这就出现了排序学习。 排序学习通过以特征和文档为输入 阅读全文

posted @ 2020-12-25 16:14 谭英智 阅读(623) 评论(0) 推荐(0) 编辑

2020年12月20日

高级操作系统

摘要: 随着硬件的发展,过去的OS并不能很好的适应新硬件的速度,必须修改内核,以充分发挥硬件的性能。 硬件的改变 OS的实现依赖于 下层的硬件 上层的软件 设计目标 OS 基础: 干净的虚拟环境 独立硬件 资源共享和管理 持久化存储 安全 实时性 并行性 用户接口 挑战: 高性能 容易维护 高效利用多核 内 阅读全文

posted @ 2020-12-20 15:48 谭英智 阅读(257) 评论(1) 推荐(0) 编辑

2020年12月7日

NLP自然语言处理

摘要: NLP 应用例子 垃圾邮件过滤 Spam Filtering 机器翻译 Machine Translation 信息检索 Information Retrieval 问答系统 Question Answering 信息提取 Information Extraction 内容摘要 Summarizat 阅读全文

posted @ 2020-12-07 11:31 谭英智 阅读(615) 评论(0) 推荐(0) 编辑

2020年11月11日

如何构建高性能服务器(以Nginx为例)

摘要: 方法论 软件层面 增大CPU利用率 使用全部CPU, worker进程数等于CPU 进程间不做无用的切换 繁忙时不主动让出CPU worker进程之间不争抢CPU CPU切换需要5us,如果大量进程需要切换,则CPU会浪费大量的时间切换,做无用功 worker进程绑定CPU pidstat -w可以 阅读全文

posted @ 2020-11-11 09:54 谭英智 阅读(710) 评论(0) 推荐(3) 编辑

2020年11月10日

TCP性能分析与调优策略

摘要: 网络传输 传播延迟: 消息从发送端到接收端需要的时间,是信号传播距离和速度的函数 传输延迟: 把消息中的所有比特转移到链路中需要的时间,是消息长度和链路速率的函数 处理延迟: 处理分组首部、检查位错误及确定分组目标所需的时间 排队延迟: 到来的分组排队等待处理的时间 CDN把距离缩短,以加快访问速度 阅读全文

posted @ 2020-11-10 11:00 谭英智 阅读(1181) 评论(0) 推荐(1) 编辑

2020年11月9日

Elasticsearch原理解析与性能调优

摘要: 基本概念 定义 一个分布式的实时文档存储,每个字段 可以被索引与搜索 一个分布式实时分析搜索引擎 能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据 用途 全文检索 结构化搜索 分析 VS传统数据库 传统数据库 提供精确匹配 ES 提供精确匹配 全文检索 处理同义词 给文档相关性 阅读全文

posted @ 2020-11-09 10:07 谭英智 阅读(723) 评论(0) 推荐(1) 编辑

2020年11月3日

知识图谱的感性认识

摘要: 定义 知识图谱可以分割为知识和图谱。知识包含实体和实体之间的联系, 图谱就是用图的方式把实体和它们之间的关系用图表示出来。 例如微信,我和我的朋友以好友的关系而关联起来,而我的朋友又有他们的朋友圈,进而把整个关系群以一个网络的方式关联起来。 用途 智能问答 如果拥有了一个知识图谱,就可以构建一个智能 阅读全文

posted @ 2020-11-03 10:13 谭英智 阅读(455) 评论(0) 推荐(0) 编辑

2020年10月22日

初识Kafka

摘要: Kafka是由scala和java编写的一款高吞吐量分布式发布订阅消息系统。 应用场景: 异步处理 应用解耦 流量削峰 日志处理 消息通讯 相关术语: Broker:在集群中的服务器,用于存储消息,提供接口给生产者和消费者 Topic:消息的一个自定义类别,每个消息都有一个topic,topic下有 阅读全文

posted @ 2020-10-22 15:38 谭英智 阅读(441) 评论(0) 推荐(0) 编辑

2020年10月21日

数据库原理

摘要: 记录物理存储 定长记录 变长记录 多记录存储 物理邻接存储 指针连接存储 大字段存储(BLOBS) 文件组织方式 堆文件 顺序文件 搜索快 插入删除慢 散列文件 插入删除快 存取快 不需要为存储索引 记录随机 不能排序 有可能导致桶倾斜 聚簇文件 把多个表物理存储在一起 提高多表关联查询 降低单表查 阅读全文

posted @ 2020-10-21 14:52 谭英智 阅读(493) 评论(0) 推荐(2) 编辑

2020年7月27日

笑谈AlphaGo对战人类从模仿到超越之奥义

摘要: 起源 故事从一个围棋说起,人类赖以自豪的智慧,为什么这么说,因为据统计,从这19乘19的方格中摆棋,可以有10的340次方的可能,用一个更形象的比拟,全宇宙的原子加起来,也比这个数要小。 也就是说,如果计算机靠暴力破解,是无法得到解的,而人凭着棋感可以走出非常高明的棋局,这就是为什么人那么高傲。 可 阅读全文

posted @ 2020-07-27 17:01 谭英智 阅读(412) 评论(0) 推荐(0) 编辑

导航