摘要:
在机器学习中,数据并非通常意义上的数量值,而是对于对象某些性质的描述。被描述的性质叫做属性,属性的取值称为属性值,不同的属性值有序排列得到的向量就是数据,也叫实例。 根据输入输出类型的不同,预测问题可分为一下三类。 分类问题:输出变量为有限个离散变量,当个数为2时即为最简单的二分类问题; 回归问题: 阅读全文
摘要:
一、查询 SELECT ... FROM ... WHERE ... GROUP BY ... HAVING ... ORDER BY ... SQL示例: SELECT COUNT(*) as num, role_main, role_assist FROM heros GROUP BY role 阅读全文
摘要:
RPC是帮助我们屏蔽网络编程细节,实现调用远程方法就跟调用本地方法一样的体验。 RPC是一个远程调用,需要通过网络来传输数据,并且RPC常用于业务系统之间的数据交互,需要保证其可靠性,所以一般默认采用TCP来传输。 网络传输数据必须是二进制的,但是调用方请求的出入参数都是对象,对象没法直接进行网络传 阅读全文
摘要:
1、Tomcat的两个核心功能: 处理Socket连接,负责网络字节流与Request和Response对象的转化。 加载和管理Servlet,以及处理具体Request请求。 Tomct设计了两个核心组件连接器(Connector)和容器(Container)来分别做这两件事情。连接器负责对外交流 阅读全文
摘要:
一、基础和应用 HyperLogLog数据结构,可以用来估数,可以解决很多精度不高的统计问题。 布隆过滤器:专门用来解决去重问题,空间上还能节省90%以上,只是稍微有点不精确,存在一定的误判概率。 可以把布隆过滤器理解为一个不怎么精确的set结构,当你使用它的contains法判断某个对象是否存在时 阅读全文
摘要:
一、综述 需要在生产者和消费者之间建立有效的通信链路并确定双方的通信协议。 消费者通常采取主动拉取和被动消费这两种模式实现消息消费。同时出于稳定性的考虑,消费者还要提供限流的能力。 消息发送方逻辑则相对简单,消息发送出去后,依赖路由规则,最终投递给符合条件的一个或多个消费者。 rabbitmq是基于 阅读全文
摘要:
一、初识kafka kafka的数据单元被称为消息,为了提高效率,消息会被分批次写入kafka,批次就是一组消息,这些消息属于同一个主题和分区。批次数据会被压缩,这样可以提升数据的传输和存储能力,但要做更多的计算处理。 kafka的消息通过主题进行分类,主题可以被分为若干个分区,消息以追加的方式写入 阅读全文
摘要:
一、简单动态字符串 SDS定义 struct sdsstr{ //已保存的字符串长度 int len; //数组还剩余的空间 int free; //保存字符串的字节数组 char buf[]; } 获取字符串长度O(1)、杜绝缓冲区溢出、内存重新分配次数、存储二进制 二、链表 redis重构了自己 阅读全文