摘要:
流计算概述什么是流数据:数据有静态数据和流数据。 静态数据: 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是静态数据。技术人员可以利用数据挖掘和OLAP(On-Line Analytical Processing)分析工具从静态数据中找到对企业有价值的信息。 图:静态数据的 阅读全文
摘要:
mysql中ifnull()方法的用法: 一般我们在使用ifnull()方法的时候,都是类似下面的语句: IFNULL(expr1,expr2)如果expr1不是NULL,IFNULL()返回expr1,否则它返回expr2。IFNULL()返回一个数字或字符串值 select ifnull(nam 阅读全文
摘要:
APScheduler是一个Python定时任务框架,使用起来十分方便。提供了基于日期、固定时间间隔以及crontab类型的任务,并且可以持久化任务、并以daemon方式运行应用。 在APScheduler中有四个组件: 触发器(trigger)包含调度逻辑,每一个作业有它自己的触发器,用于决定接下 阅读全文
摘要:
分两点: 一. MySQL NDB Cluster的概述 MySQL NDB Cluster是一个适用于分布式计算环境的高可用性、高冗余版本的MySQL。 NDB集群由一组计算机组成,称为主机,每个计算机运行一个或多个进程。这些进程称为节点,可能包括MySQL服务器(用于访问NDB数据)、数据节点( 阅读全文
摘要:
秒级别的时间转换(精确到秒) 1、UNIX时间戳转换为日期用函数: FROM_UNIXTIME() select FROM_UNIXTIME(1156219870); 输出:2006-08-22 12:11:10 2、日期转换为UNIX时间戳用函数: UNIX_TIMESTAMP() select 阅读全文
摘要:
从MySQL 5.6.3版本开始,EXPLAIN的允许的解释性语句是SELECT,DELETE,INSERT,REPLACE和UPDATE。在MySQL 5.6.3之前,SELECT是唯一可解释的语句。 使用explain关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL 阅读全文
摘要:
方式1 第一步:配置my.ini文件 文件中配置 bulk_insert_buffer_size=120M 或者更大 将insert语句的长度设为最大。 Max_allowed_packet=1M Net_buffer_length=8k 保存 第二步:查看设置的参选有没有生效. Mysql > S 阅读全文
摘要:
1. group by的常规用法 group by的常规用法是配合聚合函数,利用分组信息进行统计,常见的是配合max等聚合函数筛选数据后分析,以及配合having进行筛选后过滤。 聚合函数max select max(user_id),grade from user_info group by gr 阅读全文
摘要:
第一篇 sql调优,主要是考虑降低:consistent gets和physical reads的数量。 count(1)与count(*)比较: 如果你的数据表没有主键,那么count(1)比count(*)快如果有主键的话,那主键(联合主键)作为count的条件也比count(*)要快如果你的表 阅读全文
摘要:
先确定数据要用到哪些表。 将多个表先通过笛卡尔积变成一个表。 然后去除不符合逻辑的数据(根据两个表的关系去掉)。 最后当做是一个虚拟表一样来加上条件即可。 注意:列名最好使用表别名来区别。 笛卡尔积 Demo: 左,右连接,内,外连接 l 内连接: 要点:返回的是所有匹配的记录。 2. select 阅读全文