临时表 数据在 内存 转移时间 将160秒的创建临时表时间放入定时任务 不到1秒的求和时间 hadoop 引入Hadoop 分布式计算

 

 

SELECT SUM(pv) as pv_t  FROM

 

 

行 112247817
表类型 InnoDB
自动递增值 1082428327
行格式  Compact
索引长度 8.60 GB (9,235,939,328)
数据长度 13.57 GB (14,573,125,632)
数据可用空间 4.00 MB (4,194,304)
排序规则 utf8_general_ci

 

 

Mysql模糊查询like效率,以及更高效的写法

 

http://www.cnblogs.com/chaobest/p/6737901.html

Mysql模糊查询like效率,以及更高效的写法

 

在使用msyql进行模糊查询的时候,很自然的会用到like语句,通常情况下,在数据量小的时候,不容易看出查询的效率,但在数据量达到百万级,千万级的时候,查询的效率就很容易显现出来。这个时候查询的效率就显得很重要!

 

一般情况下like模糊查询的写法为(field已建立索引):

SELECT `column` FROM `table` WHERE `field` like '%keyword%';

上面的语句用explain解释来看,SQL语句并未用到索引,而且是全表搜索,如果在数据量超大的时候,可想而知最后的效率会是这样

对比下面的写法:

SELECT `column` FROM `table` WHERE `field` like 'keyword%';

这样的写法用explain解释看到,SQL语句使用了索引,搜索的效率大大的提高了!

 

但是有的时候,我们在做模糊查询的时候,并非要想查询的关键词都在开头,所以如果不是特别的要求,"keywork%"并不合适所有的模糊查询

 

这个时候,我们可以考虑用其他的方法

1.LOCATE('substr',str,pos)方法

复制代码
SELECT LOCATE('xbar',`foobar`); 
###返回0 

SELECT LOCATE('bar',`foobarbar`); 
###返回4

SELECT LOCATE('bar',`foobarbar`,5);
###返回7
复制代码

备注:返回 substr 在 str 中第一次出现的位置,如果 substr 在 str 中不存在,返回值为 0 。如果pos存在,返回 substr 在 str 第pos个位置后第一次出现的位置,如果 substr 在 str 中不存在,返回值为0。

SELECT `column` FROM `table` WHERE LOCATE('keyword', `field`)>0

备注:keyword是要搜索的内容,field为被匹配的字段,查询出所有存在keyword的数据

 

2.POSITION('substr' IN `field`)方法

position可以看做是locate的别名,功能跟locate一样

SELECT `column` FROM `table` WHERE POSITION('keyword' IN `filed`)

3.INSTR(`str`,'substr')方法

SELECT `column` FROM `table` WHERE INSTR(`field`, 'keyword' )>0 

 

除了上述的方法外,还有一个函数FIND_IN_SET

FIND_IN_SET(str1,str2):

返回str2中str1所在的位置索引,其中str2必须以","分割开。

SELECT * FROM `person` WHERE FIND_IN_SET('apply',`name`);

 

 

 

 

SELECT SUM(pv) AS pv_t FROM test_pv WHERE INSTR(address,"iask.sina.com.cn");

[SQL]SELECT SUM(pv) AS pv_t FROM test_pv WHERE address LIKE "http://iask.sina.com.cn%";
35307636
受影响的行: 0
时间: 142.349s
时间: 168.823s

[SQL]SELECT SUM(pv) AS pv_t FROM test_pv WHERE address LIKE "%iask.sina.com.cn%";
受影响的行: 0
时间: 224.956s
35322338

EXPLAIN SELECT SUM(pv) AS pv_t FROM test_pv WHERE address LIKE "%iask.sina.com.cn%";
EXPLAIN SELECT SUM(pv) AS pv_t FROM test_pv WHERE address LIKE "http://iask.sina.com.cn%";

[SQL]SELECT SUM(pv) AS pv_t FROM test_pv WHERE address LIKE "%iask.sina.com.cn%";
受影响的行: 0
时间: 235.287s
[SQL]SELECT SUM(pv) AS pv_t FROM test_pv WHERE INSTR(address,"iask.sina.com.cn");
受影响的行: 0
时间: 231.816s
[SQL]SELECT SUM(pv) AS pv_t FROM test_pv WHERE INSTR(address,"http://iask.sina.com.cn");
受影响的行: 0
时间: 220.260s

 

 

 

 

 

posted @ 2017-12-26 12:27  papering  阅读(236)  评论(0编辑  收藏  举报