toxic

备忘录

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

我现在做数据统计,后台数据库用的是MYSQL。有一个常用的需求,查询未订购用户的访问PV(用户唯一性标识是用户手机号);

第一种写法:

SELECT COUNT(1) FROM day_resinlog_2012_06_12 WHERE mobile_number NOT IN 
(SELECT DISTINCT mobile_number FROM tbl_cartoon_order);

第二种写法:

  2.1  通过 SELECT DISTINCT mobile_number FROM tbl_cartoon_order 获得一个List<String> 结合,将获得的手机号的集合拼接成一个字符串当SELECT COUNT(1) FROM day_resinlog_2012_06_12 WHERE mobile_number NOT IN (xxxxx)中的xxxxx;

 

评论:第一种写法使用了子查询,这样速度比较慢,一般是我们不用它的原因,也是我们选择第二种写法的原因;

            第二种写法表面上没有什么问题,其实也有一个潜在的风险,假如我们的订购手机号有几百万,就可能会引起服务器报错。因为一条SQL如果很长,超过了MYSQL服务器配置文件(windows下的my.ini)中的max_allowed_packet的量,就会报错。解决办法是改变max_allowed_packet的量。

posted on 2014-01-27 10:52  toxic  阅读(2245)  评论(0编辑  收藏  举报