技术宅,fat-man

增加语言的了解程度可以避免写出愚蠢的代码

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

痛并快乐的造轮子之旅:awk访问数据库之旅

俺是一枚悲催的数据统计程序员,从先辈的手里接收了这样的代码:

#! /bin/sh

alias statdb="mysql -h 192.168.1.1 -u stat -paaa statdb"
sql="select * from abc"
echo $sql | statdb -s > abc
cat abc | awk '{...}' #此处省略400行

俺对于这样的代码标示极度不认同,追求模块化才是俺的理想,于是我把代码写成了这样

#! /bin/sh

alias statdb="mysql -h 192.168.1.1 -u stat -paaa"
sql="select * from abc"
echo $sql | statdb -s > abc
echo "" | igawk -f stat.awk -v DATA_FILE="abc"

我的stat.awk的代码长成这样

@include lib/assert.awk
@include lib/makesql.awk

BEGIN{...}
{...}
END{...} #可以复用的代码在lib下

但是这样的写法也非常的啰嗦,从获得数据,再把数据导入到awk脚本里环节很多,我在想能不能直接用awk读入数据呢?先写一个从数据库读入数据的shell脚本,然后用awk调用它(system命令)

复制代码
#! /bin/sh

cd `dirname $0`

alias statdb="/usr/local/mysql/bin/mysql -h 192.168.1.1 -u stat -paaa -A statdb"

getDomain()
{
        item=$1
        ver=$2

        if [ -z $item ]; then
                echo item is empty string!
                exit
        fi

        sql=""
        if [ -z $ver ]; then
                sql="select domain from domain_name_list where item ='"$item"';";
        else
                sql="select domain from domain_name_list where item ='"$item"' and ver='"$ver"';";
        fi


        #echo $sql
        echo $sql | statdb -s | cat
}


getDomain $*
复制代码

awk脚本就可以这样调用:

复制代码
function loadDomains(item, ver, result, __ARGVEND__)
{
        command = "/work/stat/read/domain/getdomain.sh "item" "ver
        while(command | getline domain)
        {
                result[domain]
        }
        close(command)
}


BEGIN{
        loadDomains("shuqi","wap",SHUQIWAP)
        for(i in SHUQIWAP)
        {
                print i
        }

        print "-------------"

        loadDomains("shuqi","touch",SHUQITOUCH)
        for(i in SHUQITOUCH)
        {
                print i
        }
}
复制代码

试验了一下,完全是可以的,这样,我就扔掉了中间文件,再也不用让shell先读,读完导入到awk脚本里,但是,既然都可以从shell脚本里读取数据记录了,为啥不能直接连接MYSQL,查询记录集直接生成数组呢?再接再厉,加油!下面是最终版本

复制代码
function query(sql, db, result, __ARGVEND__)
{
        command = "echo \"" sql "\" | " db " -s | cat"

        while(command | getline record)
        {
                result[record]
        }
        close(command)
}

function loadDomains(item, ver, result, __ARGVEND__)
{
        db  = "/usr/local/mysql/bin/mysql -h 192.168.1.1 -u stat -paaa statdb";
        sql = "select * from domain_name_list where item ='%s' and ver = '%s' ;"
        sql = sprintf(sql,item,ver)

        query(sql, db, result)
}

BEGIN{

        # sql = "select domain from domain_name_list where item ='shuqi' and ver = 'wap' ;"
        # db  = "/usr/local/mysql/bin/mysql -h 59.151.37.16 -u ppstat -pstatpp -A statdb";
        # query(sql,db,result)

        loadDomains("shuqi","wap",result)
        loadDomains("sousuo","wap",result1)

        for(i in result1)
        {
                print i
        }
}
复制代码

下面是调用执行结果:

复制代码
wappp@ppcn-12-208:/work/stat/read/booklist> echo "" | igawk -f test.awk                 
89      bookw.yisou.com?        zwjf    sousuo  wap     2013-08-06 16:26:00
92      bookw3.yisou.com        zwjf    sousuo  wap     2013-08-06 16:26:00
21      a1.pp.cn        zwjf    sousuo  wap     2013-06-14 14:53:10
22      a2.pp.cn        zwjf    sousuo  wap     2013-06-14 14:53:10
101     a5.pp.cn        zwjf    sousuo  wap     2013-08-06 16:26:00
90      bookw1.yisou.com        zwjf    sousuo  wap     2013-08-06 16:26:00
93      bookw4.yisou.com        zwjf    sousuo  wap     2013-08-06 16:26:00
23      a3.pp.cn        zwjf    sousuo  wap     2013-06-14 14:53:10
19      so.pp.cn        zwjf    sousuo  wap     2013-06-14 14:53:10
35      a5.pp.cn        zwjf    sousuo  wap     2013-07-09 17:34:16
91      bookw2.yisou.com        zwjf    sousuo  wap     2013-08-06 16:26:00
20      a0.pp.cn        zwjf    sousuo  wap     2013-06-14 14:53:10
94      bookw5.yisou.com        zwjf    sousuo  wap     2013-08-06 16:26:00
wappp@ppcn-12-208:/work/stat/read/booklist> 
复制代码

 

 

posted on   codestyle  阅读(639)  评论(0编辑  收藏  举报

编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· [AI/GPT/综述] AI Agent的设计模式综述
历史上的今天:
2012-08-07 Selenium测试用例复用与测试框架
2012-08-07 Google前工程经理王忻:如何准备软件工程师的面试
点击右上角即可分享
微信分享提示