课堂测试03

3、数据分析处理:
(1)统计每天各个机场的销售数量和销售金额。
要求的输出字段
day_id,sale_nbr,,cnt,round
日期编号,卖出方代码,数量,金额
 (2)统计每天各个代理商的销售数量和销售金额。
要求的输出字段
day_id,sale_nbr,,cnt,round
日期编号,卖出方代码,数量,金额
(3)统计每天各个代理商的销售活跃度。
要求的输出字段
day_id,sale_nbr, sale_number
日期编号,卖出方代码,交易次数(买入或者卖出均算交易次数)
(4)汇总统计 9 月 1 日到 9 月 15 日之间各个代理商的销售利润。
编号,卖出方代码,买入数量,买入金额,卖出数量,卖出金额,销售利润(卖出
金额-买入金额)
 (5)设计分析代理商的市场地位根据市场交易次数、交易对象个数、销售机票数量、
销售利润等。(选做题)

(1) 统计每天各个机场的销售数量和销售金额

首先创建一个存储该数据的表text3_1

Create table text3_1(day_id varchar(30), sale_nbr varchar(30), cnt varchar(30), round varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES

    (

        "separatorChar"=","

    )

STORED AS TEXTFILE;

 

然后将查询的数据存储到该表

insert overwrite table text3_1

SELECT

  day_id,

  sale_nbr,

  SUM(cnt),

  SUM(round)

FROM

  test3

WHERE sale_nbr LIKE 'C%'

GROUP BY day_id,sale_nbr;

 

 

2)统计每天各个代理商的销售数量和销售金额

首先创建一个存储该数据的表text3_2

Create table text3_2(day_id varchar(30), sale_nbr varchar(30), cnt varchar(30), round varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES

    (

        "separatorChar"=","

    )

STORED AS TEXTFILE;

 

然后将查询的数据存储到该表

insert overwrite table text3_2

SELECT

  day_id,

  sale_nbr,

   SUM(cnt),

  SUM(round)

FROM

  test3

WHERE sale_nbr LIKE "O%"

GROUP BY day_id,sale_nbr;

 

 

3)统计每天各个代理商的销售活跃度

首先创建一个存储该数据的表text3_3

Create table text3_3(day_id varchar(30), sale_nbr varchar(30), sale_number varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES

    (

        "separatorChar"=","

    )

STORED AS TEXTFILE;

 

然后将查询的数据存储到该表

insert overwrite table text3_3

SELECT

  day_id,

  sale_nbr,

  COUNT(sale_nbr)

FROM

  test3

WHERE sale_nbr LIKE "O%"

GROUP BY day_id,sale_nbr;

 

 

 

 

 

posted @ 2021-12-03 19:36  墨夕相拥★  阅读(140)  评论(0编辑  收藏  举报