牛客网Shell编程练习
摘要:最近因为工作原因开始接触Linux,需要做一些简单的Shell开发。 在牛客网练习了一下,来记录自己的学习过程。 第1题:统计文件的行数 题目: 写一个 bash脚本以输出一个文本文件 nowcoder.txt中的行数 示例: 假设 nowcoder.txt 内容如下: 复制代码 1 2 3 4 5
阅读全文
posted @
2020-11-27 21:50
桌子哥
阅读(584)
推荐(0) 编辑
一种Hive性能调优方法(补充)
摘要:之前学习整理过一些Hive调优的方法,最近在学习参考书的时候看到作者提供了一个Hive调优的解决方案,在这里分享下。 案例所使用的数据来源于美国航班数据、机场数据和天气数据。用来查询要查找航班延误(时间超过15分钟)次数最多的5个机场,其出发机场的风速都超过1米/秒。 第一个调优方向:执行引擎 Hi
阅读全文
posted @
2020-11-24 21:47
桌子哥
阅读(771)
推荐(0) 编辑
Leetcode之MySQL练习题
摘要:写在前面: 最近的工作涉及到SQL比较多,前一段时间做了牛客的SQL练习题,从今天开始来做一下LeetCode上的SQL练习题。为自己之后的理想职业数据分析师来做一些基础的提高。 题目1:难度:简单 表1: Person+ + +| 列名 | 类型 |+ + +| PersonId | int ||
阅读全文
posted @
2020-11-14 22:42
桌子哥
阅读(493)
推荐(1) 编辑
Hive的10种优化总结
摘要:Hive作为大数据领域常用的数据仓库组件,在平时设计和查询时要特别注意效率。影响Hive效率的几乎从不是数据量过大,而是数据倾斜、数据冗余、job或I/O过多、MapReduce分配不合理等等。对Hive的调优既包含对HiveSQL语句本身的优化,也包含Hive配置项和MR方面的调整。 列裁剪和分区
阅读全文
posted @
2020-11-04 23:15
桌子哥
阅读(5461)
推荐(0) 编辑
SQL练习题(1-76)学习笔记(来源于牛客网)
摘要:因为最近的工作需要写一些SQL,但是之前只学过,没有实地的编过SQL。 在工作中是需要用Hive来写,本地没有环境,所以在牛客网上来进行练习。 本次内容全部来源于牛客网,使用的是SQLite。 第1题: 题目: 查找最晚入职员工的所有信息,为了减轻入门难度,目前所有的数据里员工入职的日期都不是同一天
阅读全文
posted @
2020-11-01 22:23
桌子哥
阅读(376)
推荐(0) 编辑
SQL练习题47:将employees表中的所有员工的last_name和first_name通过(')连接起来
摘要:题目: 将employees表中的所有员工的last_name和first_name通过(')连接起来。(不支持concat,请用||实现) CREATE TABLE `employees` ( `emp_no` int(11) NOT NULL, `birth_date` date NOT NUL
阅读全文
posted @
2020-11-01 17:29
桌子哥
阅读(347)
推荐(0) 编辑
SQL练习题46:牛客每次考试完,都会有一个成绩表(grade),请你写一个sql语句查询各个岗位分数升序排列之后的中位数位置的范围,并且按job升序排序
摘要:题目: 牛客每次考试完,都会有一个成绩表(grade),如下: 第1行表示用户id为1的用户选择了C++岗位并且考了11001分 。。。 第8行表示用户id为8的用户选择了前端岗位并且考了9999分 请你写一个sql语句查询各个岗位分数升序排列之后的中位数位置的范围,并且按job升序排序,结果如下:
阅读全文
posted @
2020-11-01 17:20
桌子哥
阅读(943)
推荐(0) 编辑
SQL练习题45:
摘要:题目: 牛客每次举办企业笔试的时候,企业一般都会有不同的语言岗位,比如C++工程师,JAVA工程师,Python工程师,每个用户笔试完有不同的分数,现在有一个分数(grade)表简化如下: 第1行表示用户id为1的选择了language_id为1岗位的最后考试完的分数为12000, .... 第7行
阅读全文
posted @
2020-11-01 13:47
桌子哥
阅读(191)
推荐(0) 编辑
SQL练习题44:牛客每天有很多人登录,请你统计一下牛客每个日期新用户的次日留存率。
摘要:题目: 牛客每天有很多人登录,请你统计一下牛客每个日期新用户的次日留存率。 有一个登录(login)记录表,简况如下: 第1行表示id为2的用户在2020-10-12使用了客户端id为1的设备登录了牛客网,因为是第1次登录,所以是新用户 。。。 第4行表示id为2的用户在2020-10-13使用了客
阅读全文
posted @
2020-11-01 13:09
桌子哥
阅读(1337)
推荐(0) 编辑
SQL练习题43:牛客每天有很多人登录,请你统计一下牛客每个用户查询刷题信息,包括: 用户的名字,以及截止到某天,累计总共通过了多少题。 不存在没有登录却刷题的情况,但是存在登录了没刷题的情况,不会存在刷题表里面,有提交代码没有通过的情况,但是会记录在刷题表里,只不过通过数目是0。
摘要:题目: 牛客每天有很多人登录,请你统计一下牛客每个用户查询刷题信息,包括: 用户的名字,以及截止到某天,累计总共通过了多少题。 不存在没有登录却刷题的情况,但是存在登录了没刷题的情况,不会存在刷题表里面,有提交代码没有通过的情况,但是会记录在刷题表里,只不过通过数目是0。 有一个登录(login)记
阅读全文
posted @
2020-11-01 12:52
桌子哥
阅读(448)
推荐(0) 编辑
SQL练习题42:牛客每天有很多人登录,请你统计一下牛客每个日期登录新用户个数
摘要:题目: 牛客每天有很多人登录,请你统计一下牛客每个日期登录新用户个数, 有一个登录(login)记录表,简况如下: 第1行表示id为2的用户在2020-10-12使用了客户端id为1的设备登录了牛客网,因为是第1次登录,所以是新用户 。。。 第4行表示id为2的用户在2020-10-13使用了客户端
阅读全文
posted @
2020-11-01 11:43
桌子哥
阅读(918)
推荐(0) 编辑
SQL练习题41:牛客每天有很多人登录,请你统计一下牛客新登录用户的次日成功的留存率
摘要:题目:(具体题目细节去看牛客,不能插入图片) 牛客每天有很多人登录,请你统计一下牛客新登录用户的次日成功的留存率, 有一个登录(login)记录表,简况如下: 第1行表示id为2的用户在2020-10-12使用了客户端id为1的设备第一次新登录了牛客网 。。。 第4行表示id为3的用户在2020-1
阅读全文
posted @
2020-11-01 10:46
桌子哥
阅读(804)
推荐(0) 编辑
SQL练习题40:现在有一个需求,让你统计正常用户发送给正常用户邮件失败的概率
摘要:题目:(浏览器不支持插图???详情去牛客网上看看) 现在有一个需求,让你统计正常用户发送给正常用户邮件失败的概率: 有一个邮件(email)表,id为主键, type是枚举类型,枚举成员为(completed,no_completed),completed代表邮件发送是成功的,no_complete
阅读全文
posted @
2020-11-01 09:56
桌子哥
阅读(222)
推荐(0) 编辑