摘要: 今天用hive查询用户日志表.这是日志表的格式: 创建数据库名: 创建表名: (1)查询10个交易记录: (2)对于复杂的列名,可以使用别名: (3)使用嵌套语句: (4)统计有多少条行数据: (5)统计不重复的数据: (6)使用group by 查询不重复的数据: (7)查询某一天多少人购买了产品 阅读全文
posted @ 2018-07-05 20:46 静悟生慧 阅读(713) 评论(0) 推荐(0) 编辑
摘要: 1、row_number() over()排序功能: (1) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where group by order by 的执行。 partition by 用 阅读全文
posted @ 2018-07-05 15:38 静悟生慧 阅读(54456) 评论(0) 推荐(1) 编辑
摘要: Python3 range() 函数用法 Python3 内置函数 Python3 range() 函数返回的是一个可迭代对象(类型是对象),而不是列表类型, 所以打印的时候不会打印列表。 Python3 list() 函数是对象迭代器,可以把range()返回的可迭代对象转为一个列表,返回的变量类 阅读全文
posted @ 2018-07-05 10:42 静悟生慧 阅读(669) 评论(0) 推荐(0) 编辑
摘要: 一、XGBoost的优势 XGBoost算法可以给预测模型带来能力的提升。当我对它的表现有更多了解的时候,当我对它的高准确率背后的原理有更多了解的时候,我发现它具有很多优势: 1 正则化 标准GBDT 的实现没有像XGBoost这样的正则化步骤。正则化对减少过拟合也是有帮助的。 实际上,XGBoos 阅读全文
posted @ 2018-07-05 09:35 静悟生慧 阅读(4168) 评论(0) 推荐(0) 编辑