03 2023 档案

摘要:参考链接:值得收藏!2023 年,你应该知道的所有机器学习算法~ 阅读全文
posted @ 2023-03-27 13:35 Hider1214 阅读(83) 评论(0) 推荐(0) 编辑
摘要:数据从业者的使命是用数据驱动业务,但数据本身无法直接驱动业务,因此必然要经历从数据到信息、从信息到知识,再从知识到智慧的过程。 数据从业者的成长要起于数据,终于业务,让数据产生真正的智慧。 参考链接:数据从业者成长的五个阶段 阅读全文
posted @ 2023-03-25 18:19 Hider1214 阅读(92) 评论(1) 推荐(0) 编辑
摘要:Pandas.Series 对象和 DataFrame 的列数据提供了 cat、dt、str 三种属性接口(accessors),分别对应分类数据、日期时间数据和字符串数据。 通过这几个接口可以快速实现特定的功能,十分便捷。 今天先针对 dt 接口对时间模块进行学习。 一、构建测试数据集 # 创建测 阅读全文
posted @ 2023-03-22 17:09 Hider1214 阅读(2230) 评论(0) 推荐(0) 编辑
摘要:日常从临时表复制数据到正式表可通过: create table table_name_new as select * from table_name; 但这样子原表的信息,分区等无法直接复制,需要通过额外的方式进行构建表、插入数据。 具体参考如下。 一、全量复制 drop table table_n 阅读全文
posted @ 2023-03-20 16:24 Hider1214 阅读(239) 评论(0) 推荐(0) 编辑
摘要:一、查看分区 查看分区 show partitions table_name; /* update_date=20230305 update_date=20230312 update_date=20230319 */ 查看分区表描述 desc table_name partition(update_ 阅读全文
posted @ 2023-03-20 14:51 Hider1214 阅读(3322) 评论(2) 推荐(0) 编辑
摘要:MySQL 中有 group_concat 进行分组拼接字符串的功能,但 hive 中没有这个函数,需要进行折中处理。 具体可参考以前文章:Hive学习笔记:列转行之collect_list/collect_set/concat_ws 功能更新 对于拼接的字段进行排序,例如: 有多个渠道来源的情况下 阅读全文
posted @ 2023-03-08 16:07 Hider1214 阅读(1737) 评论(0) 推荐(0) 编辑
摘要:一、介绍 zfill 函数用于在字符串的开头添加零,直到达到指定的长度。 如果 len 参数的值小于字符串的长度,则不执行填充。 具体使用语法为: str.zfill(len) 如果是整型、浮点型等数字类型,需要先通过 str() 函数转化为字符串类型,才可进一步操作。 二、实操 # 实例 numb 阅读全文
posted @ 2023-03-08 14:22 Hider1214 阅读(359) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示