08 2019 档案
摘要:转自:https://www.cnblogs.com/AK2012/archive/2013/01/04/2844283.html 如何让你的SQL运行得更快 数据库性能优化三:程序操作优化 SQL索引在数据库优化中占有一个非常大的比例, 一个好的索引的设计,可以让你的效率提高几十甚至几百倍,在这里
阅读全文
摘要:一、数据库命令规范 · 所有数据库对象名称必须使用小写字母并用下划线分割 · 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) · 数据库对象的命名要能做到见名识意,并且最后不要超过32个字符 · 临时库表必须以tmp_为前缀并以日期为后缀,备份表
阅读全文
摘要:Hive是一个数据仓库基础的应用工具,在Hadoop中用来处理结构化数据,通过类SQL语言对数据进行操作。Hive将sql语句通过解析器转换成MapReduce作业提交到Hadoop集群上,Hadoop监控作业执行过程,并将执行结果返回给用户。 值得注意的是,Hive并不支持行级数据的更新,主要使用
阅读全文
摘要:行内与独行 上标、下标与组合 汉字、字体与格式 占位符 定界符与组合 四则运算 高级运算 逻辑运算 集合运算 数学符号 来自链接1:https://www.jianshu.com/p/e74eb43960a1 链接2:https://blog.csdn.net/zhangziju/article/d
阅读全文
摘要:排序 缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象s:任意的Pandas Series对象 同时我们需要做如下的引入: import pandas as pdimport numpy as np 导入数据 pd.read_csv(filenam
阅读全文
摘要:1、apply、applymap、map 对数据进行处理的时候,使用循环往往会大大降低代码的执行效率,但是通过pandas中封装好的函数,则可以极大提升执行效率; DataFrame.apply(self, func, axis=0, broadcast=None, raw=False, reduc
阅读全文