摘要:
Hadoop和Hive的关系 1.Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop最核心的设计就是hdfs和mapreduce,hdfs提供存储,mapreduce用于计算。2.Hive是Hadoop的延申。hive是一个提供了查询功能的数据仓库核心组件,Hadoop底层的hd 阅读全文
摘要:
oracle导出数据到文本、从文本导入数据 经常有需求向表中导入大量的数据,使用insert不靠谱,太慢oracle提供了sqlldr的工具 也有时需要讲数据导入到文本,oracle的spool可以轻松实现 方便的实现oracle导出数据到txt、txt导入数据到oracle 一、导出数据到txt 阅读全文
摘要:
分区 就是把一张表的数据分成N个区块,在逻辑上看最终只是一张表,但底层是由N个物理区块组成的 分表 就是把一张表按一定的规则分解成N个具有独立存储空间的实体表。系统读写时需要根据定义好的规则得到对应的字表明,然后操作它。 分库 一旦分表,一个库中的表会越来越多 将整个数据库比作图书馆,一张表就是一本 阅读全文
摘要:
第一种:oracle的方法 merge into emp_bak a using emp b on (a.ename like CONCAT('%',concat(b.ename,'%'))) 模糊匹配,如果是等值,把like换成= ,CONCAT('%',concat(b.ename,'%'))) 阅读全文
摘要:
文件处理 在 Python 中使用文件的关键函数是 open() 函数。 open() 函数有两个参数:文件名和模式。 有四种打开文件的不同方法(模式): "r" - 读取 - 默认值。打开文件进行读取,如果文件不存在则报错。 "a" - 追加 - 打开供追加的文件,如果不存在则创建该文件。 "w" 阅读全文
摘要:
一、什么是url URL(Uniform Resource Locator,统一资源定位符)地址,俗称网页地址,简称网址,是Internet上用来描述信息资源 地址(Address)的字符串,如同在网络上的门牌。URL地址主要用在各种WWW客户程序和服务器程序上 它最初是由蒂姆·伯纳斯-李发明用来作 阅读全文
摘要:
一、查询使用 1. 加锁的目的:实现对 '共享资源' 的 '并发控制' 例如,'同时' 更新 '同一条记录' 若不加锁,则更新无先后顺序,得到的结果集可能并非想要的 若加了锁,则更新有先后顺序,能得到想要的结果集 2. 锁的分类:从不同的角度,有不同的分类方法 3. 相关视图 (1) select 阅读全文
摘要:
Oracle里的绑定变量 使用绑定变量,是可以重用解析树和执行计划基础条件. 绑定变量的语法: --sql var x number; exec :x := 7369; select ename from emp where empno= :x; --plsql declare vc_name va 阅读全文
摘要:
单个文件可以使用vi或vim编辑器打开日志文件,使用编辑器里的查找功能。在查看模式下,符号/后面跟关键字向下查找,符号?后面跟关键字向上查找,按n查找下一个,按N查找上一个。 多个文件可以使用grep命令,比如 grep ERROR /var/log/messages*。会把匹配到ERROR这个关键 阅读全文
摘要:
Oracle使用正则表达式4个主要函数: 1、regexp_like 只能用于条件表达式,和 like 类似,但是使用的正则表达式进行匹配,语法很简单: 2、regexp_substr 函数,和 substr 类似,用于拾取合符正则表达式描述的字符子串,语法如下: 3、regexp_instr 函数 阅读全文