09 2017 档案

摘要:PageRank 程序: file contents: page1 page3page2 page1page4 page1page3 page1page4 page2page3 page4 def computeContribs(neighbors,rank): for neighbor in ne 阅读全文
posted @ 2017-09-30 13:43 健哥的数据花园 阅读(861) 评论(0) 推荐(0) 编辑
摘要:[Python]Python 使用 for 循环的小例子: In [7]: for i in range(5): ...: print "xxxx" ...: print "yyyy" ...: xxxxyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxxyyyy 阅读全文
posted @ 2017-09-30 12:45 健哥的数据花园 阅读(2375) 评论(0) 推荐(0) 编辑
摘要:Spark Python 索引页 为了查找方便,建立此页 RDD 基本操作: [Spark][Python]groupByKey例子 阅读全文
posted @ 2017-09-30 08:56 健哥的数据花园 阅读(368) 评论(0) 推荐(0) 编辑
摘要:[python]python 遍历一个list 的小例子: mlist=["aaa","bbb","ccc"]for ss in enumerate(mlist): print ss 验证一下运行结果: In [34]: mlist=["aaa","bbb","ccc"] In [35]: for 阅读全文
posted @ 2017-09-29 21:53 健哥的数据花园 阅读(1251) 评论(0) 推荐(0) 编辑
摘要:Spark Python 索引页 [Spark][Python]sortByKey 例子 的继续: [Spark][Python]groupByKey例子 In [29]: mydata003.collect() Out[29]: [[u'00001', u'sku933'], [u'00001', 阅读全文
posted @ 2017-09-29 21:46 健哥的数据花园 阅读(4132) 评论(1) 推荐(0) 编辑
摘要:[Spark][Python]sortByKey 例子的继续 RDD的collect() 作用是什么? “[Spark][Python]sortByKey 例子”的继续 In [20]: mydata004.collect() Out[20]: [[u'00001', u'sku933'], [u' 阅读全文
posted @ 2017-09-29 21:33 健哥的数据花园 阅读(3677) 评论(0) 推荐(0) 编辑
摘要:[Spark][Python]sortByKey 例子: [training@localhost ~]$ hdfs dfs -cat test02.txt00002 sku01000001 sku93300001 sku02200003 sku88800004 sku41100001 sku9120 阅读全文
posted @ 2017-09-29 21:14 健哥的数据花园 阅读(1785) 评论(0) 推荐(0) 编辑
摘要:客户问到跨DBLINK,结合本地表和远端表的时候,数据在哪一边 的 Data Buffer 缓存。测试的结果是:本地表在本地缓存,远端表在远端缓存。####Testcase-0929-10本地数据库: 远端数据库:TABXXX TABYYY 本地数据库:conn user003/user003cre 阅读全文
posted @ 2017-09-29 17:09 健哥的数据花园 阅读(695) 评论(0) 推荐(0) 编辑
摘要:In-Memory的Join Group 的数据字典位于内存的何处?有客户问到,使用Oracle 的In-Memory功能时,如果用到了 Join Group,那么这些这些Join Group,位于内存的何处?根据同事的执行结果,整理如下:1.prepare test env.create tabl 阅读全文
posted @ 2017-09-29 13:51 健哥的数据花园 阅读(502) 评论(0) 推荐(0) 编辑
摘要:[Oracle]ORA-600[kdBlkCheckError]LOB坏块处理客户环境报如下错误:ORA - 00600: Internal error code, arguments: [kdBlkCheckError], [2], [10388], [63068], [], [], [], [] 阅读全文
posted @ 2017-09-29 12:46 健哥的数据花园 阅读(1007) 评论(1) 推荐(0) 编辑
摘要:例如 目录是 /home/oracle/abc/trace命令如下:oracle@node1 trace]$ find ./ -name "*.trc" | xargs grep "ORA-12804" 阅读全文
posted @ 2017-09-29 11:00 健哥的数据花园 阅读(556) 评论(1) 推荐(0) 编辑
摘要:友人给的PDB restore / recover 的过程。实际上会创建一个辅助Instance,然后抽取出PDB,进行恢复。 (10:31:59) frank.yan: [Administrator.WIN-7ZFXNFKSD8P] ➤ ./rman target /Recovery Manage 阅读全文
posted @ 2017-09-29 10:34 健哥的数据花园 阅读(691) 评论(0) 推荐(0) 编辑
摘要:Extracting Data in Oracle GoldenGate Integrated Capture Modehttp://www.oracle.com/technetwork/database/availability/8398-goldengate-integrated-capture 阅读全文
posted @ 2017-09-29 09:43 健哥的数据花园 阅读(1276) 评论(0) 推荐(0) 编辑
摘要:[training@localhost ~]$ hdfs dfs -cat cats.txt The cat on the matThe aardvark sat on the sofa[training@localhost ~]$ mydata001=sc.textFile('cats.txt') 阅读全文
posted @ 2017-09-28 21:18 健哥的数据花园 阅读(2030) 评论(0) 推荐(0) 编辑
摘要:问题:客户进行了PDB的克隆之后,发现启动时出现:ORA-44777: Pluggable database service cannot be started.分析手段:为了获得PDB的相关信息,可以在 克隆的源和目的机器上分别查询: exec dbms_pdb.describe('/home/o 阅读全文
posted @ 2017-09-28 16:47 健哥的数据花园 阅读(457) 评论(0) 推荐(0) 编辑
摘要:Source:SQL> alter pluggable databse pdb1 open;Target:SQL> alter session set container=cdb$root;SQL> create database link dbk connect to system identif 阅读全文
posted @ 2017-09-28 16:41 健哥的数据花园 阅读(599) 评论(0) 推荐(0) 编辑
摘要:Mapping Single Rows to Multiple Pairs目的: 把如下的这种数据, Input Data 00001 sku010:sku933:sku02200002 sku912:sku33100003 sku888:sku022:sku010:sku59400004 sku4 阅读全文
posted @ 2017-09-27 21:06 健哥的数据花园 阅读(236) 评论(0) 推荐(0) 编辑
摘要:[Oracle]数据库的Control File 取Dump后的样例: 片段截取 (size = 40, compat size = 40, section max = 1225, section in-use = 1225,last-recid= 3899, old-recno = 219, la 阅读全文
posted @ 2017-09-27 13:13 健哥的数据花园 阅读(360) 评论(0) 推荐(0) 编辑
摘要:]如何取Control File 的Dump: SQL> alter session set events 'immediate trace name controlf level 3';SQL> select VALUE from V$DIAG_INFO where NAME = 'Default 阅读全文
posted @ 2017-09-27 12:56 健哥的数据花园 阅读(357) 评论(0) 推荐(0) 编辑
摘要:http://www.oracle.com/us/support/library/lifetime-support-technology-069183.pdf 阅读全文
posted @ 2017-09-27 09:40 健哥的数据花园 阅读(1168) 评论(0) 推荐(0) 编辑
摘要:针对RDD, 使用 keyBy 来构筑 key-line 对: [training@localhost ~]$ cat webs.log 56.31.230.188 - 90700 "GET/KDDOC-00101.html HTTP/1.0"56.32.230.186 - 90700 "GET/c 阅读全文
posted @ 2017-09-26 22:29 健哥的数据花园 阅读(197) 评论(0) 推荐(0) 编辑
摘要:[Spark][Python]获得 key,value形式的 RDD [training@localhost ~]$ cat users.txtuser001 Fred Flintstoneuser090 Bugs Bunnyuser111 Harry Potter[training@localho 阅读全文
posted @ 2017-09-26 21:40 健哥的数据花园 阅读(650) 评论(0) 推荐(0) 编辑
摘要:[Oracle]如何获得出现故障时,客户端的详细连接信息客户坚持说 只是在 每天早上5点才运行下面的语句:select / * + FULL (TAB001_TT01) * / 'TAB001_TT01', count (*) from u01.TAB001_TT01 group by 'TAB00 阅读全文
posted @ 2017-09-26 15:16 健哥的数据花园 阅读(223) 评论(0) 推荐(0) 编辑
摘要:Master表字段扩张时的对应方法如果Master表的数据量很大,Master表中的列,宽度扩张了,MVIEW表如何对应处理?此时,重建MVIEW可能会耗费很长的时间。可以采用 alter materialized view modify 的方式来进行。不过,没有官方文档支持。create tabl 阅读全文
posted @ 2017-09-26 13:24 健哥的数据花园 阅读(371) 评论(0) 推荐(0) 编辑
摘要:快速生成大量模拟数据的方法: create table TEST(id integer, TEST_NUMBER NUMBER(18,6));insert into TEST select i+j, i+j from ( with DATA2(j) as ( select 0 j from DUAL 阅读全文
posted @ 2017-09-26 13:15 健哥的数据花园 阅读(2095) 评论(0) 推荐(0) 编辑
摘要:现象:在使用 OFS (Oracle Fail Safe)的环境中,把数据库的 SQLNET.AUTHENTICATION_SERVICES 从 NTS 改为 NONE之后,当从 Oracle Fail Safe Manager 来查看数据库的状态的时候,发现数据库不见了。在现有的OFS 4.1 版 阅读全文
posted @ 2017-09-26 13:08 健哥的数据花园 阅读(289) 评论(0) 推荐(0) 编辑
摘要:构筑TDE 环境的例子:测试环境:12.1.0.2 $ cd $ORACLE_HOME/network/admin $ vim sqlnet.ora $ pwd /u01/app/oracle/product/12.1.0/dbhome_1/network/admin sqlnet.ora 需要配置 阅读全文
posted @ 2017-09-26 12:39 健哥的数据花园 阅读(751) 评论(0) 推荐(0) 编辑
摘要:包含了MVIEW的表领域,在进行导出,表领域改名,再导入后,MVIEW会消失不见。 测试环境12.1.0.2 步骤1:数据的准备[oracle@db12102 admin]$ sqlplus / as sysdbaSQL*Plus: Release 12.1.0.2.0 Production on 阅读全文
posted @ 2017-09-26 12:26 健哥的数据花园 阅读(580) 评论(0) 推荐(0) 编辑
摘要:$pwd /home/training/mydir $cat file1.json {"firstName":"Fred", "lastName":"Flintstone", "userid":"123"} $cat file2.json {"firstName":"Barney", "lastNa 阅读全文
posted @ 2017-09-26 06:50 健哥的数据花园 阅读(853) 评论(0) 推荐(0) 编辑
摘要:RDD flatMap 操作例子: flatMap,对原RDD的每个元素(行)执行函数操作,然后把每行都“拍扁” [training@localhost ~]$ hdfs dfs -put cats.txt[training@localhost ~]$ hdfs dfa -cat cats.txtE 阅读全文
posted @ 2017-09-25 20:45 健哥的数据花园 阅读(2755) 评论(0) 推荐(0) 编辑
摘要:可以在 Linux 下,用下列方式:如10046 trace 文件中如果有如下的内容:... tim = 1503032923可以用 date 命令加 option 来看它的时刻:date -u -d '@1503032923' 显示为:2017年 8月 18日 星期五 05:08:43 UTC 阅读全文
posted @ 2017-09-25 12:37 健哥的数据花园 阅读(407) 评论(0) 推荐(0) 编辑
摘要:https://community.oracle.com/thread/3789691https://community.oracle.com/community/support/%E4%B8%AD%E6%96%87%E7%A4%BE%E5%8C%BA/%E6%95%B0%E6%8D%AE%E5%B 阅读全文
posted @ 2017-09-25 12:32 健哥的数据花园 阅读(175) 评论(0) 推荐(0) 编辑
摘要:python打印列表的下标和值的例子: In [1]: list01=[1,4,5] In [10]: def funct01(ll): ....: for index,value in enumerate(ll): ....: print index,value ....: In [11]: fu 阅读全文
posted @ 2017-09-24 22:18 健哥的数据花园 阅读(1723) 评论(0) 推荐(0) 编辑
摘要:对HDFS 上的文件,采用绝对路径,来读取获得 RDD: In [102]: mydata=sc.textFile("file:/home/training/test.txt")17/09/24 06:31:04 INFO storage.MemoryStore: Block broadcast_3 阅读全文
posted @ 2017-09-24 21:28 健哥的数据花园 阅读(1734) 评论(0) 推荐(0) 编辑
摘要:map 就是对一个RDD的各个元素都施加处理,得到一个新的RDD 的过程 [training@localhost ~]$ cat names.txtYear,First Name,County,Sex,Count2012,DOMINIC,CAYUGA,M,62012,ADDISON,ONONDAGA 阅读全文
posted @ 2017-09-24 21:01 健哥的数据花园 阅读(1998) 评论(0) 推荐(0) 编辑
摘要:In [80]: class MyClass001: ....: def selfDemo(self): ....: print 'My Demo' ....: In [81]: p = MyClass001() In [82]: p.selfDemo()My Demo In [83]: In [8 阅读全文
posted @ 2017-09-24 20:31 健哥的数据花园 阅读(892) 评论(0) 推荐(0) 编辑
摘要:函数定义: In [78]: def printme(str): ....: print str ....: return ....: 调用: In [79]: printme('This is Jian')This is Jian In [80]: 阅读全文
posted @ 2017-09-24 20:11 健哥的数据花园 阅读(726) 评论(0) 推荐(0) 编辑
摘要:In [75]: x=4 In [76]: y=1 In [77]: str(bin(x ^ y))[2:].count('1') Out[77]: 2 In [78]: 来自:https://leetcode.com 阅读全文
posted @ 2017-09-24 20:07 健哥的数据花园 阅读(491) 评论(0) 推荐(0) 编辑
摘要:Practice makes perfect 发音被儿子鄙视了。需要加强练习 以此自勉。 阅读全文
posted @ 2017-09-24 18:51 健哥的数据花园 阅读(208) 评论(0) 推荐(0) 编辑
摘要:In [57]: name = ('Tome','Rick','Stephon') In [58]: age = (45,23,55) In [59]: for a,n in zip (name,age): ....: print a,n ....: Tome 45Rick 23Stephon 55 阅读全文
posted @ 2017-09-24 18:49 健哥的数据花园 阅读(220) 评论(0) 推荐(0) 编辑
摘要:Spark(Python) 从内存中建立 RDD 的例子: myData = ["Alice","Carlos","Frank","Barbara"]myRdd = sc.parallelize(myData)myRdd.take(2) In [52]: myData = ["Alice","Car 阅读全文
posted @ 2017-09-24 17:37 健哥的数据花园 阅读(1274) 评论(0) 推荐(0) 编辑
摘要:如果已经知道 FILE#,BLOCK#,则 可以通过如下查询来看:SQL> SELECT SEGMENT_TYPE,OWNER||'.'||SEGMENT_NAME FROM DBA_EXTENTS WHERE <FILE#> = FILE_ID AND <BLOCK#> BETWEEN BLOCK 阅读全文
posted @ 2017-09-22 16:12 健哥的数据花园 阅读(660) 评论(0) 推荐(0) 编辑
摘要:结论是存储在 remote 端,这其实也很好理解。在远端能高效率地计算,当然应当在远端完成缓存和检索。■ Before query execution via DBLINK: DBLINK destination (remote side):conn u2 / u2create table tab0 阅读全文
posted @ 2017-09-22 15:38 健哥的数据花园 阅读(381) 评论(0) 推荐(0) 编辑
摘要:查看数据是否被移入 DataBuffer 的方法:例如:表名为 tabxxx, 用户为U2: SQL> grant dba to u2 identified by u2;SQL> conn u2/u2SQL>SQL> create table tabxxx as select * from dba_ 阅读全文
posted @ 2017-09-22 14:06 健哥的数据花园 阅读(356) 评论(0) 推荐(0) 编辑
摘要:[Oracle]如何为数据库设置Event(eg: ORA-00235)■ When you use SPFILE,Setting procedure:1. Check the current event setting status:SQL> show parameter event;2. Add 阅读全文
posted @ 2017-09-22 12:37 健哥的数据花园 阅读(681) 评论(0) 推荐(0) 编辑
摘要:根据 471716.1,11g 之后,下列动作如果遇到坏块,都会输出记录到 V$DATABASE_BLOCK_CORRUPTION。- Analyze table .. Validate structure- CTAS(Create table as Select)- Export另外,这些也会记录 阅读全文
posted @ 2017-09-22 10:51 健哥的数据花园 阅读(1409) 评论(0) 推荐(0) 编辑
摘要:PQL Parameters ORACLE Account PQL_MASTLM = 1000 ASTLM = 1000 PQL_MBIOLM = 1000 BIOLM = 1000 PQL_MBYTLM = 1000000 BYTLM = 2000000 PQL_MDIOLM = 1000 DIO 阅读全文
posted @ 2017-09-22 10:46 健哥的数据花园 阅读(715) 评论(0) 推荐(0) 编辑
摘要:如果system 表空间的文件丢失,假设有备份的情况,可以恢复。数据库需要设置为mount 状态,然后restore/recover datafile模拟实验:SQL> select name from v $ datafile;NAME /u01/app/oracle/oradata/ORA112 阅读全文
posted @ 2017-09-22 10:14 健哥的数据花园 阅读(1588) 评论(0) 推荐(0) 编辑
摘要:如果你有从这个数据文件创建之前,直到现在的,所有的ArchiveLog 和 Online REDO,是有可能进行恢复的。执行:RMAN> restore datafile <fileid>RMAN> recover datafile <fileid>RMAN> sql 'alter database 阅读全文
posted @ 2017-09-22 09:58 健哥的数据花园 阅读(432) 评论(0) 推荐(0) 编辑
摘要:From the Windows failover cluster manager,select the group listener, stop it, and delete it. Do the same thing for the database.Pick a node that will 阅读全文
posted @ 2017-09-21 15:54 健哥的数据花园 阅读(227) 评论(0) 推荐(0) 编辑
摘要:例子: SQL> set linesize 300SQL> select * from V$RECOVERY_AREA_USAGE;FILE_TYPE PERCENT_SPACE_USED PERCENT_SPACE_RECLAIMABLE NUMBER_OF_FILES CON_ID CONTRO 阅读全文
posted @ 2017-09-21 15:12 健哥的数据花园 阅读(1582) 评论(0) 推荐(0) 编辑
摘要:出现了 ORA-00600[kxfpqsod_qc_sod], 如何调查呢?例如:从trace 文件的 Call Stack,可以看到Error: ORA-600 [kxfpqsod_qc_sod] [] [] [] [] [] [] [] [] [] [] [][00]: dbgexProcess 阅读全文
posted @ 2017-09-21 14:51 健哥的数据花园 阅读(489) 评论(0) 推荐(0) 编辑
摘要:可参考 MOS文档: WAITEVENT: "PX Deq Credit: send blkd" (Doc ID 271767.1) P1 = sleeptime/senderid P2 = passes P3 = qref这是一个 IDLE wait event,需要查看 谁在等待(也就是那个 s 阅读全文
posted @ 2017-09-21 13:57 健哥的数据花园 阅读(2936) 评论(0) 推荐(0) 编辑
摘要:如何取得Oracle并行执行的trace:ALTER SESSION SET tracefile_identifier='10046_PROD';ALTER SESSION SET max_dump_file_size = unlimited;ALTER SESSION SET timed_stat 阅读全文
posted @ 2017-09-21 13:46 健哥的数据花园 阅读(356) 评论(0) 推荐(0) 编辑
摘要:返回:Linux/Unix 索引页 某些时候,我们需要知道,在Unix/Linux 环境中,某个特定的CPU究竟消耗在了哪些进程上面。如下是最简单的方法:ps -elF 返回:Linux/Unix 索引页 阅读全文
posted @ 2017-09-21 13:44 健哥的数据花园 阅读(765) 评论(0) 推荐(0) 编辑
摘要:如何测试Oracle并行执行的并行度状况:可以通过如下的脚本,来查看要求的并行度,和实际获得的并行度。脚本来自:http://askdba.org/weblog/forums/topic/query-to-identify-parallel-slaves/col username for a12co 阅读全文
posted @ 2017-09-21 12:55 健哥的数据花园 阅读(1285) 评论(0) 推荐(0) 编辑
摘要:沉迷于岁月中无法自拔,自己的博客也一片荒芜了。今天,我再次归来。重新打造自己的数据花园。 阅读全文
posted @ 2017-09-21 12:21 健哥的数据花园 阅读(279) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示