09 2015 档案

摘要:python eval 【转】eval(str [,globals [,locals ]])函数将字符串str当成有效Python表达式来求值,并返回计算结果。同样地, exec语句将字符串str当成有效Python代码来执行.提供给exec的代码的名称空间和exec语句的名称空间相同.最后,execfile(filename [,globals [,locals ]])函数可以用来执行一个文件,... 阅读全文
posted @ 2015-09-28 17:34 iAthena 阅读(271) 评论(0) 推荐(0) 编辑
摘要:nohup 命令用途:不挂断地运行命令。语法:nohup Command [ Arg … ] [ & ]描述:nohup 命令运行由 Command 参数和任何相关的 Arg 参数指定的命令,忽略所有挂断(SIGHUP)信号。在注销后使用 nohup 命令运行后台中的程序。要运行后台中的 nohup 命令,添加 & ( 表示”and”的符号)到命令的尾部。无论是否将 nohup 命令的输出重定向到... 阅读全文
posted @ 2015-09-23 15:11 iAthena 阅读(349) 评论(0) 推荐(0) 编辑
摘要:>>> def make_incrementor (n): return lambda x: x + n>>> >>> f = make_incrementor(2)>>> g = make_incrementor(6)>>> >>> print f(42), g(42)44 48>>> >>> print make_incrementor(22)(33)55The above code defi... 阅读全文
posted @ 2015-09-16 11:11 iAthena 阅读(400) 评论(0) 推荐(0) 编辑
摘要:Cookie Mapping 的映射工作可以在 SSP 方进行,SSP 方根据用户的 Cookie 信息,映射发送竞价请求中的 DSP 方 Cookie,DSP 方在竞价请求消息中获取自己的 Cookie 并进行竞价决策。Cookie Mapping 的映射工作也可以在 DSP 方进行,SSP 方每次在竞价请求中仅设置 SSP 方的用户 Cookie,DSP 方在获取到 SSP 方 Cookie ... 阅读全文
posted @ 2015-09-08 15:22 iAthena 阅读(957) 评论(0) 推荐(0) 编辑
摘要:1、建表, ========================================================= create table T_JD_RECOMM( TIP_NO varchar2(6), USR_NO VARCHAR2(10), SKU_NO VARCHAR2(15), TRDTYPE_NO VARCHAR2(6), T... 阅读全文
posted @ 2015-09-08 15:21 iAthena 阅读(278) 评论(0) 推荐(0) 编辑
摘要:Numberic 数据类型用来存储负的和正的整数、分数和浮点型数据,范围在-1*10-103 和9.999…99*10125之间,有38位的精确度。标识一个数据超出这个范围时就会出错。 Number( p,s) Number数据类型存储一个有p位精确度的s位等级的数据 numeric是number子类型,number可以存放1E-130~10E125数字,numeric最大精度为38位 ... 阅读全文
posted @ 2015-09-08 14:41 iAthena 阅读(5930) 评论(0) 推荐(0) 编辑
摘要:MySQL索引类型包括: 1.普通索引 这是最基本的索引,它没有任何限制。它有以下几种创建方式: ◆创建索引 CREATE INDEX indexName ON mytable(username(length)); 如果是CHAR,VARCHAR类型,length可以小于字段实际长度;如果是BLOB和TEXT类型,必须指定 length,下同。 ◆修改表结构 ALTER mytable ADD... 阅读全文
posted @ 2015-09-08 14:40 iAthena 阅读(901) 评论(0) 推荐(0) 编辑
摘要:Basis(基础):MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最大似然估计),QP(Quadratic Programming 二次规划), CP(Conditional Probability条件... 阅读全文
posted @ 2015-09-08 14:32 iAthena 阅读(279) 评论(0) 推荐(0) 编辑
摘要:问题1:在SPSS Modeler 14.1调用了某些Statistics功能之后,原来的节点为什么无法正常工作? 答:Modeler 14.1 Fix Pack 1 及Fix Pack 2 已修复此问题,请下载安装。 问题2:SPSS Modeler Server在Unix环境安装时,是否一定要使用root权限? 答:是的,Modeler 15 版本之前,必须root权限安装Modele... 阅读全文
posted @ 2015-09-08 14:31 iAthena 阅读(7848) 评论(0) 推荐(0) 编辑
摘要:做一个数据分析的项目,不能不下结论! 雷声大,雨点小的事情,作为数据分析师千万要避免发生。 提交数据分析报告,对业务问题进行及时解决,养成这个良好的习惯。 数据分析报告采用PPT格式、Word格式都可以,做到结构合理、结论坚定,图文并茂。 这个阶段切记不要搞得太花哨,语气低调不要太夸张。 有自己的结论,有自己的观点,能有效解决问题,并针对类似问题进行监控,防止再次发生。 总之一句话,诚实、务实... 阅读全文
posted @ 2015-09-08 14:30 iAthena 阅读(234) 评论(0) 推荐(0) 编辑
摘要:1. 配置WEKA环境变量;2. 写perl,如下:###############################################################################################################################!/usr/bin/perluse strict;use warnings;open FILE... 阅读全文
posted @ 2015-09-08 14:29 iAthena 阅读(206) 评论(0) 推荐(0) 编辑
摘要:> java weka.clusterers.SimpleKMeans -p 1 -l G:\Program\data_Factory\example.model -T G:\Program\data_Factory\save_file_ID2Class.arff 0 1 (0) 1 2 (0) 2 1 (0) 3 3 (57) 4 1 (0) > java weka.clusterers.S... 阅读全文
posted @ 2015-09-08 14:28 iAthena 阅读(402) 评论(0) 推荐(0) 编辑
摘要:来自为知笔记(Wiz) 阅读全文
posted @ 2015-09-08 14:27 iAthena 阅读(399) 评论(0) 推荐(0) 编辑
摘要:z检验用于检验正态样本均值是否等于某个假设值,不过需要事先知道总体方差,得到的统计量服从正态分布,有的教材上又叫u检验 t检验与z检验相似,t检验不需要知道总体方差,它用样本方差替代总体方差,得到的统计量服从t分布。实践应用中,t检验比z检验常用,因为不容易知道总体的方差。t检验来源于戈斯特的笔名student。 f检验主要用于方差分析,方差分析中,组间均方比上组内均方服从F... 阅读全文
posted @ 2015-09-08 14:26 iAthena 阅读(1118) 评论(0) 推荐(0) 编辑
摘要:l如果一个项集是非频繁的,则它的所有超集也一定是非频繁的: –这种基于支持度度量修剪指数搜索空间的策略称为基于支持度的剪枝(support-based pruning) –这种剪枝策略依赖于支持度度量的一个关键性质,即一个项集的支持度决不会超过它的子集的支持度。这个性质也称为支持度度量的反单调性(anti-monotone)。l扫描一次数据集,确定每个项的支持度计数。丢弃非频繁项,而将频繁项按... 阅读全文
posted @ 2015-09-08 14:25 iAthena 阅读(1380) 评论(0) 推荐(0) 编辑
摘要:梯度下降原理:将函数比作一座山,我们站在某个山坡上,往四周看,从哪个方向向下走一小步,能够下降的最快;当然解决问题的方法有很多,梯度下降只是其中一个,还有一种方法叫Normal Equation(标准方程); 方法:(1)先确定向下一步的步伐大小,我们称为Learning rate;(2)任意给定一个初始值:;(3)确定一个向下的方向,并向下走预先规定的步伐,并更新;(4)当下降的高度小于某... 阅读全文
posted @ 2015-09-08 14:24 iAthena 阅读(188) 评论(0) 推荐(0) 编辑
摘要:http://www.cs.berkeley.edu/~rxin/ tar zxvf 生态系统简析Spark Streaming:Spark Streaming实质上仍然是批处理,但是把之前大的批处理拆为小的batch。同时,当下Spark Streaming已支持限流,当流量很大时,Spark可以挡住。此外,它还可以支持实时机器学习。在Spark Streaming中,数据丢失一般因为两种情况—... 阅读全文
posted @ 2015-09-08 13:17 iAthena 阅读(290) 评论(0) 推荐(0) 编辑
摘要:sudo yum -y install gcc gcc-c++ numpy python-devel scipy Linux 下:安装scikit-learn: 50 sudo yum -y install gcc gcc-c++ numpy python-devel scipy 57 python -v 71 yum install python-setuptools ... 阅读全文
posted @ 2015-09-08 13:16 iAthena 阅读(311) 评论(0) 推荐(0) 编辑
摘要:用sudo时提示"xxxisnotinthesudoersfile.Thisincidentwillbereported.其中XXX是你的用户名,也就是你的用户名没有权限使用sudo,我们只要修改一下/etc/sudoers文件就行了。下面是修改方法:su-chmodu+w/etc/sudoersv... 阅读全文
posted @ 2015-09-08 13:15 iAthena 阅读(225) 评论(0) 推荐(0) 编辑
摘要:Linux下查看文件和文件夹大小 - 郭振斌 - 博客园Linux下查看文件和文件夹大小 当磁盘大小超过标准时会有报警提示,这时如果掌握df和du命令是非常明智的选择。 df可以查看一级文件夹大小、使用比例、档案系统及其挂入点,但对文件却无能为力。 du可以查看文件及文件夹的大小。 两者配合使用,非... 阅读全文
posted @ 2015-09-08 13:14 iAthena 阅读(216) 评论(0) 推荐(0) 编辑
摘要:说到了内建变量,我们可以来看看awk的一些内建变量:$0当前记录(这个变量中存放着整个行的内容)$1~$n当前记录的第n个字段,字段间由FS分隔FS输入字段分隔符 默认是空格或TabNF当前记录中的字段个数,就是有多少列NR已经读出的记录数,就是行号,从1开始,如果有多个文件话,这个值也是不断累加中。FNR当前记录数,与NR不同的是,这个值会是各个文件自己的行号RS输入的记录分隔符, 默认为换行符... 阅读全文
posted @ 2015-09-08 13:14 iAthena 阅读(285) 评论(0) 推荐(0) 编辑
摘要:np.matrix(np.identity(10))In [20]: cmp(10,2) # cmp(x,y):Out[20]: 1In [21]: cmp(10,22)Out[21]: -1In [22]: cmp(10,10)Out[22]: 0In [3]: import numpy as npIn [4]: a1=np.array([1,2,3],dtype=int)In [5]: a2=... 阅读全文
posted @ 2015-09-08 13:12 iAthena 阅读(270) 评论(0) 推荐(0) 编辑
摘要:下图列出了Python支持的正则表达式元字符和语法: 来自为知笔记(Wiz) 阅读全文
posted @ 2015-09-08 11:40 iAthena 阅读(309) 评论(0) 推荐(0) 编辑
摘要:因为Python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL锁:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核。... 阅读全文
posted @ 2015-09-08 11:39 iAthena 阅读(229) 评论(0) 推荐(0) 编辑
摘要:[root@hadoop1 bin]# uname -a Linux hadoop1 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux[root@hadoop1 bin]# cat /proc/versionLinux version 2.6.32-431.el6.... 阅读全文
posted @ 2015-09-08 11:37 iAthena 阅读(855) 评论(0) 推荐(0) 编辑
摘要:basename example.tar.gz .tar.gz# => example FILE="example.tar.gz" echo "${FILE%%.*}"# => example echo "${FILE%.*}"# => example.tar echo "${FILE#*.}"# => tar.gz echo "${FILE##*.}"# => gz来源: 来自为知笔记(Wiz... 阅读全文
posted @ 2015-09-08 11:35 iAthena 阅读(262) 评论(0) 推荐(0) 编辑
摘要:如果要给全局变量在一个函数里赋值,必须使用global语句。global VarName的表达式会告诉Python, VarName是一个全局变量,这样Python就不会在局部命名空间里寻找这个变量了。globals()和locals()函数根据调用地方的不同,globals()和locals()函数可被用来返回全局和局部命名空间里的名字。如果在函数内部调用locals(),返回的是所有能在该函数... 阅读全文
posted @ 2015-09-08 11:33 iAthena 阅读(225) 评论(0) 推荐(0) 编辑
摘要:hive> select ljn001.*,ljn002.* > from ljn001 left outer join ljn002 > on (ljn001.a = ljn002.a and ljn001.b = ljn002.b and ljn001.b = 2); OK a b a b 1 2 1 2从执行计划中可... 阅读全文
posted @ 2015-09-08 11:30 iAthena 阅读(2248) 评论(0) 推荐(0) 编辑