摘要:
What is the most common software of data mining?1 Orange? 2 Weka? 3 Apache mahout? 4 Rapidminer? 5 R? and which one? If you have any explanation about... 阅读全文
摘要:
什么是高频交易系统1 交易指令完全是由电脑发送,对市场数据的响应延时在微秒级2 系统有专用的软硬件组成,研发时需要大量的计算机专家级的工作3 系统的硬件需要放在离交易所主机很近的位置,所谓co-location。并且得到专门的准入许可证,交易指令发送至交易所。符合以上三点,就可以叫做高频交易系统(H... 阅读全文
摘要:
http://stackoverflow.com/questions/16017538/how-does-configuration-addresource-method-work-in-hadoop 2 hadoop MapReduce 读取参数 下面我们先通过一个表格来看下,在hadoop中,使 阅读全文
摘要:
大学时,我一直觉得统计学很难,还差点挂科。工作以后才发现,难的不是统计学,而是我们的教材写得不好。比起高等数学,统计概念其实容易理解多了。我举一个例子,什么是泊松分布和指数分布?恐怕大多数人都说不清楚。我可以在10分钟内,让你毫不费力地理解这两个概念。一、泊松分布日常生活中,大量事件是有固定频率的。... 阅读全文
摘要:
配置IP,修改主机名,关闭防火墙,配置SSH免密码登录 1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.8.0 子网掩码:255.255.2 阅读全文
摘要:
1 解压文件,移动文件,删除特定目录 2 文本操作工具 3 循环和条件判断 4 分组排序测试 5 sed 和 awk学习 扩展阅读 在UNIX上使用sed命令进行字符串处理中常常遇到的问题就是行首行尾的空格怎么删除。 下面介绍sed是怎样实现的,当然awk同样可以。 1:行首空格 sed 's/^[ 阅读全文
摘要:
近期一直在忙项目上的事情,今天对以前的工作做一个简单的小结。明天就是国庆节啦。 1 脚本可以手动执行,可是crontab缺总是找不到路径? 请在脚本中加入 本机的环境变量和用户的环境变量的配置 2 config.ini文件总是出现乱码,导致读入的数据莫名其妙? 3 logback.xml配置不起作用 阅读全文
摘要:
Hadoop 生态圈 commonArvoMapReduceHDFSPigHive 一个分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据,并提供基于SQL的查询语言(由运行时引擎翻译成MapReduce作业)用以查询数据。HBase 一个分布式、按列存储数据库。HBase使用H... 阅读全文
摘要:
1 Log4j简介Log4j是Apache的一个开源项目,它允许开发者以任意间隔输出日志信息。Log4j主要由三大类组件构成:Logger-负责输出日志信息,并能够对日志信息进行分类筛选,即决定哪些日志信息应该被输出,哪些该被忽略。Loggers组件输出日志信息时分为5个级别:DEBUG、INFO、... 阅读全文
摘要:
R中好几个Pkg都提供了股票数据的在线下载方法,如果非得在其中找出一个最好的,那么quantmod当之无愧!举一个例子,譬如下载沪市大盘数据,代码可以是:library(quantmod)SSE <- getSymbols("000001.SS",auto.assign=FALSE)head(SSE... 阅读全文