摘要:
最近写了一个用python监控tomcat日记文件的功能 实现的功能: 监控日记文件中实时过来的记录,统计每分钟各个接口调用次数,统计结果插入oracle #!/usr/bin/python # -*- coding: UTF-8 -*- import time import os import s 阅读全文
摘要:
1.下面安装orcal的包 下载如下的几个包,要根据你的python环境下载对应的包,我的是2.6版本,所以下载的是cx_Oracle-5.2.1-11g-py26-1.x86_64.rpm 下载地址: https://pypi.python.org/pypi/cx_Oracle/5.2.1 htt 阅读全文
摘要:
package regionForKeywords; import java.io.*; /** * Created by huangjiahong on 2016/2/25. */ public class RegionKeywordExcelTransform { public static v 阅读全文
摘要:
flume:从数据源拉取数据 kafka:主要起到缓冲从flume拉取多了的数据 sparkStream:对数据进行处理 一.flume拉取数据 1.源数据文件读取配置 在flume目录的conf目录下配置读取数据源的配置,配置一个test.properties文件,内容如下: a1.sources 阅读全文
摘要:
环境: linux spark1.6.0 hadoop2.2.0 一.安装scala(每台机器) 1.下载scala-2.11.0.tgz 放在目录: /opt下,tar -zxvf scala-2.11.0.tgz 2.在hadoop用户下 vim /etc/profile 3.在profile文 阅读全文
摘要:
一.安装storm 下载storm http://storm.apache.org/downloads.html export STORM_HOME=/Users/huangjiahong/Documents/apache/apache-storm-0.10.0 二.安装zookeeper 下载zo 阅读全文
摘要:
1. 损失函数 在线性回归分析中,假设我们的线性回归模型为: 样本对应的正确数值为: 现在假设判别函数的系数都找出来了,那么通过判别函数G(x),我们可以预测是样本x对的值为。那这个跟实际的y的差距有多大呢?这个时候我就出来一个损失函数: 其实损失函数很容易理解,就是所有样本点的预测的值跟实际的值之 阅读全文
摘要:
一.collection1.由多个cores组成一个逻辑索引叫做一个collection。一个collection本质上是一个可以跨越多个核的索引,同时包含冗余索引。2.collection由不同的shard组成,每个shard又多个replica,每个shard中有一个leadereplica,每... 阅读全文