2013年9月11日

UrlRewriter的一个问题

摘要: 使用UrlRewriter时候发现一个问题,采用VS开发服务器的情况下,是能起作用的,可以对地址进行正确重写不过因为开发需要项目采用的是在IIS Web服务器的的方式测试结果就不行了,明显的表现是压根不加载UrlRewriter模块(将UrlRewriter的源码项目加入到解决方案中,在VS开发服务器状态下调试能命中中断,IIS模式下就不行了)各种Google,百度,没一个靠谱的,而且都是抄来抄去找到一篇关于在win7下设置的文章,结果也是没有效果,文章里的UrlRewriter版本老了不过倒是意外发现了问题所以,在于web.config中的配置写法上。http://urlrewriter.n 阅读全文

posted @ 2013-09-11 18:47 AI001 阅读(146) 评论(0) 推荐(0) 编辑

2013年9月5日

Storm VS Hadoop

摘要: 序号StormHadoopremark1实时或者接近实时,适合急脾气的工程师有最小计算时间(原生hadoop,不是各种各公司改装版的),喜欢钻探的工程师有福了2集群内存计算,网络直传数据hdfs传递数据,不同阶段的数据会在机器间通过存储转移3擅长对数据流中的每一个数据及时处理,但是进入系统的数据间不能有任何的逻辑前后关系逐个处理数据会把人气死,进入系统的数据有着一定的要求量4storm适合无间断的计算密集型,请求量24小时不间断的系统最好hadoop的工作有始有终,如果最好以它的计算时长最为请求间隔时间最佳5Storm的过程中不适宜检索大批量数据的操作hadoop的过程中可以对大批量数据各种玩 阅读全文

posted @ 2013-09-05 14:39 AI001 阅读(253) 评论(0) 推荐(0) 编辑

广告联盟反作弊一些常识

摘要: 1. 站长为了赚钱,会故意增加广告的点击率,以此获得更多的收入。而广告联盟会对广告的点击率作控制, 目前一般是控制在5%以内,如果超过了这个比率,很有可能会被广告联盟判为作弊,然后被K掉。2. 站长重复点击广告的时候,会被INTERNET 中的小甜饼S记录下来, 如果再次点击,就是很明显的重复点击,也会被广告联盟K掉。即使清空IE中的小甜饼S以后再点击还是难逃法网。3. IP防止作弊:一般计费方式是按照24小时内唯一IP,可以将每个IP记入数据库,当下一个访问IP与数据库已存在的IP相同时,则不计费。现在上网一般是动态IP,作弊者通过拨号器上下线来实现改变IP地址,你可以通过C段IP来辨别,如 阅读全文

posted @ 2013-09-05 09:53 AI001 阅读(711) 评论(0) 推荐(0) 编辑

2013年8月30日

datastax的C# Driver for Apache Cassandra

摘要: 原版的说明文档:http://www.datastax.com/documentation/developer/csharp-driver/1.0/webhelp/index.html#csharp-driver/quick_start/qsSimpleClientAddSession_t.html先吐槽一下说明文档非人的简单说明的简洁明快,一下子就明白怎么编写代码,但是有些地方确实不该太简洁的。给出的方法名和方法调用太不一致了,Session已经不是静态类了,但是文档里的例子还是静态类的写法。而在调用keyspace里的东西时必须连接上空间的,类似在命令端里的use keyspace,可是这 阅读全文

posted @ 2013-08-30 16:07 AI001 阅读(757) 评论(0) 推荐(0) 编辑

2013年8月28日

centos6.4上安装storm0.82

摘要: centos 6.4版本下安装storm0.82需要先安装zookeeper,见上文http://blog.csdn.net/xqj198404/article/details/10433527如果无法联网,使用文件安装请在这里寻找更新源base源文件列表1.首先安装libtool,否则autogen的脚本无法运行yum install libtool2.安装libuuid-devel,否则报错yum install libuuid-devel3.先安装zeromq的2.1.4版本,注意,如果有configure: error: Unable to find a working C++ com 阅读全文

posted @ 2013-08-28 12:21 AI001 阅读(198) 评论(0) 推荐(0) 编辑

centos6.4上zookeeper3.4.5安装与基础设置

摘要: 1.下载zookeeper的3.4.5版本的tar.gz包zookeeper.apache.org2.解压缩,然后进入conf文件夹,复制zoo_sample.cfg为zoo.cfg。需要修改dataDir=自己定义的路径在文件末尾追加代码server.1=机器名或ip.2888.3888 server.2=机器名或ip.2888.3888 server.3=机器名或ip.2888.3888 server.4=机器名或ip.2888.3888 ...........注意,server后面的1,2,3的数值必须和dataDir指定的路径下的myid的文件中的数值一样。3.在dataDir设置的路 阅读全文

posted @ 2013-08-28 11:22 AI001 阅读(234) 评论(0) 推荐(0) 编辑

2013年8月20日

sudo在shell脚本执行的问题

摘要: sudo的执行需要tty。如果将sudo service命令写在shell脚本中,通过程序方式调用,是不会执行的。但是centos6.4中比较坑人的是"sorry, you must have a tty to runsudo"这个错误不知道为什么没有报出来,也没有写到日志中,结果浪费了一天的时间去查找原因。如果修改/etc/sudoers,将Defaults requiretty,修改为 #Defaults requiretty,表示不需要控制终端,也可以在shell的脚本中通过程序直接执行sudo service。由于centos的程序所拥有的权限是和运行的它的用户一样 阅读全文

posted @ 2013-08-20 17:33 AI001 阅读(718) 评论(0) 推荐(0) 编辑

2013年8月15日

mahout的数据文件格式

摘要: 原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/Data+FormatsMahout支持许多格式的文件以便实现各种工作。文件格式可导入的文件格式1. 文本文件 (1)满足以下格式的文本可以转化为流数据文件导入:(行号,行文本)(文件名,文件的全部内容)(行号,行份的用正则表达式模式) (2)可以解析为Lucene索引的文本: 精确的索引设计???(此处不明白为什么会有三个问号,可能有部分文本会失败吧)2. ARFF文件WEKA(来源)项目文本数据格式 可以格式生成流文件的数据3. 邮箱文件 满足以下格式的邮件可以转化为流数据文.. 阅读全文

posted @ 2013-08-15 15:45 AI001 阅读(1138) 评论(0) 推荐(0) 编辑

mahout概述

摘要: 原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/OverviewMahout的目标是建立可扩展的机器学习库。可扩展的的意味着如下: 可扩展到相当大的数据集。核心算法,聚类,分类和批量基于协同过滤并以Apache Hadoop的map / reduce范式实现。但是,使用并不仅限于hadoop,单个的hadoop节点或在非Hadoop集群上都可以运行。核心库的高度优化,以获得较好的性能,即使是非分布式的情况下。 灵活的支持您的业务情况。Mahout是在一个商业友好的Apache软件许可下分发的。 快速扩张的社区。 Mahout的目标 阅读全文

posted @ 2013-08-15 11:31 AI001 阅读(178) 评论(0) 推荐(0) 编辑

基于keepalived的redis系统master双机热备,读数据负载均衡设置方案

摘要: 硬件:机器 ip 作用master 192.168.0.2 redis系统的master主机slave1 192.168.0.3 redis系统的slave机器,和master组成双机热备slave2 192.168.0.4 redis系统的slave机器,和slave1构成读数据的负载均衡系统软件:keepalived,下载地址:www.keepalived.orglvs,下载地址:http://www.linuxvirtualserver.orgredis,下载地址:www.redis.iocentos 6.4版本安装:不采用编译安装的方式,使用yum安装1.安装kernel-devel: 阅读全文

posted @ 2013-08-15 09:56 AI001 阅读(547) 评论(0) 推荐(0) 编辑

导航