摘要: from : http://blog.csdn.net/tiger119/article/details/1482555 对于数据仓库以及ETL的知识,我基本上是个门外汉。一切都得从头开始,记个笔记,方便自已了解学习进度。首先,我们来了解最基本的定义:嗯,也有人将ETL简单称为数据抽取。至少在未学习之前,领导告诉我的是,你需要做一个数据抽取的工具。其实呢,抽取是ETL中的关键环节,顾名思义,也就将... 阅读全文
posted @ 2012-01-31 11:10 张保维 阅读(505) 评论(0) 推荐(1) 编辑
摘要: 最好的(自我感觉)实现多个ASP.NET跨程序池共享Session [转] 简要介绍,本文主要内容是实现通过ASP.NET自己的Sql Server的Session存储机制实现,通过存储过程实现忽略程序标识的区别,达到多程序池间Session数据共享的目的。详细原文: 本文转载人数己经太多,所以不知道原文地址何处,敬请谅解! 我的链接地址是http://space.itpub.net/126391... 阅读全文
posted @ 2012-01-31 10:50 张保维 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 用Appfabric cache存储asp.net Session遇到的问题及总结 from:http://www.cnblogs.com/liuzhendong/archive/2011/11/30/2268742.html 折腾了一天, 才初步搭成功测试环境, 步骤如下: 安装, 配置appfabric在此就不赘述了, 直奔主题. 1.新建一个asp.net website, 使用.net... 阅读全文
posted @ 2012-01-31 10:36 张保维 阅读(318) 评论(0) 推荐(0) 编辑
摘要: ASP.NET MVC 实现二级域名 [转] [转] 自从微软发布 ASP.NET MVC 和routing engine (System.Web.Routing)以来,就设法让我们明白你完全能控制URL和routing,只要与你的application path相结合进行扩展,任何问题都迎刃而解。如果你需要在所处的域或者子域处理数据标记的话,强制使用Default。 遗憾的是,ASP.NET M... 阅读全文
posted @ 2012-01-29 10:49 张保维 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 引自: http://ec.iresearch.cn/57/20111111/155809.shtml?bsh_bid=58646179 百分点推荐引擎是国内领先的推荐技术平台,专注于为电子商务和资讯网站提供SaaS模式的个性化推荐服务,提高网站的整站转化率和用户黏度。本文将从电子商务网站的实际需求出发,介绍百分点推荐引擎架构设计和搭建。 需求 当下,个性化时代的潮流势不可挡,业界普遍意识... 阅读全文
posted @ 2012-01-05 16:00 张保维 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 基于Hbase的用户评分协同过滤推荐算法 作者: 张保维 2012-1-3 一、 概述 本文为推荐引擎设计的基础篇,介绍基于hbase 存储方式用户评分的方式进行推荐的主体算法及在分布式平台环境下的实现。由于推荐算法分支众多,我们先从简单及实用的算法进行设计。其它更加复杂算法及实现将会在后面的相关设计中进行说明。 二、 相关知识 (一) Hadoop与MapReduce Hadoop在本文中所起到... 阅读全文
posted @ 2012-01-05 15:31 张保维 阅读(743) 评论(0) 推荐(0) 编辑
摘要: 原有方法: public class HbaseClient : IDisposable { public Apache.Hadoop.Hbase.Hbase.Client Client { get; private set; } protected TBufferedTransport Transport { get; private set; } private TSocket socke... 阅读全文
posted @ 2011-12-07 14:31 张保维 阅读(1309) 评论(0) 推荐(2) 编辑
摘要: 今天在使用 Hbase 的Thrift接口的时候, C# 生成的代码出现错误为, “给定的关键字不在字典中” 经google 后找到答案, 原地址为: http://stackoverflow.com/questions/1440392/use-byte-as-key-in-dictionary 下面是我的测试代码,原代码中 有一个错误 “ <> “ 要改为“!=” 就好了。 public... 阅读全文
posted @ 2011-12-01 16:36 张保维 阅读(439) 评论(1) 推荐(0) 编辑
摘要: 引自:http://hi.baidu.com/zzpppork/blog/item/c1c79cfadbfe0a6e034f5683.html 在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn),其中Tk是特征项,1<... 阅读全文
posted @ 2011-11-17 17:11 张保维 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 用hive+hdfs+sqoop分析日志的步骤 from:http://blog.csdn.net/jiedushi/article/details/6800714 分类: hadoop框架 2011-09-22 15:58 134人阅读 评论(0) 收藏 举报 现在的部分工作是进行日志分析,由于每天的日志压缩前80多G左右,用lzop压缩后10G左右,如果用shell直接进行统计,需要花费很... 阅读全文
posted @ 2011-10-25 16:36 张保维 阅读(971) 评论(0) 推荐(0) 编辑