摘要: 开始研究一下开源项目hadoop,因为根据本人和业界的一些分析,海量数据的分布式并行处理是趋势,咱不能太落后,虽然开始有点晚,呵呵。首先就是安装和一个入门的小实例的讲解,这个恐怕是我们搞软件开发的,最常见也最有效率地入门一个新鲜玩意的方式了,废话不多说开始吧。 本人是在ubuntu下进行实验的,java和ssh安装就不在这里讲了,这两个是必须要安装的,好了我们进入主题安装hadoop:1.下载hadoop-0.20.1.tar.gz:http://www.apache.org/dyn/closer.cgi/hadoop/common/解压:$ tar –zvxf hadoop-0.20.1.. 阅读全文
posted @ 2011-07-30 18:06 杨超路飞 阅读(672) 评论(0) 推荐(0) 编辑
摘要: re.sub 函数进行以正则表达式为基础的替换工作>>> import re>>> re.search('[abc]', 'Mark') <_sre.SRE_Match object at 0x001C1FA8>>>> re.sub('[abc]', 'o', 'Mark') 'Mork'>>> re.sub('[abc]', 'o', 'rock') 'roo 阅读全文
posted @ 2011-07-23 13:39 杨超路飞 阅读(3836) 评论(0) 推荐(0) 编辑
摘要: Python编程语言作为一款比较新的程序应用语言,其中有很多方法是开发人员需要慢慢熟练掌握的。比如今天为大家介绍的Python yield就是一个比较特殊的应用。yield的英文单词意思是生产,刚接触Python的时候感到非常困惑,一直没弄明白Python yield的用法。只是粗略的知道yield可以用来为一个函数返回值塞数据,比如下面的例子:defaddlist(alist): foriinalist: yieldi+1取出alist的每一项,然后把i + 1塞进去。然后通过调用取出每一项:alist=[1,2,3,4] forxinaddlist(alist): printx,这的确是P 阅读全文
posted @ 2011-07-22 23:08 杨超路飞 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 简单介绍下使用DWR框架的基本步骤.1,下载dwr的jar包.2,将jar包复制到WEB-INF目录下的lib文件夹下.3,在web.xml中注册dwr的一个servlet.4,写相关的javaBean业务操作类及方法.5,写配置文件,取名为dwr.xml,与web.xml同一个目录下,注册将要操作的javaBean.OK,下面就来看个登录简单的实例吧.web.xml文件如下:<servlet> <servlet-name>dwr-invoker</servlet-name> <servlet-class>uk.ltd.getahead.dwr. 阅读全文
posted @ 2011-07-21 11:20 杨超路飞 阅读(544) 评论(0) 推荐(0) 编辑
摘要: 目前在土豆实习,觉得和之前在盛大实习最大的不同,就是可以接触到真实的海量数据,在盛大做的都是应用级的产品—信用卡还款,手机充值,无商品交易,也就是对java的框架和Javascript等有了进一步的掌握,但是目前这个社会是信息大爆炸的时代,大系统都是会产生海量的数据,那么如何才能很好将海量的数据快速无负担地展现于页面呢?一下是一套很好的解决方案,与大家分享一下。其实这套方案思路很清晰简单,那就是根据一页展示的条数取出数据并展现在当前页,关键代码如下所示:<%@ page language="java" import="java.util.*,java.sql 阅读全文
posted @ 2011-07-21 11:04 杨超路飞 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 网络应用自建利器-Google App Engine最近特别无聊,看到一篇文章说作为程序员应该有自己的一个网站,感觉的确很有道理,但是要买域名,租服务器要钱,用自己电脑搭建的话,又不能经常关机,很是麻烦,后来我发现了它,出自google之手,它就是 Google AppEngine。什么是 Google App Engine?Google App Engine 可让您在 Google 的基础架构上运行您的网络应用程序。App Engine 应用程序易于构建和维护,并可根据您的访问量和数据存储需要的增长轻松扩展。使用 Google App Engine,将不再需要维护服务器:您只需上传您的应用程 阅读全文
posted @ 2011-07-20 23:12 杨超路飞 阅读(351) 评论(0) 推荐(0) 编辑
摘要: 上帝说:“选择了脚本,就不要考虑性能。”我是很支持这句话的,使用脚本要的就是开发速度、良好的扩展性以及可维护性。可惜到了最后,我们的程序难免会运行得太慢,我们的客户不能忍受,这时候,我们就不得不考虑对代码的性能进行优化了。 程序运行慢的原因有很多,比如存在太多的劣化代码(如在程序中存在大量的“.”操作符),但真正的原因往往是比较是一两段设计并不那么良好的不起眼的程序,比如对一序列元素进行自定义的类型转换等。因为程序性能影响是符合80/20法则的,即20%的代码的运行时间占用了80%的总运行时间(实际上,比例要夸张的多,通常是几十行代码占用了95%以上的运行时间),靠经验就很难找出造成性能瓶颈的 阅读全文
posted @ 2011-07-20 15:05 杨超路飞 阅读(545) 评论(0) 推荐(0) 编辑
摘要: Tair在淘宝有着大规模的应用,在你登录淘宝、查看商品详情页面、在淘江湖和好友“捣浆糊”等等时候,后面都在直接或间接的和Tair交互。Tair是什么Tair是一个分布式的key/value结构数据的解决方案,系统默认支持基于内存和文件的存储引擎,对应于通常我们所说的缓存和持久化存储。Tair具有良好的架构,使得其在可扩展性、数据安全性方面都有较好的表现:基于对照表的灵活、良好的可扩展性轻量级的configserver抽象的存储引擎层,支持添加新的存储引擎自动的复制和迁移,对用户透明多机架和多数据中心的支持插件容器Tair除了基本的key/value操作外,还提供了一些实用的功能,使得其适用的场 阅读全文
posted @ 2011-07-19 12:40 杨超路飞 阅读(665) 评论(0) 推荐(0) 编辑
摘要: 背景Internet的高速发展,给人们的工作和生活带来了极大的便利,对Internet的服务品质和访问速度要求越来越 高,虽然带宽不断增加,用户数量也在不断增加,受Web服务器的负荷和传输距离等因数的影响,响应速度慢还是经常抱怨和困扰。解决方案就是在网络传输上利 用缓存技术使得Web服务数据流能就近访问,是优化网络数据传输非常有效的技术,从而获得高速的体验和品质保 证。网络缓存技术,其目的就是减少网络中冗余数据的重复传输,使之最小化,将广域传输转为本地或就近访问。互联网上传递的内容,大部分为重复的Web/FTP数据,Cache服 务器及应用Caching技术的网络设备,可大大优化数据链路性能, 阅读全文
posted @ 2011-07-19 12:38 杨超路飞 阅读(312) 评论(0) 推荐(0) 编辑
摘要: 做个记录:1、删除 mysql1 sudo apt-get autoremove --purge mysql-server-5.02 sudo apt-get remove mysql-server3 sudo apt-get autoremove mysql-server4 sudo apt-get remove mysql-common (非常重要)上面的其实有一些是多余的,建议还是按照顺序执行一遍清理残留数据dpkg -l |grep ^rc|awk '{print $2}' |sudo xargs dpkg -P2、安装 mysql1 sudo apt-get inst 阅读全文
posted @ 2011-07-18 23:35 杨超路飞 阅读(223) 评论(0) 推荐(0) 编辑