文章分类 -  技术博文

摘要:转载:http://www.hanjunxing.com/think-about-operations一直做产品,从未做运营,但这并不妨碍我谈谈对运营的理解。因为在互联网领域,产品和运营都是相通的,产品是要给用户提供价值,运营是让用户认识这种价值,它们相互依存,战略目标是一致的。任何运营都围绕“用户... 阅读全文
posted @ 2014-10-27 20:05 subsir 阅读(258) 评论(0) 推荐(0) 编辑
摘要:随着数据的数量级增长,促进了数据分析的火热。但很多数据分析从业人员却感觉没有很好的获取行业资讯、技术交流的平台,今天就推荐几个经常上的觉得很不错的网站给大家。1.人大经济论坛-计量经济学与统计区 http://www.pinggu.org/bbs/index.php?gid=148业内人士都应该去过的门户,主要涉及计量经济学、统计学、数据挖掘、统计软件、数据等经济学相关问题交流统计软件交流2.中国统计网 http://www.itongji.cn中国统计网,始创于2008年3月,异军突起,提供统计软件,统计教程,统计年鉴,统计论文,数据挖掘,商业智能,数据仓库,医学统计,生物统计,数理统计,市 阅读全文
posted @ 2013-01-17 00:21 subsir 阅读(898) 评论(0) 推荐(1) 编辑
摘要:1.1 实时流计算互联网从诞生的第一时间起,对世界的最大的改变就是让信息能够实时交互,从而大大加速了各个环节的效率。正因为大家对信息实时响应、实时交互的需求,软件行业除了个人操作系统之外,数据库(更精确的说是关系型数据库)应该是软件行业发展最快、收益最为丰厚的产品了。记得十年前,很多银行别说实时转账,连实时查询都做不到,但是数据库和高速网络改变了这个情况。随着互联网的更进一步发展,从Portal信息浏览型到Search信息搜索型到SNS关系交互传递型,以及电子商务、互联网旅游生活产品等将生活中的流通环节在线化。对效率的要求让大家对于实时性的要求进一步提升,而信息的交互和沟通正在从点对点往信息链 阅读全文
posted @ 2012-12-29 15:50 subsir 阅读(1222) 评论(0) 推荐(0) 编辑
摘要:转载:http://kan.weibo.com/con/3528138114144927?_from=image随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。作为一家互联网数据分析公司,我们在海量数据的分析领域那真是被“逼上梁山”。多年来在严苛的业务需求和数据压力下,我们几乎尝试了所有可能的大数据分析方法,最终落地于Hadoop平台之上。Hadoop在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主 阅读全文
posted @ 2012-12-29 15:11 subsir 阅读(547) 评论(0) 推荐(0) 编辑
摘要:一、YUI(Ext)-chart其实Ext的chart组件来自于YUI2的chart组件,不过就是Ext做了一点自己的封装罢了,从它们的官网的示例和API你就会看出他们出奇的相似,话说YUI的chart组件也是基于另外一个开源项目。优点:纯JS配置,事件定义多,可以方便的与其它组件交互缺点:图表种类少(没有AreaChart导致我只能放弃)、配置不方便二、dv-charts一款使用xml进行配置的的chart组件,适合于需求简单的项目优点:简单易用、API很清晰缺点:没有明确提供JS接口,中文支持不好三、openflashchart2据说是一个人开发的,采用json进行配置,如果你喜欢用服务器 阅读全文
posted @ 2012-09-18 00:11 subsir 阅读(3852) 评论(3) 推荐(0) 编辑
摘要:大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函数 阅读全文
posted @ 2012-07-13 13:55 subsir 阅读(3250) 评论(0) 推荐(0) 编辑
摘要:随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付 web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:1、High performance - 对数据库高并发读写的需求 web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到 每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承... 阅读全文
posted @ 2012-07-03 15:20 subsir 阅读(737) 评论(0) 推荐(0) 编辑
摘要:推荐地址:http://www.ibm.com/developerworks/cn/opensource/os-php-fastapps1/ 由于国内网站备案比较麻烦,所以笔者便把网站放到了香港。虽然网站免去了备案的困扰,但是从访问速度上来看,一般要比放于国内的网站慢2-3倍,所以便想办法对网站做了一些简单的优化,比如使用缓存系统来提升网站页面访问速度。 目前用于Web的缓存系统很多,包括squid、varnish、Nginx自带的proxy_cache、FastCGI中的fastcgi_cache、APC、Xcache等。 像squid、varnish、Nginx自带的proxy_ca... 阅读全文
posted @ 2012-07-03 15:19 subsir 阅读(1892) 评论(0) 推荐(0) 编辑
摘要:文章转自:http://www.laruence.com/2011/12/30/2435.html你知道不知道, 插入65536个经过构造的键值的元素到PHP数组, 会需要耗时30秒以上? 而一般的这个过程仅仅需要0.1秒..请看如下的例子:<?php$size = pow(2, 16); $startTime = microtime(true);$array = array();for ($key = 0, $maxKey = ($size - 1) * $size; $key <= $maxKey; $key += $size) { $array[$key] = 0;}$end 阅读全文
posted @ 2012-07-03 15:12 subsir 阅读(402) 评论(0) 推荐(0) 编辑
摘要:转载:http://lmzj26.blog.51cto.com/1081403/577692在PHP中类为什么要使用静态方法,有什么好处不需要实例化??可以提高运行效率??这是一个经常被时时提出来的问题,很多时候我们以为理解了、懂了,但深究一下,我们却发现并不懂。方法是我们每天都在写得,很多程序员大多都使用实例化方法,而很少使用静态方法,问原因也说不出来所以然,或者简单的回答两者定义的区别,静态方法不需要new就可以使用 实例化方法需要new了以后才可以使用。。。。我们真的理解了吗?我特意以“你怎么理解并使用静态方法和实例化方法的?”这样的问题询问了多位程序员,他们开发的语言也不尽相同(c 、 阅读全文
posted @ 2012-07-03 15:02 subsir 阅读(2533) 评论(0) 推荐(0) 编辑
摘要:目前,不少网站在用户登录、用户提交信息等登录和输入的页面上使用了验证码技术。验证码技术可以有效防止恶意用户对网站的滥用,使得网站可以有效避免用户信息失窃、广告SPAM等问题。但与此同时,验证码技术的使用却使得WEB自动化测试面临了较大的困难。 验证码一般应用在WEB系统涉及登录和输入的页面上,其实现的一般方法是在页面上显示一幅图片,要求用户肉眼识别图片中的信息并将该信息作为输入的一部分进行提交。页面上显示的这幅图片一般是一串随机产生的数字或符号,并且被添加了用于防止识别的背景。验证码的主要目的是为了防止恶意用户利用自动工具(机器人)对用户口令进行暴力破解、恶意注册用户,或是向网站发布令人... 阅读全文
posted @ 2012-07-03 14:12 subsir 阅读(866) 评论(0) 推荐(0) 编辑
摘要:EA全称是:Enterprise Architect .下面就转一篇介绍的相关写文:转自这里一. 简介生命周期软件设计方案——Enterprise Architect是以目标为导向的软件系统。它覆盖了系统开发的整个周期,除了开发类模型之外,还包括事务进程分析,使用案例需求,动态模型,组件和布局,系统管理,非功能需求,用户界面设计,测试和维护等。为整个团队提供高级的UML 2.0建模工具。EA为用户提供一个高性能、直观的工作界面,联合UML 2.0最新规范,为桌面电脑工作人员、开发和应用团队打造先进的软件建模方案。该产品不仅特性丰富,而且性价比极高,可以用来配备您的整个工作团队,包括分析人员、测 阅读全文
posted @ 2012-07-03 14:04 subsir 阅读(5548) 评论(0) 推荐(0) 编辑
摘要:AMF是什么?它的优点中是什么?Flash Remoting与Flash播放器通信时为什么选择了使用AMF而放弃了SOAP呢? Flash 5开始就可以以XML或者“变量/值”配对输出格式向服务器传送数据。虽然这些数据能通过Flash编译器自动解析或者通过开发人员自行编写的代码手动解析, 但解析的速度慢。因为在解析过程中,XML需要按节点逐层处理数据。而且使用XML和“变量/值”配对格式处理的数据类型只能是字符型,数字也不例外。而Flash Remoting却能处理复杂数据类型, 比如对象、结构、数组,甚至可以是数据集,配合DataGrid组件可以很方便地显示数据。 为了处理复杂数据类型,采. 阅读全文
posted @ 2012-07-03 13:26 subsir 阅读(355) 评论(0) 推荐(0) 编辑
摘要:1、引言 基于LAN或WAN的网络应用之间进行数据传输或者同步非常普遍,比如远程数据镜像、备份、复制、同步,数据下载、上传、共享等等,最为简单的做法自然就是对数据进行完全复制。然而,数据在网络上来回被复制多次后就会存在大量副本,很多情形下这些文件副本之间仅有很小的差异,很可能是从同一个文件版本演化而来。如果对文件进行完全复制,在文件较大的情况下,会占用大量网络带宽,同步时间也会较长。目前,广域网WAN的带宽与访问延迟仍然是急需解决的问题,完全复制使得很多网络应用无法提供良好的服务质量,比如分布式文件系统(DFS)、云存储(Cloud Storage)。Rsync与RDC(Remote Diff 阅读全文
posted @ 2012-06-28 17:14 subsir 阅读(430) 评论(0) 推荐(0) 编辑