摘要:
忙里偷闲,系统的回顾下统计学相关的知识,并将形成系列总结,第一次简单的总结下随机变量的数字特征。随机变量的数字特征基本上分为三类:1、度量变量分布的集中趋势:主要包括数学期望(均值),中位数,众数等。2、度量变量分布的离散性:主要包括方差和标准差。3、度量两个变量的相关性:主要包括协方差和相... 阅读全文
2011年8月22日
摘要:
“巧妇难为无米之炊”,很多人在学习数据挖掘时,总是感觉没有数据,然后就不了了之了。事实上,在互联网迅猛发展的今天,我们并不缺少数据,而是被数据所淹没,从而迷失了方向。在此总结一下获取数据的途径,我将其分为屠龙式和倚天式。所谓屠龙式也就是动态获取,可以写一些爬虫程序,从互联网上抓取数据,或者是通过程... 阅读全文
摘要:
1、调查研究阶段:首先要收集数据,分析数据,挖掘数据。小蚊子乐园博主专注在市场调查研究,SPSS使得很熟练,对PPT、excel也热爱有加,博客开的似乎很早了,有很多好内容。数据挖掘者现在的分析,不搞点挖掘、模型的,似乎就不够高级、不够唬人。这位博主可是数据挖掘的牛人,SAS、SPSS Cleme... 阅读全文
摘要:
如想将一个路径加入到$PATH中,可以像下面这样做:1. 控制台中:$ PATH="$PATH:/my_new_path" (关闭shell,会还原PATH)2. 修改profile文件:$ vi /etc/profile在里面加入:export PATH="$PATH:/my_new_path"... 阅读全文
2011年8月18日
摘要:
Hadoop API被分成(divide into)如下几种主要的包(package)org.apache.hadoop.conf 定义了系统参数的配置文件处理API。org.apache.hadoop.fs 定义了抽象的文件系统API。org.apache.hadoop.dfs Hadoo... 阅读全文
2011年8月17日
摘要:
一种是Ubuntu源自带的open-java(icedtea),一个是Oracle的sun-java6。前者是Ubuntu默认的Java,sun-java6已经从ubuntu官方源里面去掉了,想要从源安装,必须添加ubuntu的patner(合作组织)的源。而如果打算正儿八经到做开发最好是... 阅读全文
2011年8月16日
摘要:
1. 添加用户并设置权限 这里是架设服务器最复杂的地方,笔者试图把这里搞清楚,可惜,还是有些疑问!??好在服务器还能运转! 首先说,通过http协议传输数据时,用户是通过apache来操做svn版本库的,subversion是通过一些模块和apache进行通讯的。具体原理,有兴趣的朋友可以... 阅读全文
2011年8月15日
摘要:
写在前面:Hadoop是Apache的一个项目,它是一个实现了MapReduce计算模型的可以运用于大型集群并行计算的分布式并行计算编程框架,当然分布式计算离不开分布式存储,Hadoop框架包含了分布式存储系统HDFS(Hadoop Distributed File System),其存储和数据结... 阅读全文
摘要:
闲来无事,搭了一个svn服务器,主要做文件共享,实验室比较变态,分配的服务器只开放80端口和8080端口,ftp就无法使用了,只能走svn_apache的路线,闲话少扯:前期安装,这里不再叙述。这里主要讲下配置。文件:/etc/apache2/sites-available/default添加: ... 阅读全文
2011年8月14日
摘要:
编辑/etc/mysql/my.cnf文件,相当于windows中的my.ini:找到[client] 添加:default-character-set = utf8 // 默认字符集为utf8找到[mysqld] 添加:# 默认字符集为utf8 default-character-set = u... 阅读全文
摘要:
一,查看磁盘状态这里简单介绍两个命令:df、du。df:df用来检查文件系统的磁盘空间占用情况。可以利用该命令来获取硬盘被占用了多少空间,目前还剩下多少空间等信息。 df的参数有:代码: -a显示所有文件系统的磁盘使用情况,包括0块(block)的文件系统,如/proc文件系统。 -k以k字节为... 阅读全文
2011年8月13日
摘要:
Ubuntu下安装LAMP及phpmyadmin关于Ubuntu下的LAMP配置,已经成为了某一些人的心病,加上phpmyadmin的配置,更是使他们不知所以。现在我就把我在LINUX 下的关于配置LAMP 及phpmyadmin 的一些经验,分享一下。希望对你有些帮助。我们首先要安装LAMP 就... 阅读全文
摘要:
Author:gaojinbo Time:2010-8-30 优点: 可以通过apache记录svn操作相关日志 环境: ubuntu 10.04.1 lts 64bit apache2.2 1.安装相关包 apt-get install apache2 libapache2-svn subver... 阅读全文
摘要:
2009-03-30 12:59:56|分类:技术|字号订阅1.安装sudo apt-get install ufw2.启用sudo ufw enablesudo ufw default deny运行以上两条命令后,开启了防火墙,并在系统启动时自动开启。关闭所有外部对本机的访问,但本机访问外部正常... 阅读全文
摘要:
vim号称类unix系统中的编辑利器,是Linux下一款很好用的编辑器,排在emac之后。因此值得好好研究一下首先谈下vim的安装,建议安装vim7.0以上,因为我在后面装插件的时候找不到对应vim6.0包。安装其实很简单,下载源代码包(vim-7.2.tar.bz2)下载地址:ftp://ftp... 阅读全文
2011年8月9日
摘要:
1.性能 Py3.0运行pystone benchmark的速度比Py2.5慢30%。Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好的优化结果。 Py3.1性能比Py2.5慢15%,还有很大的提升空间。 2.编码 Py3.X源码文件默认使用utf-8编码... 阅读全文
2011年8月2日
摘要:
模拟元素点击的几种方式最简单的莫过于使用click方法12所有浏览器都弹出了1。把input换成div呢12这次Safari/Chrome中没有弹出2。即不是所有浏览器中的所有元素都支持click方法。事实上只有input/button元素在所有浏览器才具有click方法。以上的事件都是直接添加在... 阅读全文
2011年7月31日
摘要:
先看两个示例,把下面两个url地址复制到你的浏览器的地址栏里,会得到一个mp3文件,然后播放你这个mp3文件。http://translate.google.com/translate_tts?q=我爱人民http://translate.google.com/translate_tts?tl=e... 阅读全文
2011年7月29日
摘要:
操作系统:Linux Cent OS 5 / Max OS X 10.6 snow leopard环境:Python2.6.4 Django1.1安装版本:Memcached 1.4.5django的缓存机制可以实在的提高程序的性能,其中最快速最直接的就要数内存缓存memcached了下面介绍一下... 阅读全文
2011年7月25日
摘要:
我们知道,Python 一大优势之一便是它的可扩展性,在此基础上衍生出了数量庞大的第三方扩展库, 在这里汇总一下自己接触过的库,方便下次查阅。1. eventlet地址:http://eventlet.net/ Eventlet is built around the concept of gr... 阅读全文
2011年7月19日
摘要:
附录1:django项目发布在apache服务器上Ps:以下内容参照:http://man.ddvip.com/linux/debian/apache2/http://www.51testing.com/html/10/9810-214211.html1、为下面软件安装的方便首先装一个新版的包管理... 阅读全文
2011年7月11日
摘要:
Linux下的Hadoop–分布式模式的部署实例修改浏览权限|删除Linux下的Hadoop--分布式模式的部署 选用软件版本:1. jdk 1.6.0.102. hadoop-0.19.11. 准备Host环境和配置ssh主节点IP是192.168.1.247,子节点1是192.168.1.3... 阅读全文
摘要:
在js中,为了进行浏览器兼容的处理,通常会进行浏览器特别是ie浏览器版本的检测,但是根据navigator.appVersion获取的msie值通常不准,使用jquery的$.browser.version通常也不准笔者的ie8.0用这两种方法检测出的msie值均为7,有一定的偏差,解决方案是,从... 阅读全文
2011年7月9日
摘要:
官方文档中文版http://hadoop.apache.org/common/docs/r0.19.2/cn/quickstart.html一个简单的例子http://blog.csdn.net/calvinxiu/article/details/1506112 阅读全文
摘要:
Map Reduce – the Free Lunch is not over?微软著名的C++大师Herb Sutter在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in... 阅读全文
2011年7月7日
摘要:
MySQL模糊查询语法MySQL提供标准的SQL模式匹配,以及一种基于象Unix实用程序如vi、grep和sed的扩展正则表达式模式匹配的格式。SQL的模式匹配允许你使用“_”匹配任何单个字符,而“%”匹配任意数目字符(包括零个字符)。在 MySQL中,SQL的模式缺省是忽略大小写的。下面显示一些... 阅读全文
摘要:
正文:一、简介1.1、概述随着WEB2.0及ajax思想在互联网上的快速发展传播,陆续出现了一些优秀的Js框架,其中比较著名的有Prototype、YUI、jQuery、mootools、Bindows以及国内的JSVM框架等,通过将这些JS框架应用到我们的项目中能够使程序员从设计和书写繁杂的JS... 阅读全文
摘要:
javascript控制页面控件隐藏显示的两种方法,方法的不同之处在于控件隐藏后是否还在页面上占位方法一:document.all["PanelSMS"].style.visibility="hidden";document.all["PanelSMS"].style.visibility="vi... 阅读全文
2011年7月6日
摘要:
Ubuntu文件系统和目录结构以下为Ubuntu目录的主要目录结构,您稍微了解它们都包含了哪些文件就可以了,不需要记忆。 / 根目录 │ ├boot/ 启动文件。所有与系统启动有关的文件都保存在这里 │ └grub/ Grub引导器相关的文件 │ ├dev/ 设备文件 ├proc/ 内核与进程镜像... 阅读全文
2011年7月2日
摘要:
VIM 中常用的替换模式总结。1,简单替换表达式替换命令可以在全文中用一个单词替换另一个单词::%s/four/4/g“%” 范围前缀表示在所有行中执行替换。最后的“g” 标记表示替换行中的所有匹配点。如果仅仅对当前行进行操作,那么只要去掉%即可如果你有一个象“thirtyfour” 这样的单词,... 阅读全文
摘要:
To trigger a download you need to set Content-Disposition header:from django.http importHttpResponsefrom django.core.servers.basehttp importFileWrapp... 阅读全文
摘要:
提纲为什么选用django选择JqueryFlex开发文件批量上传优化之路[any material that should appear in print but not on the slide]为什么选用django之前一直使用asp.net做些web应用,因为课题的原因,遇见了python... 阅读全文
摘要:
01.import os, tempfile, zipfile 02.from django.http import HttpResponse 03.from django.core.servers.basehttp import FileWrapper 04. 05. 06.def send_f... 阅读全文
摘要:
环境 : ubuntu能实现的包:sudo easy_install xlrd # 读取xls文件比较方便 缺点:不支持2007sudo easy_install pyExcelerator # 写入比较方便pywin32 # 功能强大 缺点:不垮平台 需要windows环境一个简单的例子:# -... 阅读全文
2011年6月23日
摘要:
在vim中,有时需要将tab转换成space。使用ret命令(replace tab)。[range]ret[ab]! [new-tabstop]举例:将第一行到文件尾的tab转换成space,每个tab用4个space替代。:set expandtab:%ret! 4如果没有给定4,则用当前的t... 阅读全文
2011年6月14日
2011年6月11日
摘要:
exactPerforms an exact match:>>> Entry.objects.get(headline__exact="Man bites dog")This matches any object with the exact headline Man bites dog.If y... 阅读全文