摘要:
1.用qplot(x,data=data,geom.=”bar”,weight=y)+scale_y_continuous("y")画出y关于x的条形。 图中提示binwidth这里是指矩形的宽度,指定之后如下 2.用qplot(x,data=data,geom.=”bar”)画出来的是频率直方图, 阅读全文
摘要:
1.创建新项目上传 可能会遇到的问题 a.如果是首次使用,会提示你先设置好用户名和邮箱,可以在 cmd 中输入: git config --global user.email "you@example.com" git config --global user.name "Your Name" b. 阅读全文
摘要:
1.添加列名 wts=c(1,1,1) names(wts)=c("setosa","versicolor","virginica") 2.为矩阵添加列名和行名 wts=matrix(0,3,4) row=c("row1","row2","row3") column=c("setosa","vers 阅读全文
摘要:
先查看所用到表的内容 select * from yhb; 期望效果 将times为1的isdropout列的字符串连接起来 isdropout times 是,否,是 1 1.用wmsys.wm_concat(exp1)函数 sql语句如下: select wmsys.wm_concat(a.is 阅读全文
摘要:
1、关键点 综述:主成分分析 因子分析 典型相关分析,三种方法的共同点主要是用来对数据降维处理的从数据中提取某些公共部分,然后对这些公共部分进行分析和处理。 #主成分分析 是将多指标化为少数几个综合指标的一种统计分析方法 主成分分析是一种通过降维技术把多个变量化成少数几个主成分的方法,这些主成分能够 阅读全文
摘要:
高维数据的重要属性: 数据集的大小随着维数呈指数级增长。 在高维样本空间中,需要一个更大的数据才能把小部分的数据放入。 在高维度空间中,几乎每一个点都比其他样本点更接近于某一边界。 几乎每一个点都是异常点。 随着维数的增加,数据密度会越来越小,稀疏。如果样本没增加,只是增加维数,就会导致最终任意两个 阅读全文
摘要:
因为我是用yum安装的mysql,所以卸载相对简单 yum -y remove mysql* 再把相关的文件删掉, rm -f /etc/my.cnf.rpmsave rm -rf /var/lib/mysql/ rm -rf /var/log/mysqld.log.rpmsave 至此,卸载完毕。 阅读全文
摘要:
rowkey是行的主键,而且hbase只能用rowkey范围即scan来查找数据。rowkey是以字典排序的。可以巧妙设计行键,比如想通过电影的评价进行排序,可以把评分rate和电影id组合起来,rate_id这样的形式来实现排序。 做个小推广:程序员经常久坐,颈椎毛病比较多,特别推荐ventry颈 阅读全文
摘要:
password应该都是经过加密的,设置密码的时候要使用password函数,如password('dacheng') grant 权限 on 数据库.* to 用户名@登录主机 identified by "密码"; 例如: grant all privileges on testDB.* to 阅读全文
摘要:
1.到官网上下载jdbc驱动,我下载的是mysql-connector-java-5.0.8.tar.gz 2.解压下载到的文件 tar -zxvf mysql-connector-java-5.0.8.tar.gz 3.将解压出来的jar包放到/usr/java/jdk1.7.0/jre/lib/ 阅读全文