Processing math: 0%

10 2015 档案

摘要:特此声明: 以下内容来源于博主:http://blog.csdn.net/pleasecallmewhy http://cuiqingcai.com/ 根据需要整理到自己的笔记中,用于学习。 网页抓取:把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在python中,使用urllib2 阅读全文
posted @ 2015-10-31 22:44 邬家栋 阅读(1727) 评论(0) 推荐(0) 编辑
摘要:特此声明: 以下内容来源于博主:http://blog.csdn.net/pleasecallmewhy http://cuiqingcai.com/ 根据需要整理到自己的笔记中,用于学习。 网络爬虫(Web crawler):也叫网络蜘蛛(Web spider),网络爬虫的基本操作就是抓取网页。 阅读全文
posted @ 2015-10-31 21:46 邬家栋 阅读(249) 评论(0) 推荐(0) 编辑
摘要:例1:用python程序将DNA的一条链翻译出来s1=’ATTACGGC‘ 此题感谢 每天一题目Python 的帮助得以解决 例2: 阅读全文
posted @ 2015-10-31 20:30 邬家栋 阅读(132) 评论(0) 推荐(0) 编辑
摘要:方法一:使用aggregate()分组获取描述性统计量1 aggregate(mtcars[vars],by=list(am=mtcarsam),mean)2 aggregate(mtcars[vars],by=list(mtcarsam),mean)3 aggregate(mtcars[var... 阅读全文
posted @ 2015-10-31 16:25 邬家栋 阅读(2302) 评论(0) 推荐(0) 编辑
摘要:数据的分布特征:分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度(平均数,中位数,四分位数,众数)分布的离散程度,反应各数据远离其中心值的趋势(极差,四分位差,方差,标准差,离散系数)分布的形状,反应数据分布的偏斜程度和峰度(偏态系数,峰度系数)#######################平均... 阅读全文
posted @ 2015-10-30 22:27 邬家栋 阅读(9357) 评论(0) 推荐(0) 编辑
摘要:例如:打印出16的平方根 查看模块里的函数 例2: 阅读全文
posted @ 2015-10-30 20:33 邬家栋 阅读(176) 评论(0) 推荐(0) 编辑
摘要:1 字符串中某元素计数 2 字符串替换 3 字符串反向输出【注意python最右端是开区间】 例1:计算碱基A,T,G,C的数量 s='ATGCATGCCGTAATGCGCTA' 例2:将DNA连中的T碱基替换成RNA链中的U碱基 replace():字符串替换 语法:str.replace('ol 阅读全文
posted @ 2015-10-28 14:14 邬家栋 阅读(346) 评论(0) 推荐(0) 编辑
摘要:if循环:有条件的执行,做出选择 例1: 例2: 例3 例4(if嵌套) 例5 分数分等级 0~60为no pass,60~70just pass,70~80good,80~90better,90~100best while循环:重复某个功能多次 循环变量初始化(开始)——第一步 循环条件(给出终止 阅读全文
posted @ 2015-10-27 23:21 邬家栋 阅读(255) 评论(0) 推荐(0) 编辑
摘要:qplot()函数 一年前就听说过ggplot,很多人都说ggplot强大,ggplot无所不能,从今天开始就让我们一起来见证一下这个神奇的R包。首先要加载ggplot2:1 if(!suppressWarnings(require('ggplot2'))){2 install.packa... 阅读全文
posted @ 2015-10-26 17:35 邬家栋 阅读(1338) 评论(0) 推荐(0) 编辑
摘要:R批量读取txt文件 本文数据,代码都是参考的是大音如霜公众号,只是自己跟着做了一遍. 1 path<-'C:\\Users\\Administrator\\Desktop\\docs' 2 docs<-dir(path) #completepath<-apply(docs,function... 阅读全文
posted @ 2015-10-25 21:17 邬家栋 阅读(6523) 评论(0) 推荐(0) 编辑
摘要:学习网站 1 搜索引擎歌图: http://www.googto.com/2 数据分析网站牛吧大数据:http://www.niubua.com/36 大数据 :http://www.36dsj.com/雪晴数据网: http://www.xueqing.cc/3 他人博客 生物信息糗世界: ... 阅读全文
posted @ 2015-10-25 14:50 邬家栋 阅读(331) 评论(0) 推荐(0) 编辑
摘要:R3.2.2版安装ggplot2 今天安装ggplot2,开始用的是R3.2.1版本,但是一直报错。后面换了一个最新的R3.2.2,但安装时还是一样报错,原因是munsell这个包的不兼容问题,后面找到解决这个问题的方法是本地zip安装munsell包:具体做法如下: 将原来没安装成功的ggp... 阅读全文
posted @ 2015-10-25 14:41 邬家栋 阅读(4617) 评论(0) 推荐(0) 编辑
摘要:set.seed()函数 set.seed()设定生成随机数的种子,让样本可重复。 1 > x x 3 [1] 0.6599492 0.5881863 -1.9215553 -0.9161720 4 > y y 6 [1] -0.8496265 -2.5471568 0.5650117 ... 阅读全文
posted @ 2015-10-25 14:36 邬家栋 阅读(920) 评论(0) 推荐(0) 编辑
摘要:sample()函数 sample(x,size,replace=FALSE)x表示一个或多个向量,size表示从x中随机取的样本个数,replace=FALSE表示不放回抽样,即不会选取到相同的值1 > x sample(x,8,replace = FALSE)# 不放回抽样3 [1] 5... 阅读全文
posted @ 2015-10-25 14:14 邬家栋 阅读(3145) 评论(0) 推荐(0) 编辑
摘要:读取csv格式数据 数据来源是西南财经大学 司亚卿 老师的课程作业方法一:read.csv()函数1 file.choose()2 read.csv("C:\\Users\\Administrator\\Desktop\\Astocks.csv",3 head=T,sep='... 阅读全文
posted @ 2015-10-25 13:55 邬家栋 阅读(18485) 评论(0) 推荐(0) 编辑
摘要:一变量 1创建变量:d=4 表示将整型对象‘4’赋值给变量d 记住:一切数据都是对象 记住:一切变量都是数据对象的一个引用 分析:Python内部的引用计数。sys.getrefcount 2变量命名规范: (1)只能用字母和下划线 (2)不能用关键字如if等 (3)大小写敏感 3赋值: 记住多态特 阅读全文
posted @ 2015-10-04 23:10 邬家栋 阅读(196) 评论(0) 推荐(0) 编辑
摘要:列表 1有序的集合 2通过偏移来索引,从而读取数据 3支持嵌套 4可变的类型 a=[1,2,3] print(a[-1]) 结果 3 b=[[1,2,3],[4,5,6]] print(b) 结果[[1, 2, 3], [4, 5, 6]] print(b[0]) 结果[1, 2, 3] print 阅读全文
posted @ 2015-10-04 22:55 邬家栋 阅读(227) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示