随笔分类 - Python
Python基础
摘要:pandas有两种自己独有的基本数据结构Series和DataFrame Series DataFrame DataFrame几要素:index、columns、values等 获取数据 修改数据 汇总统计 应用函数和映射 参考资料 1)10 Minutes to pandas: http://pa
阅读全文
摘要:NumPy学习(1) 参考资料: 1. http://www.cnblogs.com/zhanghaohong/p/4854858.html 2. http://linusp.github.io/2016/02/25/creation and io of ndarray.html 数组的创建 数组属
阅读全文
摘要:第一步:将下载好的Anaconda2-4.1.1-Linux-x86_64.sh软件传到linux下 第二步:[hadoop@spark1 ~]cd Desktop #进入到该软件所在目录,我的放在了Desktop目录下 第三步:[hadoop@spark1 Desktop] bash Ana
阅读全文
摘要:以前一直用ubantu下的python,ubantu比较卡。自己倾向于使用centos,但默认的python版本太低,所以重新装了一个python和ipython centos6.5安装python2.7.9 第一步:安装devtoolset [root@spark1 ~]# yum groupin
阅读全文
摘要:类和对象 面向过程的编程:C 面向对象的编程:C++,JAVA,Python 类:对事物的抽象,如汽车模型 对象:类的一个实例。如大客车 python类定义:使用class关键字定义一个类,并且类名首字母要大写。在类中可以定义一些变量(属性)和函数(方法) #将需要的变量和函数组合在一起,也称之为‘
阅读全文
摘要:初步爬取糗事百科第一页段子(发布人,发布内容,好笑数和评论数) 对上面正则表达式略作解释: (1).*? 是固定搭配 (2)(.*?)代表一个分组,能将每一个括号里匹配的内容输出到终端。如第一个item[0]代表第一个分组即发布人。 (3)re.S代表在匹配时为点任意匹配模式 爬取部分结果如下: 正
阅读全文
摘要:博客地址:http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html 爬第一页博文 部分结果如下: 所遇到的问题:1爬取的结果多了两个,第一个和最后一个不是所要的内容? 2 输出结果的时候用print(i[0],i[1])出现乱码,这是为什么?
阅读全文
摘要:函数基础 定义函数使用def语句,依次写出函数名、括号、括号中的参数和冒号: 然后在缩进中编写函数体,返回值用return语句返回 计算字符串中某字符个数 计算子串sub个数 找最大值 找第二大值 删除某个值 删除所有的值
阅读全文
摘要:列表基础 列表定义:一有序数据集合用逗号间隔用方括号括起来 列表的索引访问(索引list_name[index]和切片list_name[start:end:step]) 列表遍历 理解for迭代 列表里的最大值 找第二大值 方法二: 列表运算 列表加法 打印多层列表 index函数 index函数
阅读全文
摘要:字符串基础 1 字符串定义:用引号引起来的字符集合称之为字符串(单引号,双引号,三双引号,三单引号) 三引号(三单或三双)支持多行或也可表示注释,而单双引只能一行(但是可以加\n) 2 转义字符串: 常见有 \n 回车字符, \t 下一制表位 \'' 双引号 \' 单引号 \\ 输出斜杠 \b 往前
阅读全文
摘要:特此声明: 以下内容来源于博主:http://www.cnblogs.com/huxi/ http://blog.csdn.net/pleasecallmewhy http://cuiqingcai.com/ 根据需要整理到自己的笔记中,用于学习。 正则表达式基础 re模块(Python通过re模块
阅读全文
摘要:URLerror产生原因: 网络未连接(即不能上网) 服务器不存在 报错情况: 下面我们对可能出现异常进行处理,一般通过try-except语句来包围并捕获相应的异常。我们先尝试一下: 常用另一种: 异常处理的终极完整形态 HTTPError 在你利用urlopen方法发出一个请求时,服务器上都会对
阅读全文
摘要:特此声明: 以下内容来源于博主:http://blog.csdn.net/pleasecallmewhy http://cuiqingcai.com/ 根据需要整理到自己的笔记中,用于学习。 网页抓取:把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在python中,使用urllib2
阅读全文
摘要:特此声明: 以下内容来源于博主:http://blog.csdn.net/pleasecallmewhy http://cuiqingcai.com/ 根据需要整理到自己的笔记中,用于学习。 网络爬虫(Web crawler):也叫网络蜘蛛(Web spider),网络爬虫的基本操作就是抓取网页。
阅读全文
摘要:例1:用python程序将DNA的一条链翻译出来s1=’ATTACGGC‘ 此题感谢 每天一题目Python 的帮助得以解决 例2:
阅读全文
摘要:1 字符串中某元素计数 2 字符串替换 3 字符串反向输出【注意python最右端是开区间】 例1:计算碱基A,T,G,C的数量 s='ATGCATGCCGTAATGCGCTA' 例2:将DNA连中的T碱基替换成RNA链中的U碱基 replace():字符串替换 语法:str.replace('ol
阅读全文
摘要:if循环:有条件的执行,做出选择 例1: 例2: 例3 例4(if嵌套) 例5 分数分等级 0~60为no pass,60~70just pass,70~80good,80~90better,90~100best while循环:重复某个功能多次 循环变量初始化(开始)——第一步 循环条件(给出终止
阅读全文
摘要:一变量 1创建变量:d=4 表示将整型对象‘4’赋值给变量d 记住:一切数据都是对象 记住:一切变量都是数据对象的一个引用 分析:Python内部的引用计数。sys.getrefcount 2变量命名规范: (1)只能用字母和下划线 (2)不能用关键字如if等 (3)大小写敏感 3赋值: 记住多态特
阅读全文