随笔分类 - python
摘要:山西 山西正在开会 True do something True 这里是静态变量 这里是静态方法 这里是静态变量 这里是静态方法,但可以用对象访问 True False call test
阅读全文
摘要:平时在工作中经常会用到os模块和sys模块的一些特性,下面是这些特性的一些相关解释,希望对大家有所帮助 os模块 os模块 sys模块 sys.argv 命令行参数List,第一个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0) sys.version 获取Python
阅读全文
摘要:说起python的装饰器,不了解的觉得很难,其实很简单,相当于javascript call 或者apply 来看例子: def outer(func): def wrapper(arg): print '你好' func(arg) #既然是函数就的加() print '他也好' return wr
阅读全文
摘要:相信很多人对xrange和yield都不是很清楚,网上很多文章也是写的云里雾里的,今天我用最简单的例子给大家说下。 说起xrange的时候就一定要提range,其实xrange 用法与 range 完全相同,所不同的是生成的不是一个list对象,而是一个生成器。 由上面的示例可以知道:要生成很大的数
阅读全文
摘要:在img目录下7张图片 分别是 11.jpg 22.jpg 33.jpg 44.jpg 55.jpg 66.jpg 77.jpg 在对应的文件下会创建thumbs 缩略图文件,然后 生成对应的缩略图,执行时间为: 0.109212875366
阅读全文
摘要:方法1: 在Debian/Ubuntu Linux下直接通过apt安装: $sudo apt-get install python-imaging Mac和其他版本的Linux可以直接使用easy_install或pip安装,安装前需要把编译环境装好: $sudo easy_intall PIL 或
阅读全文
摘要:Python find() 方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果包含子字符串返回开始的索引值,否则返回-1 find()函数语法:str.find(str, beg=0, end=len(string)) 参
阅读全文
摘要:# -*- coding: utf-8 -*- # from multiprocessing import Pool 多进程 from multiprocessing.dummy import Pool as ThreadPool import time import urllib2 urls = [ 'http://www.python.org', 'http://www....
阅读全文
摘要:转自:http://www.cnblogs.com/end/archive/2012/06/18/2553682.html 1.内置运算符1.1关系运算符 运算符 类型 说明 A = B 所有原始类型 如果A与B相等,返回TRUE,否则返回FALSE A == B 无 失败,因为无效的语法。 SQL
阅读全文
摘要:#Python的os.path模块提供了 isdir() 和 isfile()函数,请导入该模块,并调用函数判断指定的目录和文件是否存在。 import os print os.path.isdir(r'/data/webroot/resource/python') #存在则返回:true print os.path.isfile(r'/data/webroot/resource/pyth...
阅读全文
摘要:在Python中定义函数,可以用必选参数、默认参数、可变参数和关键字参数,这4种参数都可以一起使用,或者只用其中某些,但是请注意, 参数定义的顺序必须是:必选参数、默认参数、可变参数和关键字参数。 请看实例代码: 总结: 要注意定义可变参数和关键字参数的语法: *args是可变参数,args接收的是
阅读全文
摘要:方法1tmp_channel_hive_file="/tmp/tmp_channel_hive_file"tmp_channel_hive_file_new="/tmp/tmp_channel_hive_file_new"db="t_merchant_shop_channel_top_daily_n
阅读全文
摘要:有两个文件一个是 文件1:sync_shop_source_bimer.sh 文件2:sync_shop_source_bimer.py 在sync_shop_source_bimer.sh 中调用sync_shop_source_bimer.py 文件1中产生的文件要传递给文件2 文件1中的内容
阅读全文
摘要:python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。 基本接口: pickle.dump(obj, file, [,prot
阅读全文
摘要:第一种方法 第二种方法 第三种方法,逐行读取 另外的一些注意: 文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个
阅读全文
摘要:使用xpath多线程爬取百度贴吧内容 #encoing=utf-8 from lxml import etree from multiprocessing.dummy import Pool as ThreadPool import requests import json import sys r
阅读全文
摘要:xpath的多线程爬虫 #encoding=utf-8 ''' pool = Pool(4) cpu的核数为4核 results = pool.map(爬取函数,网址列表) ''' from multiprocessing.dummy import Pool as ThreadPool import
阅读全文
摘要:爬取网页内容的时候,往往网页标签比较复杂,对于这种情况,需要用xpath的starts-with和string(.)功能属性来处理,具体看事例 #encoding=utf-8 from lxml import etree html1 = ''' <!DOCTYPE html> <html> <hea
阅读全文
摘要:1、如果你没有安装lxml,请运行pip install lxml或者easy_install lxml安装,如果在安装过程中失败的话, 是因为lxml需要依赖某些库文件,具体可以问下度娘,这里不再赘述。 2、安装成功后,请看下面测试代码 //:定位根节点/:往下层寻找/text(): 提取文本内容
阅读全文
摘要:#encoding=utf-8 class Tree(): def __init__(self,leftjd=0,rightjd=0,data=0): self.leftjd = leftjd self.rightjd = rightjd self.data = data class Btree()
阅读全文