摘要: 第1列分钟1~59第2列小时1~23(0表示子夜)第3列日1~31第4列月1~12第5列星期0~6(0表示星期天)第6列要运行的命令 下面是crontab的格式:分 时 日 月 星期 要运行的命令 这里有crontab文件条目的一些例子: 30 21 * * * /usr/local/apache/ 阅读全文
posted @ 2017-04-26 15:58 kingrain 阅读(336) 评论(0) 推荐(0) 编辑
摘要: 1 rootdir = d:\data\ # 指明被遍历的文件夹 2 print rootdir 3 for parent, dirnames, filenames in os.walk(rootdir): # 三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字 4 for dirname in dirnames: ... 阅读全文
posted @ 2017-04-26 09:42 kingrain 阅读(612) 评论(0) 推荐(0) 编辑
摘要: PDFMiner python的PDF解析器和分析器 1.官方文档:http://www.unixuser.org/~euske/python/pdfminer/index.html 2.特征 完全使用python编写。 (适用于2.4或更新版本) 解析,分析,并转换成PDF文档。 PDF-1.7规 阅读全文
posted @ 2017-04-19 21:36 kingrain 阅读(13020) 评论(0) 推荐(0) 编辑
摘要: 1、Navicat下载地址:点击下载 2、pycharm激活 :点击链接地址 阅读全文
posted @ 2017-04-18 16:24 kingrain 阅读(300) 评论(0) 推荐(0) 编辑
摘要: mysql -u 用户名 -p 数据库名称 -h 数据库的ip 如:mysql -u testuser -p mydb -h 110.2.2.14 在Linux中启动mysql : service mysql start 阅读全文
posted @ 2017-04-18 15:03 kingrain 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 正则表达式学习链接 http://deerchao.net/tutorials/regex/regex.htm#greedyandlazy 1、删除任意空白字符(换行符,空字符等) 阅读全文
posted @ 2017-04-13 15:47 kingrain 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 具体实现方法如下: def addWord(theIndex,word,pagenumber): theIndex.setdefault(word, [ ]).append(pagenumber)#存在就在基础上加入列表,不存在就新建个字典key d = {"hello":[3]} #d = {} 阅读全文
posted @ 2017-04-13 10:02 kingrain 阅读(4820) 评论(0) 推荐(0) 编辑
摘要: #urllib2设置超时 #获取网页的源码 def getHtml(url,i): if i > 2: return try: req = urllib2.Request(url) time.sleep(1) req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT ... 阅读全文
posted @ 2016-03-18 11:33 kingrain 阅读(855) 评论(0) 推荐(0) 编辑