摘要: list数据类型还有更多的方法。这里是list对象的所有方法: 添加一个元素到列表的末尾;相当于a[len(a):] = [x]。 将指定列表中的所有元素附加到另一个列表的末尾;相当于a[len(a):] = L。 在给定位置插入一个元素。第一个参数是插入的元素的索引,所以 a.insert(0,  阅读全文
posted @ 2017-04-19 11:25 Mars.wang 阅读(246) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: UTF-8 -*- from pyquery import PyQuery as pq import re from datetime import datetime,timedelta import pymysql import sys reload(sys) sys.setdefaultencoding('utf8') def data_ana(item): ... 阅读全文
posted @ 2017-03-15 17:09 Mars.wang 阅读(232) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: UTF-8 -*- import re from bs4 import BeautifulSoup import requests import codecs import sys reload(sys) sys.setdefaultencoding('utf8') def mei_url(): url = 'http://mdl.com/prod... 阅读全文
posted @ 2017-03-15 16:59 Mars.wang 阅读(438) 评论(0) 推荐(0) 编辑
摘要: Python爬虫入门六之Cookie的使用 阅读全文
posted @ 2017-03-15 11:21 Mars.wang 阅读(174) 评论(0) 推荐(0) 编辑
摘要: #POST import urllib import urllib2 values = {} values['username'] = "1016903103@qq.com" values['password'] = "XXXX" data = urllib.urlencode(values) url = "http://passport.csdn.net/account/login?fro... 阅读全文
posted @ 2017-03-15 11:20 Mars.wang 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 一.获取当前日期 二.日期格式化 1.datetime转换为str 2.str转换为datetime 3.datetime转换为timestamp 4.timestamp转换为datetime 三.日期加减 本文转自廖雪峰老师的python教程 阅读全文
posted @ 2017-03-14 11:05 Mars.wang 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 正则表达式是对字符串的最简约的规则的表述。python也有专门的正则表达式模块re. 输出结果: 阅读全文
posted @ 2017-03-14 10:31 Mars.wang 阅读(954) 评论(0) 推荐(0) 编辑
摘要: 转载自:静觅 » Python爬虫入门七之正则表达式 阅读全文
posted @ 2017-03-13 18:04 Mars.wang 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 做数据分析的同学大部分入门都是从excel开始的,excel也是微软office系列评价最高的一种工具。 但当数据量超过百万行的时候,excel就无能无力了,python第三方包pandas极大的扩展excel的功能,入门需要花费一点时间,但是真的是做大数据的必备神器! 1.从文件读数据 panda 阅读全文
posted @ 2017-03-13 17:55 Mars.wang 阅读(3496) 评论(0) 推荐(0) 编辑
摘要: IO指输入输出,本文主要描述的是python对于文件的操作。 这是写文件,a+指新内容写在目标文件的尾部。 file.read()是读文件,很多时候文件较大,不知道多少行,不能一下子都读进内存,最好是一行一行读。就用到了file.readline() 下面是所有读写文件的模式。 阅读全文
posted @ 2017-03-13 16:53 Mars.wang 阅读(186) 评论(0) 推荐(0) 编辑