代码改变世界

pandas dataframe.apply() 实现对某一行/列进行处理获得一个新行/新列

2018-01-24 20:30  ZealouSnesS  阅读(41469)  评论(0编辑  收藏  举报

重点:
dataframe.apply(function,axis)对一行或一列做出一些操作(axis=1则为对某一列进行操作,此时,apply函数每次将dataframe的一行传给function,然后获取返回值,将返回值放入一个series)
python去空格:字符串.strip()

待解决:
dataframe.assign()应该怎么用?

(1)读入数据后先把 城市 那一列城市名中的空格去掉

对一列数据去空格的方法:

def qukong(hang):
return hang['city'].strip()
dataframe['city']=dataframe.apply(qukong,axis=1) # axis=1表示对每一行做相同的操作
dataframe

###dataframe.apply用于对一行或一列做一些相同的操作

(2)调用百度地图API查询各城市经纬度(查询出的结果我们用dict保存)

def p2l(name):
# 1、设置url和3个参数(输出格式,key,要翻译的地址)
url = 'http://api.map.baidu.com/geocoder/v2/'
output = 'json'
ak = 'sXZHPZahdMeK3Gy3uC7ZeRQrVbZDnP1G'
address = quote(name)

# 2、拼接get请求(url?参数1=值1&参数2=值2&参数3=值3)
request = url + '?' + 'address=' + address + '&output=' + output + '&ak=' + ak

# 3、urlopen发送请求,获得response
response_file = urlopen(request)

# 4、读取response字符串
response_str = response_file.read().decode()

# 5、str转json
response_json = json.loads(response_str)

# 6、读json
lat=response_json['result']['location']['lat']
lng=response_json['result']['location']['lng']

return [lat,lng]

list_place=list(set(dataframe['city']))
dict_loc={}
for elem in list_place:
dict_loc[elem]=p2l(elem)
dict_loc


(3)将查询到的经纬度放入dataframe中
def add_lat(hang):
return dict_loc[hang['city']][0]

def add_lng(hang):
return dict_loc[hang['city']][1]

dataframe['city_lat']=dataframe.apply(add_lat,axis=1)
dataframe['city_lng']=dataframe.apply(add_lng,axis=1)

(4)从dataframe的日期一列中提取出 年、月、日 三个新列
def add_year(hang):
date=hang['date']
tmplist=date.split('/')
return tmplist[0]

def add_month(hang):
date=hang['date']
tmplist=date.split('/')
return tmplist[1]

def add_day(hang):
date=hang['date']
tmplist=date.split('/')
return tmplist[2]

dataframe['year']=dataframe.apply(add_year,axis=1)
dataframe['month']=dataframe.apply(add_month,axis=1)
dataframe['day']=dataframe.apply(add_day,axis=1)

(5)获取星期几
from datetime import datetime,date

dayOfWeek = datetime.now().weekday()
print dayOfWeek

dayOfWeek = datetime.today().weekday()
print dayOfWeek
datetime类的weekday()方法可以获得datetime是星期几,注意weekday() 返回的是0-6是星期一到星期日