pandas 使用问题记录
最近需要使用pandas做模拟数据生成和输出
就从0学python,再写点pandas的damo,遇到的问题记录一哈
python字符串拼接:
不同于java可以直接s=“a”+1,python需要把数字转成str
step=1
进入终端,下载demjson,输入命令:
git clone https://github.com/dmeranda/demjson.git
cd demjson/
python setup.py install
报错:error,Permission denied...
解决方法:
su root
输入密码,进入root权限,重新安装,python setup.py install
再试着导入
问题3:aconda安装后需要配置path
"C:\Users\dell\Anaconda3"
和"C:\Users\dell\Anaconda3\Scripts"
dateutil
因为需要自己造一个一年份的数据,每天一条,dateutil里的方法很适合:start=start+datetime.timedelta(days=1)
这个包里的datetime的生成:start = datetime.datetime.strptime("01-04-2021", "%d-%m-%Y")
格式化:
start.strftime("%Y-%m-%d")
List
获取最后一个元素:a[-1]或者a[len(a)-1]
dataframe的一列转list:df['aqiLevel'].tolist()
创建空list:list1=[]或list=list1()
Python的list的子列不能用list.sublist(a,b)求
DICT
PYTHON的dict,应该就类似于java的map
但是有局限性,map可以随意add,dict并不行
空值问题
java中对象的null
我目前主要使用None赋值给空对象,例如字典的某个key的value为java意义上的null,我给None
判断的时候 xx is None,即可知道这个key的value无值
定时任务
pandas写excel的问题
1.excel无法在程序运行时生成,我不知道是不是我知识少的问题,查了一圈没啥收获,在程序没跑完之前,文件一直没在,csv也存在这个问题,尝试加了writer.close也没用
2.excel写入多个sheet的方法:dff.to_excel(writer, sheet_name=filename,startrow=int(dictNumber[key])+1)
3.至于追加写入,写入csv是个比较好的做法,把model改成a即可,pandas原生追加写入在程序执行定时任务时目前看几乎不可能,openxyl目前没探索了
4.pandas筛选某列值相同的列dict[str]=df.loc[(df['code']==str)]
dataframe写入mysql
engine = create_engine('mysql+mysqldb://root:123456@localhost:3306/python?charset=utf8')
try:
con=engine.connect()
df.to_sql(name='stock',con=con,if_exists='append',index=False)
需要保证table的列和dataframe的列一致:列名,数据类型都一致
set和list互转