Pandas dataframe数据写入文件和数据库
Pandas是Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作,DataFrame是一张多维的表,大家可以把它想象成一张Excel表单或者Sql表。之前这篇文章已经介绍了从各种数据源将原始数据载入到dataframe中,这篇文件介绍怎么将处理好的dataframe中的数据写入到文件和数据库中。
首先我们通过二维ndarray创建一个简单的DataFrame:
1
2
3
4
5
6
7
8
|
import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(3, 4)) df 0 1 2 3 0 1.0492286140081302 -0.7922606407983686 0.020418054868760225 -1.6649819403741724 1 0.3485250628814134 -2.117606544377745 1.466822878437205 -0.9249205656243358 2 1.3073567907490637 -0.7350348086218035 0.2856083175408006 -0.9053483976251634 |
1. Dataframe写入到csv文件
1
|
df .to_csv( 'D:\\a.csv' , sep= ',' , header=True, index=True) |
第一个参数是说把dataframe写入到D盘下的a.csv文件中,参数sep表示字段之间用’,’分隔,header表示是否需要头部,index表示是否需要行号。
2. Dataframe写入到json文件
1
|
df .to_json( 'D:\\a.json' ) |
把dataframe写入到D盘下的a.json文件中,文件的内容为
1
|
{ "0" :{ "0" :1.049228614, "1" :0.3485250629, "2" :1.3073567907}, "1" :{ "0" :-0.7922606408, "1" :-2.1176065444, "2" :-0.7350348086}, "2" :{ "0" :0.0204180549, "1" :1.4668228784, "2" :0.2856083175}, "3" :{ "0" :-1.6649819404, "1" :-0.9249205656, "2" :-0.9053483976}} |
3.Dataframe写入到html文件
1
|
df .to_html( 'D:\\a.html' ) |
把dataframe写入到D盘下的a.html文件中,文件的内容为
1
|
< table border = "1" class = "dataframe" >\n < thead >\n < tr style = "text-align: right;" >\n < th ></ th >\n < th >0</ th >\n < th >1</ th >\n < th >2</ th >\n < th >3</ th >\n </ tr >\n </ thead >\n < tbody >\n < tr >\n < th >0</ th >\n < td >1.049229</ td >\n < td >-0.792261</ td >\n < td >0.020418</ td >\n < td >-1.664982</ td >\n </ tr >\n < tr >\n < th >1</ th >\n < td >0.348525</ td >\n < td >-2.117607</ td >\n < td >1.466823</ td >\n < td >-0.924921</ td >\n </ tr >\n < tr >\n < th >2</ th >\n < td >1.307357</ td >\n < td >-0.735035</ td >\n < td >0.285608</ td >\n < td >-0.905348</ td >\n </ tr >\n </ tbody >\n</ table > |
在浏览器中打开a.html的样式为
4.Dataframe写入到剪贴板中
这个是我认为最为贴心的功能, 一行代码可以将dataframe的内容导入到剪切板中,然后可以复制到任意地方
1
|
df .to_clipboard() |
5.Dataframe写入到数据库中
1
|
df .to_sql( 'tableName' , con=dbcon, flavor= 'mysql' ) |
第一个参数是要写入表的名字,第二参数是sqlarchmy的数据库链接对象,第三个参数表示数据库的类型,“mysql”表示数据库的类型为mysql。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
2019-03-08 Spring @Import注解 —— 导入资源