Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中DataFrame.to_sql方法的使用。
DataFrame.to_sql (name,con,schema = None,if_exists ='fail',index = True,index_label = None,chunksize = None,dtype = None ) [source]
将存储在DataFrame中的记录写入SQL数据库。
支持SQLAlchemy [R16]支持的数据库。可以新创建,附加或覆盖表。
参数: |
name:string SQL表的名称。 con:sqlalchemy.engine.Engine或sqlite3.Connection 使用SQLAlchemy可以使用该库支持的任何数据库。 为sqlite3.Connection对象提供了旧版支持。 schema:string,optional 指定架构(如果数据库支持)。如果为None,请使用默认架构。 if_exists:{'fail','replace','append'},默认'fail' 如果表已存在的情况如下,
index:布尔值,默认为True 将DataFrame索引写为列。使用index_label作为表中的列名。 index_label:字符串或序列,默认为None 索引列的列标签。如果给出None(默认)且 index为True, 则使用索引名称。 如果DataFrame使用MultiIndex,则应该给出一个sequence。 chunksize:int,可选 行将一次批量写入的数量。默认情况下,所有行都将立即写入。 dtype:dict,可选 指定列的数据类型。键应该是列名,值应该是SQLAlchemy类型, 或sqlite3传统模式的字符串。 |
异常: |
ValueError异常 当表已经存在且if_exists为'fail'时(默认值)。 |
例如,
1)创建内存中的SQLite数据库
>>> from sqlalchemy import create_engine
>>> engine = create_engine('sqlite://', echo=False)
2)从头开始创建一个包含3行的表
>>> df = pd.DataFrame({'name' : ['User 1', 'User 2', 'User 3']})
>>> df
name
0 User 1
1 User 2
2 User 3
>>> df.to_sql('users', con=engine)
>>> engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 1'), (1, 'User 2'), (2, 'User 3')]
>>> df1 = pd.DataFrame({'name' : ['User 4', 'User 5']})
>>> df1.to_sql('users', con=engine, if_exists='append')
>>> engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 1'), (1, 'User 2'), (2, 'User 3'),
(0, 'User 4'), (1, 'User 5')]
3)用df1覆盖表
>>> df1.to_sql('users', con=engine, if_exists='replace',
... index_label='id')
>>> engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 4'), (1, 'User 5')]
4)指定dtype(对于具有缺失值的整数很有用)。请注意,虽然pandas被强制将数据存储为浮点数,但数据库支持可空整数。使用Python获取数据时,我们会返回整数标量。
>>> df = pd.DataFrame({"A": [1, None, 2]})
>>> df
A
0 1.0
1 NaN
2 2.0
>>> from sqlalchemy.types import Integer
>>> df.to_sql('integers', con=engine, index=False,
... dtype={"A": Integer()})
>>> engine.execute("SELECT * FROM integers").fetchall()
[(1,), (None,), (2,)]
https://www.cjavapy.com/article/158/
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· Blazor Hybrid适配到HarmonyOS系统
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 解决跨域问题的这6种方案,真香!
· 一套基于 Material Design 规范实现的 Blazor 和 Razor 通用组件库
· 数据并发安全校验处理工具类