pandas+sqlAlchemy操作数据库

I. sqlalchemy创建mysql连接

点击查看代码

from sqlalchemy import create_engine
import pandas as pd
engine = create_engine(*args, **kwargs)

标准调用方式是将URL作为第一个位置参数
形如``dialect[+driver]://user:password@host/dbname[?key=value..]``

dialect    数据库类型, 如'mysql', 'oracle'
driver     DBAPI的名字, 如'mysqlconnector', 'pymysql' 
           (安装第一个库: pip install mysql-connector-python)
user       用户名, 一般为root
password   密码
host       IP, 本地连接的话为'localhost'
dbname     要连接的数据库的名字

举例：

点击查看代码

from sqlalchemy import create_engine
import pandas as pd
# 创建数据库连接对象
win_user = 'root'  # 数据库用户名
win_password = '123456'  # 数据库密码
win_host = 'localhost'  # 数据库ip地址
win_port=3306  # 端口号
win_test = test  # 数据库
engine = create_engine(f'mysql+pymysql://{win_user}:{win_password}@{win_host}:{win_port}/{win_test}', echo=True)

# sql语句
sql = 'SELECT * FFROM test'
# 通过pandas读取数据
data = pd.read_sql(sql,engine)
# 数据进行处理

# 处理好的数据写入到数据库
data.to_sql('表名', engine)  # 表不存在直接创建

read_sql()

参数：

pandas.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, chunksize=None)

sql: SQL命令字符串

con: 连接sql数据库的engine，一般可以用SQLalchemy或者pymysql之类的包建立

index_col: 选择某一列作为index

coerce_float: 将数字形式的字符串直接以float型读入

parse_dates: 将某一列日期型字符串转换为datetime型数据，与pd.to_datetime函数功能类似。可以直接提供需要转换的列名以默认的日期形式转换，也可以用字典的格式提供列名和转换的日期格式，比如{column_name: format string}（format string："%Y:%m:%H:%M:%S"）。

columns: 要选取的列。一般没啥用，因为在sql命令里面一般就指定要选择的列

chunksize： 如果提供了一个整数值，那么就会返回一个generator，每次输出的行数就是提供的值的大小。

to_sql()

参数：

data.to_sql(name, con, schema=None, if_exists="fail", index=True, index_label=None, chunksize=None, dtype=None, method=None)

name: 要写入表的名字

con: 创建数据库连接的对象。

schema: 用于创建数据库对象，基本上都是使用默认值。

if_exists：如果表存在怎么办?

fail：抛出ValueError异常、
replace：在插入数据之前删除表。注意不是仅删除数据，是删除原来的表，重新建表.
append：插入新数据。如果有主键，要避免主键冲突；看清表的格式，DataFrame的columns与表的columns是对应的；DF的index默认是作为一列数据的，也就是说默认会写入数据库的，

index: 将索引作为一列写入数据库，默认为True,也就是说默认DF的索引是要写入数据库的，index_label为列名

index_label: 将索引写入数据库时的列名，默认为index；如果DF是多级索引，则index_label应为一个序列

chunksize: 批处理，每次处理多少条数据。默认全部，一般没啥用，除非数据量太大，明显感觉卡的时候可以分批处理。

dtype: 一个字典，指定列的数据类型。键是列的名字，值是sqlalchemy types或者sqlite3的字符串形式。如果是新建表，则需要指定类型，不然会以存储量最大类型作为默认类型。比如varchar类型就会成为text类型，空间资源浪费很多。如果是添加数据，则一般不需要规定该参数。

method：哪种类型的插入语句？

None: 默认单行插入
multi: 多行插入
callable: 以回调函数插入

__EOF__

本文作者：Jasmine
本文链接：https://www.cnblogs.com/Jasmine6-Lee/p/16485311.html
关于博主：评论和私信会在第一时间回复。或者直接私信我。
版权声明：本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主：如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力！

posted @ 2022-07-16 21:40 Jasmine_Lee 阅读(595) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· sql查询 —— 分组

· PySpark Functions

· python 使用sqlalchemy 操作数据库

· Python 操作MySQL

· SQLAlchemy的数据库引擎

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」

公告

pandas+sqlAlchemy操作数据库

发表于 2022-07-16 21:40阅读：595评论：0推荐：0

Python

关注

跳至底部

昵称： Jasmine_Lee
园龄： 5年
粉丝： 3
关注： 4

+加关注

白云~

pandas+sqlAlchemy操作数据库

I. sqlalchemy创建mysql连接

举例：

read_sql()

参数：

to_sql()

参数：

公告

Jasmine

pandas+sqlAlchemy操作数据库

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

推荐排行榜