python爬虫--连接数据库1
1、连接mysql
下载mysql,到官网下载。一路安装,设置好帐号密码。
下载mysql的编译环境,Navicat;
在Navicat创建数据库和表;
create table urls ( id int not null auto_increment, url varchar(1000) not null, content varchar(4000) not null, created_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP, primary key(id) )
python链接mysql,
安装库,pip install mysqlclient。
用pyrhon在mysql中创建的数据库leon中的urls表格中插入一条数据
import MySQLdb conn= MySQLdb.connect(host='localhost' , user='root', passwd='5407', db ='leon') cur = conn.cursor() cur.execute("INSERT INTO urls (url, content) VALUES ('www.baidu.com', 'This is content.')") cur.close() conn.commit() conn.close()
结果显示:
host='localhost' , user='root', passwd='5407', db ='leon',是链接名称,用户名,密码,数据库名称
删除操作:
import MySQLdb # 打开数据库连接 db = MySQLdb.connect("localhost","testuser","test123","TESTDB" ) # 使用cursor()方法获取操作游标 cursor = db.cursor() # SQL 删除语句 sql = "DELETE FROM EMPLOYEE WHERE AGE > '%d'" % (20) try: # 执行SQL语句 cursor.execute(sql) # 提交修改 db.commit() except: # 发生错误时回滚 db.rollback() # 关闭连接 db.close()
执行事务
事务机制可以确保数据一致性。
事务应该具有4个属性:原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。
- 原子性(atomicity)。一个事务是一个不可分割的工作单位,事务中包括的诸操作要么都做,要么都不做。
- 一致性(consistency)。事务必须是使数据库从一个一致性状态变到另一个一致性状态。一致性与原子性是密切相关的。
- 隔离性(isolation)。一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
- 持久性(durability)。持续性也称永久性(permanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其有任何影响。
Python DB API 2.0 的事务提供了两个方法 commit 或 rollback。