如数据不存在就插入，存在就更新

最近在写爬虫时遇到一个问题，有些数据有隔一段时间后重新爬，我想让Mysql执行以下功能，当mysql有一条数据时，如果新数据更来就更新，如果没有，就插入，

方法一、手工判断

插入一条数据的时候，先判断是否存在这条记录，如果存在，我就更新这条记录，不存在就插入该条记录。原本这样的操作，我估计以前的自己会这么做。通过如下两条sql语句完成。

SELECT COUNT(*) FROM xxx WHERE ID=xxx;

if (x == 0)

INSERT INTO xxx VALUES;

else

UPDATE xxx SET ;

这种方法到是能实现，但是性能很差，

方法二、使用ignore 参数

插入一条数据，不存在就插入，存在就忽略。

使用insert ignore语句：insert ignore into table(col1,col2) values ('a','b');

例如插入数据：insert ignore into user_info (last_name,first_name) values ('LeBron','James');

这样一来，如果表中已经存在last_name='LeBron'且first_name='James'的数据，就不会插入，如果没有就会插入一条新数据。

上面的是一种用法，也可以用 INSERT .... SELECT 来实现，这里就不举例了。这种方法未满足我的要求，

方法三、使用ON DUPLICATE KEY UPDATE

如果指定了ON DUPLICATE KEY UPDATE，并且插入行后会导致在一个UNIQUE索引或PRIMARY KEY中出现重复值，则执行UPDATE。例如，如果列a被定义为UNIQUE，并且包含值1，则以下两个语句具有相同的效果：

1、INSERT INTO table (a,b,c) VALUES (1,2,3) ON DUPLICATE KEY UPDATE c=c+1;

2、UPDATE table SET c=c+1 WHERE a=1;
如果行作为新记录被插入，则受影响行的值为1；如果原有的记录被更新，则受影响行的值为2。

这种方式可以达到目的，是一个方法

方法四、REPLACE的使用

使用REPLACE的最大好处就是可以将DELETE和INSERT合二为一，形成一个原子操作。这样就可以不必考虑在同时使用DELETE和INSERT时添加事务等复杂操作了。在使用REPLACE时，表中必须有唯一索引，而且这个索引所在的字段不能允许空值，否则REPLACE就和INSERT完全一样的。在执行REPLACE后，系统返回了所影响的行数，如果返回1，说明在表中并没有重复的记录，如果返回2，说明有一条重复记录，系统自动先调用了DELETE删除这条记录，然后再记录用INSERT来插入这条记录。他的语法也和INSERT非常的相似，如下面的REPLACE语句是插入或更新一条记录。

REPLACE INTO users (id,name,age) VALUES(123, '贾斯丁比伯', 22);

这就是我要找的终极方法，简单高效。

posted @ 2018-03-02 12:08 outback123 阅读(5470) 评论(0) 编辑收藏举报

刷新页面返回顶部

Outback

如数据不存在就插入，存在就更新

公告