replace into平时在开发中很少用到,这次是因为在做一个生成分布式ID的开源项目,调研雅虎推出的一个基于数据库生成唯一id生成方案:flickr 碰到的一个知识盲点,仅以此篇记录一下。
一、replace into函数
表结构
CREATE TABLE `id_generator` (
`id` bigint(20) unsigned NOT NULL auto_increment,
`stub` char(1) NOT NULL default '',
PRIMARY KEY (`id`),
UNIQUE KEY `stub` (`stub`)
) ENGINE=MyISAM;
id
列是主键索引,stub
列是唯一索引 。
replace into
向数据库中插入数据时,如果数据重复,则删除重复的那行数据,然后在插入一行。
replace具备替换拥有唯一索引或者主键索引重复数据的能力,也就是如果使用replace into插入的数据的唯一索引或者主键索引与之前的数据有重复的情况,将会删除原先的数据,然后再进行添加。
那怎么判断是否重复的标准就是:唯一索引或者主键索引是否一致。语法:replace into table( col1, col2, col3 ) values ( val1, val2, val3 )
语义:向table表中col1, col2, col3列replace数据val1,val2,val3
以id_generator
表为例:
REPLACE INTO id_generator(stub) VALUES ('trade')
执行信息如下:
No errors; 1 rows affected, taking 20ms
表示只添加了一行。
执行结果:
+----+--------------+
| id | stub |
+----+--------------+
| 1 | trade |
+----+--------------+
接续执行如下语句:
REPLACE INTO id_generator(stub) VALUES ('trade')
执行信息如下:
No errors; 2 rows affected, taking 23ms
因为删除了一行,添加了一行。
执行结果:
+----+--------------+
| id | stub |
+----+--------------+
| 3 | trade |
+----+--------------+
因为stub
列创建列唯一索引,所以replace into
当stub有重复的数据行时,会删除这行数据重新添加,导致id发生变化。
如果replace into
唯一索引 id
重复的话,会怎么样呢?
REPLACE INTO id_generator(id) VALUES (3)
执行信息如下:
No errors; 2 rows affected, taking 28ms
因为删除了一行,添加了一行。
执行结果:
+----+--------------+
| id | stub |
+----+--------------+
| 3 | |
+----+--------------+
这时我们看到stub
列的值为空字符串,因为id是唯一索引,id=3的记录已经存在,所以replace into
会删除id=3的记录,重新添加,导致stub为空。
二、replace into 、insert ignore 和 insert into的区别
replace into
跟 insert into
功能类似。
不同点在于:
insert into
最普遍的插入,如果表中存在主键相同的数据,执行会报错。
insert ignore
如果表中存在主键相同的数据不在插入该条数据,反之则插入(存在则忽略,反之插入)。
replace into
首先尝试插入数据到表中。
-
如果发现表中已经有此行数据(根据主键或者唯一索引判断)则先删除此行数据,然后插入新的数据。
-
否则,直接插入新数据。
注意:**插入数据的表必须有主键或者是唯一索引!**否则的话,replace into 会直接插入数据,这将导致表中出现重复的数据
三、replace函数
语法:replace(field,search,replace)
说明:field - 数据库表的列名
search - 需要替换的字符串
replace - 替换成的字符串
语义:将列名:field 中出现的search字符串,全部替换成replace字符串。
实例:
update id_generator set stub = replace(stub,'trade','user')
select replace(uuid(), '-', '');
往期阅读
Kafka Producer全流程分析和思考
中国程序员多不多?
卷不动了,我选择降薪去外企来平衡工作和生活
HBase、Cassandra、LevelDB、RocksDB 相关数据结构是什么?
从Log4j2原理、攻击和解决方案来聊聊全球性的Log4j2漏洞
2022大厂开始反内卷,阿里和蚂蚁升级员工福利,打响第一枪
快乐程序员、读书狂魔、爱撸代码、开源项目、硬核互联网技术分享
觉得写得不错,请点在看,谢谢!