MySQL · 捉虫动态 · ALTER IGNORE TABLE导致主备不一致
最后更新于:2022-04-01 10:39:45
## 背景
我们知道当一张表的某个字段存在重复值时,这个字段没办法直接加UNIQUE KEY,但是MySQL提供了一个 ALTER IGNORE TABLE的方式,可以忽略修改表结构过程中出现的错误,但是要忽略UNIQUE重复值,就需要打开old_alter_table,也就是拷贝表的方式来ALTER TABLE。
例如这样:
~~~
CREATE TABLE t1(c1 int) ENGINE = InnoDB;
INSERT INTO t1 VALUES (1), (1);
SET old_alter_table=1;
ALTER IGNORE TABLE t1 ADD UNIQUE (c1);
~~~
但是如果你是 MySQL 5.5 主备环境,你会发现备库收到这个DDL后,SQL THREAD 会给你一个无情的报错:
~~~
'Error 'Duplicate entry '1' for key 'c1'' on query.
Default database: 'test'. Query: 'ALTER IGNORE TABLE t1 ADD UNIQUE (c1)''
~~~
## 原因
这是为什么呢?
其实关键问题就是这个SQL要执行成功,必须保证 old_alter_table 打开,但是 MySQL 的 SET 语句并不参与复制,因此备库只收到了一个 ALTER IGNORE TABLE,而没有先打开 old_alter_table,因此备库用的不是整表拷贝的方法来重建表,因而无法执行成功。
## 解决
那我们怎么解决这个问题呢,也很简单,只要备库Slave线程也用 old_alter_table=1 来执行 ALTER IGNORE TABLE就好了。
本质上就是 `mysql_alter_table()` 中需要让`need_copy_table= ALTER_TABLE_DATA_CHANGED`(old_alter_table=1),而不是`need_copy_table= ALTER_TABLE_INDEX_CHANGED`(old_alter_table=0)。
因此我们只要在`mysql_alter_table()`函数中判断该用哪种算法的时候,给出一个可以干预的变量,让Slave线程在需要的时候可以按`need_copy_table= ALTER_TABLE_DATA_CHANGED`执行。
原来的代码:
~~~
if ((thd->variables.old_alter_table
|| (table->s->db_type() != create_info->db_type)
#ifdef WITH_PARTITION_STORAGE_ENGINE
|| partition_changed
#endif
)
need_copy_table= ALTER_TABLE_DATA_CHANGED;
~~~
我们加上判断 (‘是否启用Slave自动用 ALTER_TABLE_DATA_CHANGED 方式做ALTER IGNORE TABLE’ && `thd->slave_thread` && ignore),就可以在我们打开控制变量的时候,强制让Slave线程用 old_alter_table=1 的方式来执行 ALTER IGNORE TABLE。
~~~
if ((thd->variables.old_alter_table ||
('是否启用Slave自动用 ALTER_TABLE_DATA_CHANGED 方式做ALTER IGNORE TABLE' &&
thd->slave_thread && ignore))
|| (table->s->db_type() != create_info->db_type)
#ifdef WITH_PARTITION_STORAGE_ENGINE
|| partition_changed
#endif
)
need_copy_table= ALTER_TABLE_DATA_CHANGED;
~~~