## 背景 你是否曾为`Error on rename of './test/#sql-78fd_780371' to './test/t2' (errno: 150)`这样的错误而不解,如stackoverflow上的这个[问题](http://stackoverflow.com/questions/4080611/1025-error-on-rename-of-database-sql-2e0f-1254ba7-to-database-table)? 下面我们来复现下: ~~~ drop table t2; drop table t1; create table t1(c1 int primary key, c2 int); create table t2(c1 int primary key, c2 int , constraint fk foreign key (c2) references t1(c1)) engine=innodb; //删外键所引用的列 alter table t2 drop c2; //删不存在的外键 alter table t2 drop foreign key idx1; ~~~ 5.5的表现 ~~~ mysql> alter table t2 drop c2; ERROR 1025 (HY000): Error on rename of './test/#sql-78fd_780371' to './test/t2' (errno: 150) mysql> alter table t2 drop foreign key idx1; ERROR 1025 (HY000): Error on rename of './test/t2' to './test/#sql2-78fd-780371' (errno: 152) ~~~ 5.6的表现 ~~~ mysql> alter table t2 drop c2; ERROR 1553 (HY000): Cannot drop index 'fk': needed in a foreign key constraint mysql> alter table t2 drop foreign key idx1; ERROR 1091 (42000): Can't DROP 'idx1'; check that column/key exists ~~~ 很明显5.6的报错信息更精确些,5.5的报错太不人性化了,容易造成误解。 它们差别在于5.6的报错处理在语义分析阶段,精准的定位了错误信息。 ~~~ mysql_alter_table |=>mysql_inplace_alter_table |==>ha_innobase::prepare_inplace_alter_table |===>innobase_check_foreign_key_index ~~~ 而5.5的报错处理在执行阶段。 我们先来看看5.5的执行流程: ~~~ mysql_alter_table |=>mysql_create_table_no_lock //创建临时表tmp_table1,其结构和原表类似,但不包括外键信息 |==>rea_create_table |=>copy_data_between_tables //将原表数据copy到tmp_table1 |=>mysql_rename_table //将原表重命名tmp_table2,但不重命名外键涉及的表信息 |==> row_rename_table_for_mysql //修改字典表 |=>mysql_rename_table //将临时表tmp_table1重命名回原表 |==>row_rename_table_for_mysql //修改字典表 |===>dict_load_foreigns //这里通过从数据字段加载外键信息来检查外键索引是否存在,外键索引列是否一致. ~~~ `dict_load_foreigns`:这个函数由于承担的责任太多,只要发现错误,就笼统的抛出`Error on rename of 'xxxx' to 'xxxx' (errno: xxx)`的错误. ## 外键bug 我们来看一个外键相关的[bug77467](https://bugs.mysql.com/bug.php?id=77467)。 ~~~ Alter table reply change blogId topicId int(11) NOT NULL, drop index userId, drop foreign key reply_ibfk_2; ~~~ bug中这个DDL虽然执行失败了,但实际上foreign key reply_ibfk_2被删除了。这个bug在单机环境下影响不大,但在主备环境下由于DDL执行失败并没有记binlog,从而导致主备表结构不一致。这个bug只出现在5.6以前的版本中,5.6是OK的 ## bug分析 我们来看看5.5的流程: ~~~ mysql_alter_table |=>mysql_create_table_no_lock //创建临时表tmp_table1,其结构和原表类似,但不包括外键信息 |==>rea_create_table |=>copy_data_between_tables //将原表数据copy到tmp_table1 |=>mysql_rename_table //将原表重命名tmp_table2,但不重命名外键涉及的表信息,同时删除原表的外键reply_ibfk_2 |==> row_rename_table_for_mysql //修改字典表 |=>mysql_rename_table //将临时表tmp_table1重命名回原表 |==>row_rename_table_for_mysql //修改字典表 |===>dict_load_foreigns //这里通过从数据字段加载外键信息来检查外键索引是否存在,外键索引列是否一致.检查发现index userId不存在,出现错误 |===>trx_rollback_to_savepoint //出现错误回滚之前的修改 ~~~ 出错回滚之前的修改,预期是回滚删除外键reply_ibfk_2,但是删除外键reply_ibfk_2操作在第一次`mysql_rename_table`中,属于一个事务,而回滚操作在第二次`mysql_rename_table`中,属于另一个事务,因此回滚没有成功。 那么5.6为什么没有出现这种错误呢?5.6在语义分析的时候就发现错误,还没来得及删外键就已经报错返回了。 ## bug修复 5.5修复方法,将删外键的操作放到第二次`mysql_rename_table`中进行,如果出现错误就可以顺利的回滚了。当然,还是5.6的做法比较好。