TokuDB·特性分析· Optimize Table
最后更新于:2022-04-01 10:42:06
来自一个TokuDB用户的“投诉”:
[https://mariadb.atlassian.net/browse/MDEV-6207](https://mariadb.atlassian.net/browse/MDEV-6207)
现象大概是:
用户有一个MyISAM的表test_table:
~~~
CREATE TABLE IF NOT EXISTS `test_table` (
`id` int(10) unsigned NOT NULL,
`pub_key` varchar(80) NOT NULL,
PRIMARY KEY (`id`),
KEY `pub_key` (`pub_key`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;
~~~
转成TokuDB引擎后表大小为92M左右:
~~~
47M _tester_testdb_sql_61e7_1812_main_ad88a6b_1_19_B_0.tokudb
45M _tester_testdb_sql_61e7_1812_key_pub_key_ad88a6b_1_19_B_1.tokudb
~~~
执行"OPTIMIZE TABLE test_table":
~~~
63M _tester_testdb_sql_61e7_1812_main_ad88a6b_1_19_B_0.tokudb
61M _tester_testdb_sql_61e7_1812_key_pub_key_ad88a6b_1_19_B_1.tokudb
~~~
再次执行"OPTIMIZE TABLE test_table":
~~~
79M _tester_testdb_sql_61e7_1812_main_ad88a6b_1_19_B_0.tokudb
61M _tester_testdb_sql_61e7_1812_key_pub_key_ad88a6b_1_19_B_1.tokudb
~~~
继续执行:
~~~
79M _tester_testdb_sql_61e7_1812_main_ad88a6b_1_19_B_0.tokudb
61M _tester_testdb_sql_61e7_1812_key_pub_key_ad88a6b_1_19_B_1.tokudb
~~~
基本稳定在这个大小。
主索引从47M-->63M-->79M,执行"OPTIMIZE TABLE"后为什么会越来越大?
这得从TokuDB的索引文件分配方式说起,当内存中的脏页需要写到磁盘时,TokuDB优先在文件末尾分配空间并写入,而不是“覆写”原块,原来的块暂时成了“碎片”。
这样问题就来了,索引文件岂不是越来越大?No, TokuDB会把这些“碎片”在checkpoint时加入到回收列表,以供后面的写操作使用,看似79M的文件其实还可以装不少数据呢!
嗯,这个现象解释通了,但还有2个问题:
1) 在执行这个语句的时候,TokuDB到底在做什么呢?
在做toku_ft_flush_some_child,把内节点的缓冲区(message buffer)数据刷到最底层的叶节点。
2) 在TokuDB里,OPTIMIZE TABLE有用吗?
作用非常小,不建议使用,TokuDB是一个"No Fragmentation"的引擎。
官方WIKI: [Optimize Table](https://github.com/Tokutek/tokudb-engine/wiki/Optimize-Table)