MySQL · 特性分析 ·MySQL 5.7新特性系列二

最后更新于:2022-04-01 10:34:37

继上一期月报,MySQL5.7新特性之一介绍了一些新特性及兼容性问题后,本期继续进行学习。 ### 1\. 系统变量 5.7以后System and status 变量需要从performance_schema中进行获取,information_schema仍然保留了GLOBAL_STATUS,GLOBAL_VARIABLES两个表做兼容。 [兼容性]  如果希望沿用information_schema中进行查询的习惯,5.7提供了show_compatibility_56参数,设置为ON可以兼容5.7之前的用法,否则就会报错: ~~~ ERROR 3167 (HY000): The 'INFORMATION_SCHEMA.GLOBAL_STATUS' feature is disabled; see the documentation for 'show_compatibility_56' ~~~ 5.7.6之后,在performance_schema新增了如下的表: ~~~ performance_schema.global_variables performance_schema.session_variables performance_schema.variables_by_thread performance_schema.global_status performance_schema.session_status performance_schema.status_by_thread performance_schema.status_by_account performance_schema.status_by_host performance_schema.status_by_user ~~~ 5.7.9之前,需要有SELECT_ACL权限才能进行show查询,但5.7.9之后,默认这些表是不需要任何权限就可以访问了。 ### 2\. sys schema 新增了sys数据库,主要是performance_schema收集的信息,帮助DBA和开发人员方便诊断问题。 sys下的一共包括三种对象:1\. view,2\. procedure 3 function 这些对象都是基于performance_schema下的表,进行了可读性的聚合,没有真正存储数据,只存储了定义。 [兼容性]  mysql_install_db可以选择–skip-sys-schema跳过安装过程, 但默认mysql_upgrade会帮你创建sys下面的对象。不存在兼容性的问题 ### 3\. 异常栈 5.7开始支持异常诊断栈信息,通过GET STACKED DIAGNOSTICS可以获取栈内的信息。 具体的使用方法参考:https://dev.mysql.com/doc/refman/5.7/en/diagnostics-area.html ### 4\. Triggers 支持在一个table对象上建多个trigger。 ### 5\. Generated Columns 5.7.6开始,支持生成列,这个列可以是虚拟的列,也可以是实体存储数据的列。 比如: ~~~ CREATE TABLE triangle ( sidea DOUBLE, sideb DOUBLE, sidec DOUBLE AS (SQRT(sidea * sidea + sideb * sideb)) ); ~~~ VIRTUAL: 表示这个字段是虚拟列,并不进行存储,查询的时候,通过计算得到  STORED: 需要存储空间,并且可以被索引的列 ### 6\. exchange partition不验证 这个是在oracle分区表上支持的功能,dba在做大表维护的时候,非常有用。 ~~~ 语法: ALTER TABLE ... EXCHANGE PARTITION WITHOUT VALIDATION ~~~ 如果不验证,那么只有元数据信息的更改,就可以完成exchange,否则,就需要读取每一行数据进行验证,维护时间将根据这个表大小有关系。 ### 7\. dump线程增强 5.7.2之前,master dump线程需要持有LOCK_log锁去读取binlog然后发送到备库,而这时会阻塞client端去写入binlog。5.7.2之后,dump线程只需要持有LOCK_binlog_end_pos这个锁去读取binlog的当前的位置,来决定是否发送到备库去,这样就可以做到不阻塞任何binlog的写入。 ### 8\. 多源复制 多源复制可以从多个master复制到一个slave端,在数据库集群进行扩容和缩容的时候,非常有用。我们会在后面的系列单独来介绍。 ### 9\. 在线更改replication master 可以不用stop slave,然后在线更改replication master信息。 但这里并不是不需要slave停掉, 而是change master涉及到几个动作: 1\. 如果只是更改当前relay的信息,那么只需要sql线程是不工作的就可以了,IO thread可以继续 2\. 如果只是更改主库的信息,那么只需要IO线程不工作就可以了。 sql thread可以继续 3\. 如果需要重新启动主库和备库的恢复信息,比如master_auto_positioin=1,那么就需要IO和sql线程都停掉。 ### 10\. Group Replication 并行复制支持按照主库组提交的形式在备库进行回放。下一个系列进行单独来介绍 下面单独介绍一下MySQL 5.7对临时表进行的改动。 ### 1\. 背景 MySQL包括两类临时表,一类是通过create temporary table创建的临时表,一类是在query过程中using temporary而创建的临时表。 5.7之前,using temporary创建的临时表,默认只能使用myisam引擎,而在5.7之后,可以选择InnoDB引擎来创建。 临时表的引擎选择使用下面的这两个参数来决定: ~~~ mysql> show global variables like '%tmp%'; +----------------------------------+---------------------------------------+ | Variable_name | Value | +----------------------------------+---------------------------------------+ | default_tmp_storage_engine | InnoDB | | internal_tmp_disk_storage_engine | InnoDB | ~~~ ### 2\. 临时表空间 5.7之后,使用了独立的临时表空间来存储临时表数据,但不能是压缩表。临时表空间在实例启动的时候进行创建,shutdown的时候进行删除。 例如如下的配置: ~~~ mysql> show global variables like '%innodb_temp%'; +----------------------------+-----------------------+ | Variable_name | Value | +----------------------------+-----------------------+ | innodb_temp_data_file_path | ibtmp1:12M:autoextend | +----------------------------+-----------------------+ ~~~ create temporary table和using temporary table将共用这个临时表空间。 ### 3\. 临时表优化 临时表会伴随着大量的数据写入和读取,尤其是internal_tmp_table。所以,InnoDB专门对临时表进行了优化。  InnoDB使用如下两个标示临时表: ~~~ dict_tf2_temporary: 表示普通临时表 dict_tf2_intrinsic: 表示内部临时表 ~~~ 这两个标示,会在IBD文件的segment header占用两个bit位。intrinsic一定是temproary,也就是temproary上进行的优化 完全适用于intrinsic表上。 下面来看下具体的优化: ### 3.1\. redo 临时表在连接断开或者数据库实例关闭的时候,会进行删除,所以,临时表的数据不需要redo来保护,即recovery的过程中 不恢复临时表,只有临时表的metadata使用了redo保护,保护元数据的完整性,以便异常启动后进行清理工作。 临时表的元数据,5.7之后,使用了一个独立的表进行保存,这样就不要使用redo保护,元数据也只保存在内存中。 但这有一个前提,必须使用共享的临时表空间,如果使用file-per-table,仍然需要持久化元数据,以便异常恢复清理。 ### 3.2 undo temporary table仍然需要语句级的回滚,所以,需要为数据生成undo。但intrinsic table不需要回滚,所以,intrinsic table 减少了undo的生成,性能更高。 ### 3.3 lock 因为临时表只有本线程可以看见,所以减少了InnoDB的加锁过程。 可以看下insert的时候,进行的分支判断: ~~~ row_insert_for_mysql( const byte* mysql_rec, row_prebuilt_t* prebuilt) { /* For intrinsic tables there a lot of restrictions that can be relaxed including locking of table, transaction handling, etc. Use direct cursor interface for inserting to intrinsic tables. */ if (dict_table_is_intrinsic(prebuilt->table)) { return(row_insert_for_mysql_using_cursor(mysql_rec, prebuilt)); } else { return(row_insert_for_mysql_using_ins_graph( mysql_rec, prebuilt)); } } ~~~ row_insert_for_mysql_using_cursor直接跳过了加锁的lock_table过程。 然后,如果是intrinsic table,就直接插入,减少了undo的生成。  如果不是,需要加lock,并生成undo信息。 ~~~ if (dict_table_is_intrinsic(index->table)) { index->rec_cache.rec_size = rec_size; *rec = page_cur_tuple_direct_insert( page_cursor, entry, index, n_ext, mtr); } else { /* Check locks and write to the undo log, if specified */ err = btr_cur_ins_lock_and_undo(flags, cursor, entry, thr, mtr, &inherit); ~~~ 插入的时候,如果是临时表。就关闭redo的生成。如下面的代码所示: ~~~ if (dict_table_is_temporary(index->table)) { /* Disable REDO logging as the lifetime of temp-tables is limited to server or connection lifetime and so REDO information is not needed on restart for recovery. Disable locking as temp-tables are local to a connection. */ ut_ad(flags & BTR_NO_LOCKING_FLAG); ut_ad(!dict_table_is_intrinsic(index->table) || (flags & BTR_NO_UNDO_LOG_FLAG)); mtr.set_log_mode(MTR_LOG_NO_REDO); } ~~~ 未完待续,下一个系列,我们将介绍一下undo的新特性,包括online truncated undo。
';