MySQL 5.5 分区之高级分区实例及性能分析_MySql

您所在的位置：程序员俱乐部 > 数据库 > MySql > MySQL 5.5 分区之高级分区实例及性能分析

MySQL 5.5 分区之高级分区实例及性能分析

2013/8/10 3:24:32 程序员俱乐部我要评论(0)

摘要：上次我们介绍了：MySQL5.5分区之truncate分区详解，本文我们主要介绍一下MySQL5.5分区之高级分区实例及性能分析，接下来我们就开始一一介绍这部分内容。为了帮助你更好地掌握新功能，我们再来看一个更高级一点的例子，对于比较务实的读者更有意义，下面是表的定义脚本：CREATETABLEemployees(emp_noint(11)NOTNULL,birth_datedateNOTNULL,first_namevarchar(14)NOTNULL,last_namevarchar(16
标签：SQL 实例分析 MySQL

上次我们介绍了：MySQL 5.5 分区之truncate分区详解，本文我们主要介绍一下MySQL 5.5 分区之高级分区实例及性能分析，接下来我们就开始一一介绍这部分内容。

为了帮助你更好地掌握新功能，我们再来看一个更高级一点的例子，对于比较务实的读者更有意义，下面是表的定义脚本：

class="dp-xml">CREATE TABLE employees (    
  emp_no int(11) NOT NULL,    
  birth_date date NOT NULL,    
  first_name varchar(14) NOT NULL,    
  last_name varchar(16) NOT NULL,    
  gender char(1) DEFAULT NULL,    
  hire_date date NOT NULL   
) ENGINE=MyISAM    
PARTITION BY RANGE  COLUMNS(gender,hire_date)    
(PARTITION p01 VALUES LESS THAN ('F','1990-01-01') ,    
PARTITION p02 VALUES LESS THAN ('F','2000-01-01') ,    
PARTITION p03 VALUES LESS THAN ('F',MAXVALUE) ,    
PARTITION p04 VALUES LESS THAN ('M','1990-01-01') ,    
PARTITION p05 VALUES LESS THAN ('M','2000-01-01') ,    
PARTITION p06 VALUES LESS THAN ('M',MAXVALUE) ,    
PARTITION p07 VALUES LESS THAN (MAXVALUE,MAXVALUE)

和上面的例子不同，这个例子更好理解，第一个分区用来存储雇佣于1990年以前的女职员，第二个分区存储股用于1990-2000年之间的女职员，第三个分区存储所有剩下的女职员。对于分区p04到p06，我们策略是一样的，只不过存储的是男职员。最后一个分区是控制情况。

看完后你可能要问，我怎么知道某一行存储在那个分区中的？有两个办法，第一个办法是使用与分区定义相同的条件作为查询条件进行查询。

SELECT   
CASE   
  WHEN gender = 'F' AND hire_date < '1990-01-01'   
  THEN 'p1'   
  WHEN gender = 'F' AND hire_date < '2000-01-01'   
  THEN 'p2'   
  WHEN gender = 'F' AND hire_date < '2999-01-01'   
  THEN 'p3'   
  WHEN gender = 'M' AND hire_date < '1990-01-01'   
  THEN 'p4'   
  WHEN gender = 'M' AND hire_date < '2000-01-01'   
  THEN 'p5'   
  WHEN gender = 'M' AND hire_date < '2999-01-01'   
  THEN 'p6'   
ELSE   
  'p7'   
END as p,    
COUNT(*) AS rows   
FROM employees    
GROUP BY p;    
 
+------+-------+    
| p    | rows  |    
+------+-------+    
| p1   | 66212 |    
| p2   | 53832 |    
| p3   |     7 |    
| p4   | 98585 |    
| p5   | 81382 |    
| p6   |     6 |    
+------+-------+

如果表是MyISAM或ARCHIVE，你可以信任由INFORMATION_SCHEMA提供的统计信息。

SELECT   
  partition_name part,    
  partition_expression expr,    
  partition_description descr,    
  table_rows    
FROM   
  INFORMATION_SCHEMA.partitions    
WHERE   
  TABLE_SCHEMA = schema()    
  AND TABLE_NAME='employees';    
+------+------------------+-------------------+------------+    
| part | expr             | descr             | table_rows |    
+------+------------------+-------------------+------------+    
| p01  | gender,hire_date | 'F','1990-01-01'  |      66212 |    
| p02  | gender,hire_date | 'F','2000-01-01'  |      53832 |    
| p03  | gender,hire_date | 'F',MAXVALUE      |          7 |    
| p04  | gender,hire_date | 'M','1990-01-01'  |      98585 |    
| p05  | gender,hire_date | 'M','2000-01-01'  |      81382 |    
| p06  | gender,hire_date | 'M',MAXVALUE      |          6 |    
| p07  | gender,hire_date | MAXVALUE,MAXVALUE |          0 |    
+------+------------------+-------------------+------------+

如果存储引擎是InnoDB，上面的值就是一个近似值，如果你需要确切的值，那你就不能信任它们。

另一个问题是它的性能，这些增强触发了分区修整吗？答案毫不含糊，是的。与MySQL 5.1有所不同，在5.1中日期分区只能与两个函数工作，在MySQL 5.5中，任何使用了COLUMNS关键字定义的分区都可以使用分区修整，下面还是测试一下吧。

select count(*) from employees where gender='F' and hire_date < '1990-01-01';    
+----------+    
| count(*) |    
+----------+    
|    66212 |    
+----------+    
1 row in set (0.05 sec)    
 
explain partitions select count(*) from employees where gender='F' and hire_date < '1990-01-01'\G    
*************************** 1. row ***************************    
           id: 1    
  select_type: SIMPLE    
        table: employees    
   partitions: p01    
         type: ALL   
possible_keys: NULL   
          key: NULL   
      key_len: NULL   
          ref: NULL   
         rows: 300024    
        Extra: Using where

使用定义第一个分区的条件，我们获得了一个非常优化的查询，不仅如此，部分条件也将从分区修整中受益。

select count(*) from employees where gender='F';    
+----------+    
| count(*) |    
+----------+    
|   120051 |    
+----------+    
1 row in set (0.12 sec)    
 
explain partitions select count(*) from employees where gender='F'\G    
*************************** 1. row ***************************    
           id: 1    
  select_type: SIMPLE    
        table: employees    
   partitions: p01,p02,p03,p04    
         type: ALL   
possible_keys: NULL   
          key: NULL   
      key_len: NULL   
          ref: NULL   
         rows: 300024    
        Extra: Using where

它和复合索引的算法一样，如果你的条件指的是索引最左边的部分，MySQL将会使用它。与此类似，如果你的条件指的是分区定义最左边的部分，MySQL将会尽可能修整。它和复合索引一起出现，如果你只使用最右边的条件，分区修整不会工作。

select count(*) from employees where hire_date < '1990-01-01';    
+----------+    
| count(*) |    
+----------+    
|   164797 |    
+----------+    
1 row in set (0.18 sec)    
 
explain partitions select count(*) from employees where hire_date < '1990-01-01'\G    
*************************** 1. row ***************************    
           id: 1    
  select_type: SIMPLE    
        table: employees    
   partitions: p01,p02,p03,p04,p05,p06,p07    
         type: ALL   
possible_keys: NULL   
          key: NULL   
      key_len: NULL   
          ref: NULL   
         rows: 300024    
        Extra: Using where