实例说明optimize table在优化MySQL时很重要-伙伴云

实例说明 optimize table在优化MySQL时很重要

网友投稿 668 2022-05-29

今天在看CU的时候，发现有人问有关optimize来表优化的问题，当年因为这个问题，困扰我很长一段时间，今天有空我把这个问题，用实际数据来展示出来，让大家可以亲眼来看看，optimize table的重要作用，而不是似是而非的估计了。

一，原始数据

1，数据量

mysql> select count(*) as total from ad_visit_history;

+---------+

| total |

+---------+

| 1187096 | //总共有118万多条数据

+---------+

1 row in set (0.04 sec)

2，存放在硬盘中的表文件大小

[root@ www.linuxidc.com test1]# ls |grep visit |xargs -i du {}

382020 ad_visit_history.MYD //数据文件占了380M

127116 ad_visit_history.MYI //索引文件占了127M

12 ad_visit_history.frm //结构文件占了12K

3，查看一下索引信息

mysql> show index from ad_visit_history from test1; //查看一下该表的索引信息

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

| ad_visit_history | 0 | PRIMARY | 1 | id | A | 1187096 | NULL | NULL | | BTREE | |

| ad_visit_history | 1 | ad_code | 1 | ad_code | A | 46 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | unique_id | 1 | unique_id | A | 1187096 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | ad_code_ind | 1 | ad_code | A | 46 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | from_page_url_ind | 1 | from_page_url | A | 30438 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | ip_ind | 1 | ip | A | 593548 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | port_ind | 1 | port | A | 65949 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | session_id_ind | 1 | session_id | A | 1187096 | NULL | NULL | YES | BTREE | |

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

8 rows in set (0.28 sec)

索引信息中的列的信息说明。

Table :表的名称。

Non_unique:如果索引不能包括重复词，则为0。如果可以，则为1。

Key_name:索引的名称。

Seq_in_index:索引中的列序列号，从1开始。

Column_name:列名称。

Collation:列以什么方式存储在索引中。在MySQLSHOW INDEX语法中，有值’A’（升序）或NULL（无分类）。

Cardinality:索引中唯一值的数目的估计值。通过运行ANALYZE TABLE或myisamchk -a可以更新。基数根据被存储为整数的统计数据来计数，所以即使对于小型表，该值也没有必要是精确的。基数越大，当进行联合时，MySQL使用该索引的机会就越大。

Sub_part:如果列只是被部分地编入索引，则为被编入索引的字符的数目。如果整列被编入索引，则为NULL。

Packed:指示关键字如何被压缩。如果没有被压缩，则为NULL。

Null:如果列含有NULL，则含有YES。如果没有，则为空。

Index_type：存储索引数据结构方法（BTREE, FULLTEXT, HASH, RTREE）

二，删除一半数据

mysql> delete from ad_visit_history where id>598000; //删除一半数据

Query OK, 589096 rows affected (4 min 28.06 sec)

[root@ www.linuxidc.com test1]# ls |grep visit |xargs -i du {} //相对应的MYD，MYI文件大小没有变化

382020 ad_visit_history.MYD

127116 ad_visit_history.MYI

12 ad_visit_history.frm

按常规思想来说，如果在数据库中删除了一半数据后，相对应的.MYD,.MYI文件也应当变为之前的一半。但是删除一半数据后，.MYD.MYI尽然连1KB都没有减少，这是多么的可怕啊。

我们在来看一看，索引信息

mysql> show index from ad_visit_history;

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

| ad_visit_history | 0 | PRIMARY | 1 | id | A | 598000 | NULL | NULL | | BTREE | |

| ad_visit_history | 1 | ad_code | 1 | ad_code | A | 23 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | unique_id | 1 | unique_id | A | 598000 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | ad_code_ind | 1 | ad_code | A | 23 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | from_page_url_ind | 1 | from_page_url | A | 15333 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | ip_ind | 1 | ip | A | 299000 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | port_ind | 1 | port | A | 33222 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | session_id_ind | 1 | session_id | A | 598000 | NULL | NULL | YES | BTREE | |

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

8 rows in set (0.00 sec)

对比一下，这次索引查询和上次索引查询，里面的数据信息基本上是上次一次的一本，这点还是合乎常理。

三，用optimize table来优化一下

??mysql> optimize table ad_visit_history; //删除数据后的优化

+------------------------+----------+----------+----------+

+------------------------+----------+----------+----------+

+------------------------+----------+----------+----------+

1 row in set (1 min 21.05 sec)

1，查看一下.MYD,.MYI文件的大小

??[root@ www.linuxidc.com test1]# ls |grep visit |xargs -i du {}

182080 ad_visit_history.MYD //数据文件差不多为优化前的一半

66024 ad_visit_history.MYI //索引文件也一样，差不多是优化前的一半

12 ad_visit_history.frm

2，查看一下索引信息

??mysql> show index from ad_visit_history;

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

| ad_visit_history | 0 | PRIMARY | 1 | id | A | 598000 | NULL | NULL | | BTREE | |

| ad_visit_history | 1 | ad_code | 1 | ad_code | A | 42 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | unique_id | 1 | unique_id | A | 598000 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | ad_code_ind | 1 | ad_code | A | 42 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | from_page_url_ind | 1 | from_page_url | A | 24916 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | ip_ind | 1 | ip | A | 598000 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | port_ind | 1 | port | A | 59800 | NULL | NULL | YES | BTREE | |

| ad_visit_history | 1 | session_id_ind | 1 | session_id | A | 598000 | NULL | NULL | YES | BTREE | |

+------------------+------------+-------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+

8 rows in set (0.00 sec)

从以上数据我们可以得出，ad_code，ad_code_ind，from_page_url_ind等索引机会差不多都提高了85％，这样效率提高了好多。

四，小结

结合mysql官方网站的信息，个人是这样理解的。当你删除数据时，mysql并不会回收，被已删除数据的占据的存储空间，以及索引位。而是空在那里，而是等待新的数据来弥补这个空缺，这样就有一个缺少，如果一时半会，没有数据来填补这个空缺，那这样就太浪费资源了。所以对于写比较频烦的表，要定期进行optimize，一个月一次，看实际情况而定了。

举个例子来说吧。有100个php程序员辞职了，但是呢只是人走了，php的职位还在那里，这些职位不会撤销，要等新的php程序来填补这些空位。招一个好的程序员，比较难。我想大部分时间会空在那里。哈哈。

五，手册中关于OPTIMIZE的一些用法和描述

OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] ...

如果您已经删除了表的一大部分，或者如果您已经对含有可变长度行的表（含有VARCHAR, BLOB或TEXT列的表）进行了很多更改，则应使用

OPTIMIZE TABLE。被删除的记录被保持在链接清单中，后续的INSERT操作会重新使用旧的记录位置。您可以使用OPTIMIZE TABLE来重新

实例说明optimize table在优化MySQL时很重要

利用未使用的空间，并整理数据文件的碎片。

在多数的设置中，您根本不需要运行OPTIMIZE TABLE。即使您对可变长度的行进行了大量的更新，您也不需要经常运行，每周一次或每月一次

即可，只对特定的表运行。

OPTIMIZE TABLE只对MyISAM, BDB和InnoDB表起作用。

注意，在OPTIMIZE TABLE运行过程中，MySQL会锁定表。

MySQL

提升软件开发与招投标效率：AI智写助手如何优化智能文档编写

668 2022-05-29

实例 说明 optimize table在优化MySQL时很重要

提升软件开发与招投标效率的五个方法与技术方案

提升软件开发与招投标效率：AI智写助手如何优化智能文档编写

提升软件开发与招投标效率：AI智写助手如何实现智能文档编写

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

家居定制平台是什么？

友情链接

实例说明optimize table在优化MySQL时很重要

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接

实例说明 optimize table在优化MySQL时很重要