MySQL 為什么InnoDB表要建議用自增列做主鍵

2021-09-18 16:01 更新

原文地址:http://imysql.com/2014/09/14/mysql-faq-why-innodb-table-using-autoinc-int-as-pk.shtml

我們先了解下InnoDB引擎表的一些關鍵特征:

  • InnoDB引擎表是基于B+樹的索引組織表(IOT);
  • 每個表都需要有一個聚集索引(clustered index);
  • 所有的行記錄都存儲在B+樹的葉子節(jié)點(leaf pages of the tree);
  • 基于聚集索引的增、刪、改、查的效率相對是最高的;
  • 如果我們定義了主鍵(PRIMARY KEY),那么InnoDB會選擇其作為聚集索引;
  • 如果沒有顯式定義主鍵,則InnoDB會選擇第一個不包含有NULL值的唯一索引作為主鍵索引;
  • 如果也沒有這樣的唯一索引,則InnoDB會選擇內(nèi)置6字節(jié)長的ROWID作為隱含的聚集索引(ROWID隨著行記錄的寫入而主鍵遞增,這個ROWID不像ORACLE的ROWID那樣可引用,是隱含的)。

綜上總結(jié),如果InnoDB表的數(shù)據(jù)寫入順序能和B+樹索引的葉子節(jié)點順序一致的話,這時候存取效率是最高的,也就是下面這幾種情況的存取效率最高:

  • 使用自增列(INT/BIGINT類型)做主鍵,這時候?qū)懭腠樞蚴亲栽龅?,和B+數(shù)葉子節(jié)點分裂順序一致;
  • 該表不指定自增列做主鍵,同時也沒有可以被選為主鍵的唯一索引(上面的條件),這時候InnoDB會選擇內(nèi)置的ROWID作為主鍵,寫入順序和ROWID增長順序一致;
  • 除此以外,如果一個InnoDB表又沒有顯示主鍵,又有可以被選擇為主鍵的唯一索引,但該唯一索引可能不是遞增關系時(例如字符串、UUID、多字段聯(lián)合唯一索引的情況),該表的存取效率就會比較差。

實際情況是如何呢?經(jīng)過簡單TPCC基準測試,修改為使用自增列作為主鍵與原始表結(jié)構分別進行TPCC測試,前者的TpmC結(jié)果比后者高9%倍,足見使用自增列做InnoDB表主鍵的明顯好處,其他更多不同場景下使用自增列的性能提升可以自行對比測試下。

附圖:

1、B+樹典型結(jié)構

B+tree

2、InnoDB主鍵邏輯結(jié)構

Innodb-primary-key

延伸閱讀:

1、TPCC-MySQL使用手冊

2、B+Tree index structures in InnoDB

3、B+Tree Indexes and InnoDB – Percona

4、MySQL官方手冊: Clustered and Secondary Indexes

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號