再次丟擲筆者的觀點，在能滿足業務場景的情況下，單表>分割槽>單庫分表>分庫分表，推薦優先順序從左到右逐漸降低。

本篇文章主要講使用者表（或者類似這種業務屬性的表）的分表方案，至於訂單表，流水錶等，本文的方案可能不是很合適，可以參考筆者另一篇文章《分庫分表技術演進&最佳實踐-修訂篇》。

我們首先來看一下分表時主要需要做的事情：

選定分片鍵：既然是使用者表那分片鍵非使用者ID莫屬；
修改程式碼：以sharding-jdbc這種client樣式的中介軟體為例，主要是引入依賴，然後新增一些配置。業務程式碼並不怎麼需要改動。
存量資料遷移；
業務發展超過容量評估後需要開發和運維介入擴容；

做過分庫分表的都知道，第3步最麻煩，而且非常不好驗證遷前後資料一致性（目前業界主流的遷移方案是存量資料遷移+利用binlog進行增量資料同步，待兩邊的資料持平後，將業務程式碼中的開關切到分表樣式）。

第4步同樣麻煩，業務增長完全超過當初分表設計的容量評估是很常見的事情，這也成為業務高速發展的一個隱患。而且網際網路型別的業務都希望能做到7×24小時不停服務，這樣就給擴容帶來了更大的挑戰。筆者看過比較好的方案就是58沈劍提出的成倍擴容方案。如下圖所示，假設現在已經有2張表：tbuser1，tbuser2。且有兩個庫是主備關係，並且分表演演算法是hash(user_id)%2：

現在要擴容到4張表，做法是將兩個庫的主從關係切斷。然後slave晉升為master，這樣就有兩個主庫：master-1，master-2。新的分表演演算法是：

庫選擇演演算法為：hash(userid)%4的結果為1或者2，就選master-1庫，hash(userid)%4的結果為3或者0，就選master-2庫；
表的選擇演演算法為：hash(userid)%2的結果為1則選tbuser1表，hash(userid)%2的結果為0則選tbuser2表。

如此以來，兩個庫中總計4張表，都冗餘了1倍的資料：master-1中tbuser1冗餘了3、7、11…，master-1中tbuser2冗餘了4、8、12…，master-2中tbuser1冗餘了1、5、9…，master-2中tbuser2冗餘了2、6、10…。將這些冗餘資料刪掉後，庫、表、資料示意圖如下所示：

即使這樣方案，還是避免不了分表時的存量資料遷移，以及分表後業務發展到一定時期後的繁瑣擴容。那麼有沒有一種很好的方案，能夠一勞永逸，分表時不需要存量資料遷移，使用者量無論如何增長，擴容時都不需要遷移存量資料，只需要新增一個資料庫示例，修改一下配置即可。軟體開發行業，一個方案能撐過3~5年就是一個很優秀的方案，我們現在YY的是整個生命週期內都不用改動的完美的方案。沒錯，我們在尋找銀彈。

這個方案筆者在兩個地方都接觸到了：

某V廠面試時，部門老大提出的方案；
和美團大牛普架討論瞭解到的CAT儲存方案；

說明：CAT是美團點評開源的APM，目前在Github上的star已經破萬（Github地址：https://github.com/dianping/cat），比skywalking和pinpoint還快，如果你正在選型APM，而且能接受程式碼侵入，那麼CAT是一個不錯的選擇。

CAT儲存方案是按照寫入時間順序儲存，假設每小時寫入量是千萬級別，那麼分表就按照小時維度。也就是說，2019年7月18號10點資料寫入到表tbcatdata2019071810中，2019年7月18號12點資料寫入到表tbcatdata2019071812中，2019年7月20號14點資料寫入到表tbcatdata2019072014中。這樣做的優點如下：

歷史資料不用遷移；
擴容非常簡單；

缺點如下：

讀寫熱點集中，所有寫操作全部打在最新的表上。

有沒有發現，這個方案的優點就是我們需要的。BINGO，要的就是這樣的方案。那麼對應到使用者表上來具體的分表方案非常類似：按照range切分。需要說明的是，這個方案的前提是使用者ID一定要趨勢遞增，最好嚴格遞增。筆者給出3種使用者ID遞增的方案：

自增ID

假設存量資料使用者表的id最大值是960W，那麼分表演演算法是這樣的，表序號只需要根據user_id/10000000就能得到：

使用者ID在範圍[1, 10000000)中分到tbuser0中（需要將tbuser重新命名為tbuser_0）；
使用者ID在範圍[10000000, 20000000)中分到tbuser1中；
使用者ID在範圍[20000000, 30000000)中分到tbuser2中；
使用者ID在範圍[30000000, 40000000)中分到tbuser3中；
以此類推。

如果你的tbuser本來就有自增主鍵，那這種方案就比較好。但是需要註意幾點，由於使用者ID是自增的，所以這個ID不能透過HTTP暴露出去，否則可以透過新註冊一個使用者後，就能得到你的真實使用者數，這是比較危險的。其次，存量資料在單表中可以透過自增ID生成，但是當切換分表後，使用者ID如果還是用自增生成，需要註意在建立新表時設定AUTOINCREMENT，例如建立表tbuser2時，設定AUTO_INCREMENT=10000000，DDL如下：

CREATE TABLE if not exists `tb_user_2` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT PRIMARY KEY,
`username` varchar(16) NOT NULL COMMENT '使用者名稱',
`remark` varchar(16) NOT NULL COMMENT '備註'
) ENGINE=InnoDB AUTO_INCREMENT=10000000;
- 這樣的話，當新增使用者時，使用者ID就會從10000000開始，而不會與之前的使用者ID衝突
insert into tb_user_2 values(null, 'afei', 'afei');

Redis incr

第二種方案就是利用Redis的incr命令。將之前最大的ID儲存到Redis中，接下來新增使用者的ID值都透過incr命令得到。然後insert到表tbuser中。這種方案需要註意Redis主從切換後，晉升為主的Redis節點中的ID可能由於同步時間差不是最新ID的問題。這樣的話，可能會導致插入記錄到tbuser失敗。需要對這種異常特殊處理一下即可。

利用雪花演演算法生成

採用類雪花演演算法生成使用者ID，這種方式不太好精確掌握切分表的時機。因為沒有高效獲取tbuser表資料量的辦法，也就不知道什麼時候表資料量達到1000w級別，也就不知道什麼時候需要往新表中插入資料（select count(*) from tbuser無論怎麼最佳化效能都不會很高，除非是MyISAM引擎）。而且如果利用雪花演演算法生成使用者ID，那麼還需要一張表儲存使用者ID和分表關係：

筆者推薦第一種方案，即利用表自增ID生成使用者ID：方案越簡單，可靠性越高。其他兩種方案，或者其他方案或多或少需要引入一些中介軟體或者介質，從而增加方案的複雜度。新方案效果圖如下：

回顧總結

我們回頭看一下這種使用者表方案，滿足了存量資料不需要做任何遷移（除非是存量資料遠遠超過單表承受能力）。而且，無論使用者規模增長到多大量級，1億，10億，50億，後面都不需要做資料遷移。而且也不再需要開發和運維介入。因為整個方案，會自己往新表中插入資料。我們唯一需要做的就是，根據硬體效能，約定一個庫允許儲存的使用者表數量即可。假如一個庫儲存64張表，那麼當擴容到第65張表時，程式會自動往第二個庫的第一張表中寫入。

釋出到看一看

</div><br />
<p><span class=”like_comment_msg” id=”js_b_like_comment_msg” style=”visibility: hidden;”>最多200字，當前共<span id=”js_b_like_current_cnt”/>字</span><br />
</div><br />
</div><br />
<div class=”like_comment_primary_mask” id=”js_mask_2″/><br />
</div><br />
<div id=”js_loading” style=” display: none;”><br />
<div class=”weui-mask_transparent”/><br />
<div class=”weui-toast”><br />
<i class=”weui-loading weui-icon_toast”/></p><br />
<p class=”weui-toast__content”>傳送中</p><br />
</div><br />
</div><br />
<div class=”weui-desktop-popover weui-desktop-popover_pos-up-center weui-desktop-popover_img-text” id=”js_pc_weapp_code” style=”display: none;”><br />
<div class=”weui-desktop-popover__content”><br />
<div class=”weui-desktop-popover__desc”><br />
<img id=”js_pc_weapp_code_img”/><br /><br />
            微信掃一掃<br/>使用小程式<span id=”js_pc_weapp_code_des”/> </div><br />
</div><br />
</div><br />
<div id=”js_minipro_dialog” style=”display:none;”><br />
<div class=”weui-mask”/><br />
<div class=”weui-dialog weui-dialog_link”><br />
<div class=”weui-dialog__bd” id=”js_minipro_dialog_name”/><br />
<div class=”weui-dialog__ft”><br />
<a class=”weui-dialog__btn weui-dialog__btn_default” href=”javascript:void(0);” id=”js_minipro_dialog_cancel”>取消</a><br /><br />
<a class=”weui-dialog__btn weui-dialog__btn_primary” href=”javascript:void(0);” id=”js_minipro_dialog_ok”>允許</a><br />
</div><br />
</div><br />
</div><br />
<div id=”js_link_dialog” style=”display:none;”><br />
<div class=”weui-mask”/><br />
<div class=”weui-dialog weui-dialog_link”><br />
<div class=”weui-dialog__bd” id=”js_link_dialog_name”>即將開啟一個新頁面</div><br />
<div class=”weui-dialog__ft”><br />
<a class=”weui-dialog__btn weui-dialog__btn_default” href=”javascript:void(0);” id=”js_link_dialog_cancel”>取消</a><br /><br />
<a class=”weui-dialog__btn weui-dialog__btn_primary” href=”javascript:void(0);” id=”js_link_dialog_ok”>允許</a><br />
</div><br />
</div><br />
</div><br />
<div id=”js_weapp_without_auth_dialog” style=”display:none;”><br />
<div class=”weui-mask”/><br />
<div class=”weui-dialog weui-dialog_link”><br />
<div class=”weui-dialog__bd” id=”js_weapp_without_auth_dialog_name”/><br />
<div class=”weui-dialog__ft”><br />
<a class=”weui-dialog__btn weui-dialog__btn_primary” href=”javascript:void(0);” id=”js_weapp_without_auth_dialog_ok”>確定</a><br />
</div><br />
</div><br />
</div><br />
</div><br />

分庫分表實戰：可能是使用者表最佳分庫分表方案

回顧總結

朋友會在“發現-看一看”看到你“在看”的內容

朋友將在看一看看到

釋出到看一看

相關推薦

熱門標籤

熱門文章

分享創造快樂