Why Not NoSQL/NewSQL?

Why Not 分割槽?

Why 分庫分表?

實戰案例

訂單表

使用者表

賬戶表

複雜查詢

es+HBase簡要

延伸閱讀

es+HBase原理

HBase檢索能力擴充套件

總結

鳴謝

每個優秀的程式員和架構師都應該掌握分庫分表，這是我的觀點。

移動網際網路時代，海量的使用者每天產生海量的數量，比如：

使用者表
訂單表
交易流水錶

以支付寶使用者為例，8億；微信使用者更是10億。訂單表更誇張，比如美團外賣，每天都是幾千萬的訂單。淘寶的歷史訂單總量應該百億，甚至千億級別，這些海量資料遠不是一張表能Hold住的。事實上MySQL單表可以儲存10億級資料，只是這時候效能比較差，業界公認MySQL單表容量在1KW以下是最佳狀態，因為這時它的BTREE索引樹高在3~5之間。

既然一張表無法搞定，那麼就想辦法將資料放到多個地方，目前比較普遍的方案有3個：

分割槽；
分庫分表；
NoSQL/NewSQL；

說明：只分庫，或者只分表，或者分庫分表融合方案都統一認為是分庫分表方案，因為分庫，或者分表只是一種特殊的分庫分表而已。NoSQL比較具有代表性的是MongoDB，es。NewSQL比較具有代表性的是TiDB。

Why Not NoSQL/NewSQL?

首先，為什麼不選擇第三種方案NoSQL/NewSQL，我認為主要是RDBMS有以下幾個優點：
– RDBMS生態完善；
– RDBMS絕對穩定；
– RDBMS的事務特性；

NoSQL/NewSQL作為新生兒，在我們把可靠性當做首要考察物件時，它是無法與RDBMS相提並論的。RDBMS發展幾十年，只要有軟體的地方，它都是核心儲存的首選。

目前絕大部分公司的核心資料都是：以RDBMS儲存為主，NoSQL/NewSQL儲存為輔！網際網路公司又以MySQL為主，國企&銀行等不差錢的企業以Oracle/DB2為主！NoSQL/NewSQL宣傳的無論多牛逼，就現在各大公司對它的定位，都是RDBMS的補充，而不是取而代之！

Why Not 分割槽?

我們再看分割槽表方案。瞭解這個方案之前，先瞭解它的原理：

分割槽表是由多個相關的底層表實現，這些底層表也是由控制代碼物件表示，所以我們也可以直接訪問各個分割槽，儲存引擎管理分割槽的各個底層表和管理普通表一樣（所有的底層表都必須使用相同的儲存引擎），分割槽表的索引只是在各個底層表上各自加上一個相同的索引，從儲存引擎的角度來看，底層表和一個普通表沒有任何不同，儲存引擎也無須知道這是一個普通表還是一個分割槽表的一部分。

事實上，這個方案也不錯，它對使用者遮蔽了sharding的細節，即使查詢條件沒有sharding column，它也能正常工作（只是這時候效能一般）。不過它的缺點很明顯：很多的資源都受到單機的限制，例如連線數，網路吞吐等！雖然每個分割槽可以獨立儲存，但是分割槽表的總入口還是一個MySQL示例。從而導致它的併發能力非常一般，遠遠達不到網際網路高併發的要求！

至於網上提到的一些其他缺點比如：無法使用外來鍵，不支援全文索引。我認為這都不算缺點，21世紀的專案如果還是使用外來鍵和資料庫的全文索引，我都懶得吐槽了！

所以，如果使用分割槽表，你的業務應該具備如下兩個特點：

資料不是海量（分割槽數有限，儲存能力就有限）；
併發能力要求不高；

Why 分庫分表?

最後要介紹的就是目前網際網路行業處理海量資料的通用方法：分庫分表。

雖然大家都是採用分庫分表方案來處理海量核心資料，但是還沒有一個一統江湖的中介軟體，筆者這裡列舉一些有一定知名度的分庫分表中介軟體：

阿裡的TDDL，DRDS和cobar，
開源社群的sharding-jdbc（3.x已經更名為sharding-sphere）；
民間組織的MyCAT；
360的Atlas；
美團的zebra；

備註：sharding-jdbc的作者張亮大神原來在噹噹，現在在京東金融。但是sharding-jdbc的版權屬於開源社群，不是公司的，也不是張亮個人的！

其他比如網易，58，京東等公司都有自研的中介軟體。總之各自為戰，也可以說是百花齊放。

但是這麼多的分庫分表中介軟體全部可以歸結為兩大型別：

CLIENT樣式；
PROXY樣式；

CLIENT樣式代表有阿裡的TDDL，開源社群的sharding-jdbc（sharding-jdbc的3.x版本即sharding-sphere已經支援了proxy樣式）。架構如下：

client arch

PROXY樣式代表有阿裡的cobar，民間組織的MyCAT。架構如下：

但是，無論是CLIENT樣式，還是PROXY樣式。幾個核心的步驟是一樣的：SQL解析，重寫，路由，執行，結果歸併。

筆者比較傾向於CLIENT樣式，架構簡單，效能損耗較小，運維成本低。

接下來，以幾個常見的大表為案例，說明分庫分表如何落地！更多首發文章請關註公眾號：【阿飛的部落格】

實戰案例

分庫分表第一步也是最重要的一步，即sharding column的選取，sharding column選擇的好壞將直接決定整個分庫分表方案最終是否成功。而sharding column的選取跟業務強相關，筆者認為選擇sharding column的方法最主要分析你的API流量，優先考慮流量大的API，將流量比較大的API對應的SQL提取出來，將這些SQL共同的條件作為sharding column。例如一般的OLTP系統都是對使用者提供服務，這些API對應的SQL都有條件使用者ID，那麼，使用者ID就是非常好的sharding column。

這裡列舉分庫分表的幾種主要處理思路：

只選取一個sharding column進行分庫分表；
多個sharding column多個分庫分表；
sharding column分庫分表 + es；

再以幾張實際表為例，說明如何分庫分表。

訂單表

訂單表幾個核心欄位一般如下：

以阿裡訂單系統為例（參考《企業IT架構轉型之道：阿裡巴巴中臺戰略思想與架構實現》），它選擇了三個column作為三個獨立的sharding column，即：order_id，user_id，merchant_code。user_id和merchant_code就是買家ID和賣家ID，因為阿裡的訂單系統中買家和賣家的查詢流量都比較大，並且查詢對實時性要求都很高。而根據order_id進行分庫分表，應該是根據order_id的查詢也比較多。

這裡還有一點需要提及，多個sharding-column的分庫分表是冗餘全量還是隻冗餘關係索引表，需要我們自己權衡。

冗餘全量的情況如下–每個sharding列對應的表的資料都是全量的，這樣做的優點是不需要二次查詢，效能更好，缺點是比較浪費儲存空間（淺綠色欄位就是sharding-column）：

冗餘關係索引表的情況如下–只有一個sharding column的分庫分表的資料是全量的，其他分庫分表只是與這個sharding column的關係表，這樣做的優點是節省空間，缺點是除了第一個sharding column的查詢，其他sharding column的查詢都需要二次查詢，這三張表的關係如下圖所示（淺綠色欄位就是sharding column）：

冗餘全量表PK.冗餘關係表

速度對比：冗餘全量表速度更快，冗餘關係表需要二次查詢，即使有引入快取，還是多一次網路開銷；
儲存成本：冗餘全量表需要幾倍於冗餘關係表的儲存成本；
維護代價：冗餘全量表維護代價更大，涉及到資料變更時，多張表都要進行修改。

總結：選擇冗餘全量表還是索引關係表，這是一種架構上的trade off，兩者的優缺點明顯，阿裡的訂單表是冗餘全量表。

使用者表

使用者表幾個核心欄位一般如下：

一般使用者登入場景既可以透過mobile_no，又可以透過email，還可以透過username進行登入。但是一些使用者相關的API，又都包含user_id，那麼可能需要根據這4個column都進行分庫分表，即4個列都是sharding-column。

賬戶表

賬戶表幾個核心欄位一般如下：

與賬戶表相關的API，一般條件都有account_no，所以以account_no作為sharding-column即可。

複雜查詢

上面提到的都是條件中有sharding column的SQL執行。但是，總有一些查詢條件是不包含sharding column的，同時，我們也不可能為了這些請求量並不高的查詢，無限制的冗餘分庫分表。那麼這些條件中沒有sharding column的SQL怎麼處理？以sharding-jdbc為例，有多少個分庫分表，就要併發路由到多少個分庫分表中執行，然後對結果進行合併。具體如何合併，可以看筆者sharding-jdbc系列文章，有分析原始碼講解合併原理。

這種條件查詢相對於有sharding column的條件查詢效能很明顯會下降很多。如果有幾十個，甚至上百個分庫分表，只要某個表的執行由於某些因素變慢，就會導致整個SQL的執行響應變慢，這非常符合木桶理論。

更有甚者，那些運營系統中的模糊條件查詢，或者上十個條件篩選。這種情況下，即使單表都不好建立索引，更不要說分庫分表的情況下。那麼怎麼辦呢？這個時候大名鼎鼎的elasticsearch，即es就派上用場了。將分庫分表所有資料全量冗餘到es中，將那些複雜的查詢交給es處理。

淘寶我的所有訂單頁面如下，篩選條件有多個，且商品標題可以模糊匹配，這即使是單表都解決不了的問題（索引滿足不了這種場景），更不要說分庫分表了：

所以，以訂單表為例，整個架構如下：

具體情況具體分析：多sharding column不到萬不得已的情況下最好不要使用，成本較大，上面提到的使用者表筆者就不太建議使用。因為使用者表有一個很大的特點就是它的上限是肯定的，即使全球70億人全是你的使用者，這點資料量也不大，所以筆者更建議採用單sharding column + es的樣式簡化架構。

es+HBase簡要

這裡需要提前說明的是，solr+HBase結合的方案在社群中出現的頻率可能更高，本篇文章為了保持一致性，所有全文索引方案選型都是es。至於es+HBase和solr+HBase孰優孰劣，或者說es和solr孰優孰劣，不是本文需要討論的範疇，事實上也沒有太多討論的意義。es和solr本就是兩個非常優秀且旗鼓相當的中介軟體。最近幾年es更火爆：

如果拋開選型過程中所有歷史包袱，單論es+HBase和solr+HBase的優劣，很明顯後者是更好的選擇。solr+HBase高度整合，引入索引服務後我們最關心，也是最重要的索引一致性問題，solr+HBase已經有了非常成熟的解決方案一一Lily HBase Indexer。

延伸閱讀

阿裡雲上的雲資料庫HBase版也是藉助solr實現全文索引，有興趣的同學可以戳連結瞭解更多：https://help.aliyun.com/product/49055.html?spm=5176.124785.631202.con1.603452c0cz7bj2。

es+HBase原理

剛剛討論到上面的以MySQL為核心，分庫分表+es的方案，隨著資料量越來越來，雖然分庫分表可以繼續成倍擴容，但是這時候壓力又落到了es這裡，這個架構也會慢慢暴露出問題！

一般訂單表，積分明細表等需要分庫分表的核心表都會有好幾十列，甚至上百列（假設有50列），但是整個表真正需要參與條件索引的可能就不到10個條件（假設有10列）。這時候把50個列所有欄位的資料全量索引到es中，對es叢集有很大的壓力，後面的es分片故障恢復也會需要很長的時間。

這個時候我們可以考慮減少es的壓力，讓es叢集有限的資源盡可能儲存條件檢索時最需要的最有價值的資料，即只把可能參與條件檢索的欄位索引到es中，這樣整個es叢集壓力減少到原來的1/5（核心表50個欄位，只有10個欄位參與條件），而50個欄位的全量資料儲存到HBase中，這就是經典的es+HBase組合方案，即索引與資料儲存隔離的方案。

Hadoop體系下的HBase儲存能力我們都知道是海量的，而且根據它的rowkey查詢效能那叫一個快如閃電。而es的多條件檢索能力非常強大。這個方案把es和HBase的優點發揮的淋漓盡致，同時又規避了它們的缺點，可以說是一個揚長避免的最佳實踐。

它們之間的互動大概是這樣的：先根據使用者輸入的條件去es查詢獲取符合過濾條件的rowkey值，然後用rowkey值去HBase查詢，後面這一查詢步驟的時間幾乎可以忽略，因為這是HBase最擅長的場景，互動圖如下所示：

HBase檢索能力擴充套件

圖片來源於HBase技術社群-HBase應用實踐專場-HBase for Solr

總結

最後，對幾種方案總結如下（sharding column簡稱為sc）：

–	單個sc	多個sc	sc+es	sc+es+HBase
適用場景	單一	一般	比較廣泛	非常廣泛
查詢及時性	及時	及時	比較及時	比較及時
儲存能力	一般	一般	較大	海量
程式碼成本	很小	較大	一般	一般
架構複雜度	簡單	一般	較難	非常複雜

總之，對於海量資料，且有一定的併發量的分庫分表，絕不是引入某一個分庫分表中介軟體就能解決問題，而是一項系統的工程。需要分析整個表相關的業務，讓合適的中介軟體做它最擅長的事情。例如有sharding column的查詢走分庫分表，一些模糊查詢，或者多個不固定條件篩選則走es，海量儲存則交給HBase。

做了這麼多事情後，後面還會有很多的工作要做，比如資料同步的一致性問題，還有執行一段時間後，某些表的資料量慢慢達到單表瓶頸，這時候還需要做冷資料遷移。總之，分庫分表是一項非常複雜的系統工程。任何海量資料的處理，都不是簡單的事情，做好戰鬥的準備吧！

鳴謝

最後感謝為這篇文章提出寶貴意見的阿裡大佬右軍[公眾號: 技術瑣話]和陸金所HBase扛把子峰神[公眾號: HBase技術社群]。

筆者寫完這篇文章在第一時間將初稿發給了右軍，大佬很有耐心的看完，和我交流，並於當天下午給我提出了非常寶貴的一些改進意見，這才有了這篇修訂版。

峰神對HBase造詣很深，並且維護著HBase技術社群，為無數HBase學者提供了很好的學習平臺。在修訂這篇文章的時候，與峰神討論了很多。另外，曾經另一位在*1信用卡待過的朋友，他們的HBase出了問題，運維折騰了半天沒有搞定。最後諮詢峰神，只簡單的點撥就搞定了！對HBase感興趣的同學，都可以去社群學習和交流，一定不會讓你失望！

釋出到看一看

</div><br /><br />
<p><span class=”like_comment_msg” id=”js_b_like_comment_msg” style=”visibility: hidden;”>最多200字，當前共<span id=”js_b_like_current_cnt”/>字</span><br /><br />
</div><br /><br />
</div><br /><br />
<div class=”like_comment_primary_mask” id=”js_mask_2″/><br /><br />
</div><br /><br />
<div id=”js_loading” style=” display: none;”><br /><br />
<div class=”weui-mask_transparent”/><br /><br />
<div class=”weui-toast”><br /><br />
<i class=”weui-loading weui-icon_toast”/></p><br /><br />
<p class=”weui-toast__content”>傳送中</p><br /><br />
</div><br /><br />
</div><br /><br />
<div id=”js_fail” style=”display:none”><br /><br />
<div class=”weui-mask”/><br /><br />
<div class=”weui-dialog”><br /><br />
<div class=”weui-dialog__bd”><br /><br />
        網路異常，請稍後重試    </div><br /><br />
<div class=”weui-dialog__ft”><br /><br />
<a class=”weui-dialog__btn weui-dialog__btn_primary” href=”javascript:;” id=”js_fail_inform”>知道了</a><br /><br />
</div><br /><br />
</div><br /><br />
</div><br /><br />
<div class=”weui-desktop-popover weui-desktop-popover_pos-up-center weui-desktop-popover_img-text” id=”js_pc_weapp_code” style=”display: none;”><br /><br />
<div class=”weui-desktop-popover__content”><br /><br />
<div class=”weui-desktop-popover__desc”><br /><br />
<img id=”js_pc_weapp_code_img”/><br /><br /><br />
            微信掃一掃<br/>使用小程式<span id=”js_pc_weapp_code_des”/> </div><br /><br />
</div><br /><br />
</div><br /><br />
<div id=”js_minipro_dialog” style=”display:none;”><br /><br />
<div class=”weui-mask”/><br /><br />
<div class=”weui-dialog”><br /><br />
<div class=”weui-dialog__bd”>即將開啟”<span id=”js_minipro_dialog_name”/>”小程式</div><br /><br />
<div class=”weui-dialog__ft”><br /><br />
<a class=”weui-dialog__btn weui-dialog__btn_default” href=”javascript:void(0);” id=”js_minipro_dialog_cancel”>取消</a><br /><br /><br />
<a class=”weui-dialog__btn weui-dialog__btn_primary” href=”javascript:void(0);” id=”js_minipro_dialog_ok”>開啟</a><br /><br />
</div><br /><br />
</div><br /><br />
</div><br /><br />
</div><br /><br />

一文讀懂分庫分表的技術演進（最佳實踐）

Why Not NoSQL/NewSQL?

Why Not 分割槽?

Why 分庫分表?

實戰案例

訂單表

使用者表

賬戶表

複雜查詢

es+HBase簡要

延伸閱讀

es+HBase原理

HBase檢索能力擴充套件

總結

鳴謝

朋友將在看一看看到

釋出到看一看

相關推薦

熱門標籤

熱門文章

分享創造快樂