歡迎光臨
每天分享高質量文章

為什麼說Redis是單執行緒的?

作者:徐劉根

https://blog.csdn.net/xlgen157387/article/details/79470556


一、前言

近乎所有與Java相關的面試都會問到快取的問題,基礎一點的會問到什麼是“二八定律”、什麼是“熱資料和冷資料” ,複雜一點的會問到快取雪崩、快取穿透、快取預熱、快取更新、快取降級等問題,這些看似不常見的概念,都與我們的快取服務器相關,一般常用的快取服務器有Redis、Memcached等,而筆者目前最常用的也只有Redis這一種。

如果你在以前面試的時候還沒有遇到過面試官問你:為什麼說Redis是單執行緒或者Redis為什麼這麼快?,那麼你看到這篇文章的時候,你應該覺得是一件很幸運的事情!如果你剛好是一位高逼格的面試官,你也可以拿這道題去面試對面“望穿秋水”般的小伙伴,測試一下他的掌握程度。

好啦!步入正題!我們先探討一下Redis是什麼,Redis為什麼這麼快、然後在探討一下為什麼Redis是單執行緒的?

二、Redis簡介

Redis是一個開源的記憶體中的資料結構儲存系統,它可以用作:資料庫、快取和訊息中間件

它支持多種型別的資料結構,如字串(Strings),散列(Hash),串列(List),集合(Set),有序集合(Sorted Set或者是ZSet)與範圍查詢,Bitmaps,Hyperloglogs 和地理空間(Geospatial)索引半徑查詢。其中常見的資料結構型別有:String、List、Set、Hash、ZSet這5種。

Redis 內置了複製(Replication),LUA腳本(Lua scripting), LRU驅動事件(LRU eviction),事務(Transactions) 和不同級別的磁盤持久化(Persistence),並通過 Redis哨兵(Sentinel)和自動分割槽(Cluster)提供高可用性(High Availability)。

Redis也提供了持久化的選項,這些選項可以讓用戶將自己的資料儲存到磁盤上面進行儲存。根據實際情況,可以每隔一定時間將資料集匯出到磁盤(快照),或者追加到命令日誌中(AOF只追加檔案),他會在執行寫命令時,將被執行的寫命令複製到硬碟裡面。您也可以關閉持久化功能,將Redis作為一個高效的網絡的快取資料功能使用。

Redis不使用表,他的資料庫不會預定義或者強制去要求用戶對Redis儲存的不同資料進行關聯。

資料庫的工作樣式按儲存方式可分為:硬碟資料庫和記憶體資料庫。Redis 將資料儲存在記憶體裡面,讀寫資料的時候都不會受到硬碟 I/O 速度的限制,所以速度極快。

1、硬碟資料庫的工作樣式: 

2、記憶體資料庫的工作樣式:

看完上述的描述,對於一些常見的Redis相關的面試題,是否有所認識了,例如:什麼是Redis、Redis常見的資料結構型別有哪些、Redis是如何進行持久化的等。

三、Redis到底有多快

Redis採用的是基於記憶體的採用的是單行程單執行緒模型的 KV 資料庫由C語言編寫,官方提供的資料是可以達到100000+的QPS(每秒內查詢次數)。這個資料不比採用單行程多執行緒的同樣基於記憶體的 KV 資料庫 Memcached 差!有興趣的可以參考官方的基準程式測試:https://redis.io/topics/benchmarks

橫軸是連接數,縱軸是QPS。此時,這張圖反映了一個數量級,希望大家在面試的時候可以正確的描述出來,不要問你的時候,你回答的數量級相差甚遠!

四、Redis為什麼這麼快

1、完全基於記憶體,絕大部分請求是純粹的記憶體操作,非常快速。資料存在記憶體中,類似於HashMap,HashMap的優勢就是查找和操作的時間複雜度都是O(1);

2、資料結構簡單,對資料操作也簡單,Redis中的資料結構是專門進行設計的;

3、採用單執行緒,避免了不必要的背景關係切換和競爭條件,也不存在多行程或者多執行緒導致的切換而消耗 CPU,不用去考慮各種鎖的問題,不存在加鎖釋放鎖操作,沒有因為可能出現死鎖而導致的性能消耗;

4、使用多路I/O復用模型,非阻塞IO;

5、使用底層模型不同,它們之間底層實現方式以及與客戶端之間通信的應用協議不一樣,Redis直接自己構建了VM 機制 ,因為一般的系統呼叫系統函式的話,會浪費一定的時間去移動和請求;

以上幾點都比較好理解,下邊我們針對多路 I/O 復用模型進行簡單的探討:

(1)多路 I/O 復用模型

多路I/O復用模型是利用 select、poll、epoll 可以同時監察多個流的 I/O 事件的能力,在空閑的時候,會把當前執行緒阻塞掉,當有一個或多個流有 I/O 事件時,就從阻塞態中喚醒,於是程式就會輪詢一遍所有的流(epoll 是只輪詢那些真正發出了事件的流),並且只依次順序的處理就緒的流,這種做法就避免了大量的無用操作。

這裡“多路”指的是多個網絡連接,“復用”指的是復用同一個執行緒。採用多路 I/O 復用技術可以讓單個執行緒高效的處理多個連接請求(儘量減少網絡 IO 的時間消耗),且 Redis 在記憶體中運算元據的速度非常快,也就是說記憶體內的操作不會成為影響Redis性能的瓶頸,主要由以上幾點造就了 Redis 具有很高的吞吐量。

五、那麼為什麼Redis是單執行緒的

我們首先要明白,上邊的種種分析,都是為了營造一個Redis很快的氛圍!官方FAQ表示,因為Redis是基於記憶體的操作,CPU不是Redis的瓶頸,Redis的瓶頸最有可能是機器記憶體的大小或者網絡帶寬。既然單執行緒容易實現,而且CPU不會成為瓶頸,那就順理成章地採用單執行緒的方案了(畢竟採用多執行緒會有很多麻煩!)。

可以參考:https://redis.io/topics/faq

看到這裡,你可能會氣哭!本以為會有什麼重大的技術要點才使得Redis使用單執行緒就可以這麼快,沒想到就是一句官方看似糊弄我們的回答!但是,我們已經可以很清楚的解釋了為什麼Redis這麼快,並且正是由於在單執行緒樣式的情況下已經很快了,就沒有必要在使用多執行緒了!

但是,我們使用單執行緒的方式是無法發揮多核CPU 性能,不過我們可以通過在單機開多個Redis 實體來完善!

警告1:這裡我們一直在強調的單執行緒,只是在處理我們的網絡請求的時候只有一個執行緒來處理,一個正式的Redis Server運行的時候肯定是不止一個執行緒的,這裡需要大家明確的註意一下!例如Redis進行持久化的時候會以子行程或者子執行緒的方式執行(具體是子執行緒還是子行程待讀者深入研究);例如我在測試服武器上查看Redis行程,然後找到該行程下的執行緒:

ps命令的“-T”引數表示顯示執行緒(Show threads, possibly with SPID column.)“SID”欄表示執行緒ID,而“CMD”欄則顯示了執行緒名稱。

警告2:在上圖中FAQ中的最後一段,表述了從Redis 4.0版本開始會支持多執行緒的方式,但是,只是在某一些操作上進行多執行緒的操作!所以該篇文章在以後的版本中是否還是單執行緒的方式需要讀者考證!

六、擴展

以下也是你應該知道的幾種模型,祝你的面試一臂之力!

1、單行程多執行緒模型:MySQL、Memcached、Oracle(Windows版本);

2、多行程模型:Oracle(Linux版本);

3、Nginx有兩類行程,一類稱為Master行程(相當於管理行程),另一類稱為Worker行程(實際工作行程)。啟動方式有兩種:

(1)單行程啟動:此時系統中僅有一個行程,該行程既充當Master行程的角色,也充當Worker行程的角色。

(2)多行程啟動:此時系統有且僅有一個Master行程,至少有一個Worker行程工作。

(3)Master行程主要進行一些全域性性的初始化工作和管理Worker的工作;事件處理是在Worker中進行的。

(完)


●編號392,輸入編號直達本文

●輸入m獲取文章目錄

推薦↓↓↓

 

Web開發

更多推薦18個技術類微信公眾號

涵蓋:程式人生、演算法與資料結構、黑客技術與網絡安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。

赞(0)

分享創造快樂