歡迎光臨
每天分享高質量文章

Linux 軟中斷機制分析

軟中斷分析最近工作繁忙,沒有時間總結內核相關的一些東西。上次更新博客到了linux內核中斷子系統。這次總結一下軟中斷,也就是softirq。之後還會總結一些tasklet、工作佇列機制。

1.為什麼要軟中斷

編寫驅動的時候,一個中斷產生之後,內核在中斷處理函式中可能需要完成很多工作。但是中斷處理函式的處理是關閉了中斷的。也就是說在響應中斷時,系統不能再次響應外部的其它中斷。這樣的後果會造成有可能丟失外部中斷。於是,linux內核設計出了一種架構,中斷函式需要處理的任務分為兩部分,一部分在中斷處理函式中執行,這時系統關閉中斷。另外一部分在軟體中斷中執行,這個時候開啟中斷,系統可以響應外部中斷。

關於軟體中斷的理論各種書籍都有介紹,不多敘述。而要真正體會軟體中斷的作用就必須從代碼的角度來分析。我們做工作時候講求的是professional,當一個人在某個領域一無所知的時候,我們稱他為小白,偶,非蘋果電腦。小白的腦子裡充滿了各種問題。慢慢的當這些疑惑解釋完之後,小白就脫白了。此時,我們對這個領域的基本框架有瞭解,但這和professional還有一定的差距。再加以時日,逐漸融會貫通該領域才能達到專業的境界。

2. 什麼時候觸發處理軟體中斷

說了這麼多廢話,趕快步入正題。初識軟中斷,腦子裡肯定有不少的疑問,首先就是軟體中斷在什麼地方被觸發處理?這個問題的答案就是:一個硬體中斷處理完成之後。下麵的函式在處理完硬體中斷之後推出中斷處理函式,在irq_exit中會觸發軟體中斷的處理。

這裡要註意,invoke_softirq必須滿足兩個條件才能被呼叫到,一個就是不是在硬體中斷處理過程中或者在軟體中斷處理中,第二個就是必須有軟體中斷處於pending狀態。第二個好理解,有軟體中斷產生才去處理,沒有就不處理。第一個就不好理解了。

在linux系統的行程資料結構里,有這麼一個資料結構

#define preempt_count()(current_thread_info()->preempt_count),

利用preempt_count可以表示是否處於中斷處理或者軟體中斷處理過程中。

preempt_count的8~23位記錄中斷處理和軟體中斷處理過程的計數。如果有計數,表示系統在硬體中斷或者軟體中斷處理過程中。系統這麼設計是為了避免軟體中斷在中斷嵌套中被呼叫,並且達到在單個CPU上軟體中斷不能被重入的目的。對於ARM架構的CPU不存在中斷嵌套中呼叫軟體中斷的問題,因為ARM架構的CPU在處理硬體中斷的過程中是關閉掉中斷的。只有在進入了軟中斷處理過程中之後才會開啟硬體中斷,如果在軟體中斷處理過程中有硬體中斷嵌套,也不會再次呼叫軟中斷,because硬體中斷是軟體中斷處理過程中再次進入的,此時preempt_count已經記錄了軟體中斷!對於其它架構的CPU,有可能在觸發呼叫軟體中斷前,也就是還在處理硬體中斷的時候,就已經開啟了硬體中斷,可能會發生中斷嵌套,在中斷嵌套中是不允許呼叫軟體中斷處理的。Why?我的理解是,在發生中斷嵌套的時候,表明這個時候是系統突發繁忙的時候,內核第一要務就是趕緊把中斷中的事情處理完成,退出中斷嵌套。避免多次嵌套,哪裡有時間處理軟體中斷,所以把軟體中斷推遲到了所有中斷處理完成的時候才能觸發軟體中斷。

3. 軟體中斷的處理過程

之前我已經說到,軟中斷的一個很大的目的就是避免中斷處理中,處理的操作過多而丟失中斷。同時中斷還需要考慮到一件事情就是中斷處理過程過長就會影響系統響應時間。如果一個中斷處理一秒鐘,那你一定能感受到串口卡住的現象。從另外一方面說呢,我們又必須考慮中斷處理的操作一定的優先度,畢竟是硬體觸發的事務,關係到網絡、塊設備的效率問題。Linux內核就中斷方面就必須考慮平衡這三個方面的問題。而下麵我要分析的__do_softirq函式就恰似在這三者之間打太極,游刃有餘,面面俱到!


 

__do_softirq函式處理軟體中斷過程如下圖流程分析

4. 首先呼叫local_softirq_pending函式取得目前有哪些位存在軟體中斷

5. 呼叫__local_bh_disable關閉軟中斷,其實就是設置正在處理軟體中斷標記,在同一個CPU上使得不能重入__do_softirq函式

6. 重新設置軟中斷標記為0,set_softirq_pending重新設置軟中斷標記為0,這樣在之後重新開啟中斷之後硬體中斷中又可以設置軟體中斷位。

7. 開啟硬體中斷

8. 之後在一個迴圈中,遍歷pending標誌的每一位,如果這一位設置就會呼叫軟體中斷的處理函式。在這個過程中硬體中斷是開啟的,隨時可以打斷軟體中斷。這樣保證硬體中斷不會丟失。

9. 之後關閉硬體中斷,查看是否又有軟體中斷處於pending狀態,如果是,並且在本次呼叫__do_softirq函式過程中沒有累計重覆進入軟體中斷處理的次數超過10次,就可以重新呼叫軟體中斷處理。如果超過了10次,就呼叫wakeup_softirqd();喚醒內核的一個行程來處理軟體中斷。設立10次的限制,也是為了避免影響系統響應時間。

4. 處理軟中斷內核執行緒

之前我說到不能讓CPU長時間來處理中斷事務,這樣會影響系統的響應時間,嚴重影響用戶和系統之間的交互式體驗。所以在之前的__do_softirq中最多將迴圈執行10次,那麼當執行了10次仍然有軟中斷在pending狀態,這個時候應該怎麼處理呢?系統將喚醒一個軟體中斷處理的內核行程,在內核行程中處理pending中的軟體中斷。這裡要註意,之前我們分析的觸發軟體中斷的位置其實是中斷背景關係中,而在軟中斷的內核執行緒中實際已經是行程的背景關係。

這裡說的軟中斷背景關係指的就是系統為每個CPU建立的ksoftirqd行程。

看完這個函式,我不得不佩服這個函式設計的精巧!而我更多的從中體會到其中蘊藏的一種做人的道理。那就是做人要霸道一點,太謙和太恭維不行,但是又不能橫行霸道,原則的問題要公平講理,一定的時候顧及別人的利益,好處不能一個人獨吞。這就跟下麵ksoftirqd處理過程一樣,該狠的時候禁止搶占,其它行程別想調度到哦,但是自己占用CPU時間過長的話,也自覺的問一問是不是該釋放CPU給其它行程了。

下麵我們就來分析一下這個處理過程怎麼就體現了上面的這種說法呢?軟中斷的內核行程中主要有兩個大迴圈,外層的迴圈處理有軟體中斷就處理,沒有軟體中斷就休眠。內層的迴圈處理軟體中斷,並每迴圈一次都試探一次是否過長時間占據了CPU,需要調度釋放CPU給其它行程。具體的操作在註釋中做瞭解釋。

作者郵箱:Andy.yx.deng@gmail.com


來源:alloysystem 

鏈接:http://blog.chinaunix.net/uid-28236237-id-3450751.html



————近期開班————

《馬哥Linux雲計算及架構師》課程,由知名Linux佈道師馬哥創立,經歷了8年的發展,聯合阿裡巴巴、唯品會、大眾點評、騰訊、陸金所等大型互聯網一線公司的馬哥課程團隊的工程師進行深度定製開發,課程採用 Centos7.2系統教學,加入了大量實戰案例,授課案例均來自於一線的技術案例,自動化運維、Devops、雲服務、python等技能一站式搞定,掌握2018年linux雲計算高薪未來。

29期網絡班:2018年02月10日(網絡)

30期面授班:2018年03月26日(北京)

掃描二維碼領取學習資料

更多Linux好文請點擊【閱讀原文】哦

↓↓↓

赞(0)

分享創造快樂

© 2022 知識星球   网站地图