歡迎光臨
每天分享高質量文章

Linux 中的“大記憶體頁”(hugepage)是個什麼? | Linux 中國

學習 Linux 中的大記憶體頁(hugepage)。理解什麼是“大記憶體頁”,如何進行配置,如何檢視當前狀態以及如何禁用它。
— Shrikant Lavhate


致謝
編譯自 | https://kerneltalks.com/services/what-is-huge-pages-in-linux/ 
 作者 | Shrikant Lavhate
 譯者 | DarkSun (lujun9972) ? ? ? ? 共計翻譯:77 篇 貢獻時間:106 天

學習 Linux 中的大記憶體頁hugepage。理解什麼是“大記憶體頁”,如何進行配置,如何檢視當前狀態以及如何禁用它。

本文中我們會詳細介紹大記憶體頁huge page,讓你能夠回答:Linux 中的“大記憶體頁”是什麼?在 RHEL6、RHEL7、Ubuntu 等 Linux 中,如何啟用/禁用“大記憶體頁”?如何檢視“大記憶體頁”的當前值?

首先讓我們從“大記憶體頁”的基礎知識開始講起。

Linux 中的“大記憶體頁”是個什麼玩意?

“大記憶體頁”有助於 Linux 系統進行虛擬記憶體管理。顧名思義,除了標準的 4KB 大小的頁面外,它們還能幫助管理記憶體中的巨大的頁面。使用“大記憶體頁”,你最大可以定義 1GB 的頁面大小。

在系統啟動期間,你能用“大記憶體頁”為應用程式預留一部分記憶體。這部分記憶體,即被“大記憶體頁”佔用的這些儲存器永遠不會被交換出記憶體。它會一直保留其中,除非你修改了配置。這會極大地提高像 Oracle 資料庫這樣的需要海量記憶體的應用程式的效能。

為什麼使用“大記憶體頁”?

在虛擬記憶體管理中,核心維護一個將虛擬記憶體地址對映到物理地址的表,對於每個頁面操作,核心都需要載入相關的對映。如果你的記憶體頁很小,那麼你需要載入的頁就會很多,導致核心會載入更多的對映表。而這會降低效能。

使用“大記憶體頁”,意味著所需要的頁變少了。從而大大減少由核心載入的對映表的數量。這提高了核心級別的效能最終有利於應用程式的效能。

簡而言之,透過啟用“大記憶體頁”,系統具只需要處理較少的頁面對映表,從而減少訪問/維護它們的開銷!

如何配置“大記憶體頁”?

執行下麵命令來檢視當前“大記憶體頁”的詳細內容。

  1. root@kerneltalks # grep Huge /proc/meminfo

  2. AnonHugePages:         0 kB

  3. HugePages_Total:       0

  4. HugePages_Free:        0

  5. HugePages_Rsvd:        0

  6. HugePages_Surp:        0

  7. Hugepagesize:       2048 kB

從上面輸出可以看到,每個頁的大小為 2MB(Hugepagesize),並且系統中目前有 0個“大記憶體頁”(HugePages_Total)。這裡“大記憶體頁”的大小可以從 2MB 增加到 1GB

執行下麵的指令碼可以知道系統當前需要多少個巨大頁。該指令碼取之於 Oracle。

  1. #!/bin/bash

  2. #

  3. # hugepages_settings.sh

  4. #

  5. # Linux bash script to compute values for the

  6. # recommended HugePages/HugeTLB configuration

  7. #

  8. # Note: This script does calculation for all shared memory

  9. # segments available when the script is run, no matter it

  10. # is an Oracle RDBMS shared memory segment or not.

  11. # Check for the kernel version

  12. KERN=`uname -r | awk -F. '{ printf("%d.%d\n",$1,$2); }'`

  13. # Find out the HugePage size

  14. HPG_SZ=`grep Hugepagesize /proc/meminfo | awk {'print $2'}`

  15. # Start from 1 pages to be on the safe side and guarantee 1 free HugePage

  16. NUM_PG=1

  17. # Cumulative number of pages required to handle the running shared memory segments

  18. for SEG_BYTES in `ipcs -m | awk {'print $5'} | grep "[0-9][0-9]*"`

  19. do

  20.   MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q`

  21.   if [ $MIN_PG -gt 0 ]; then

  22.      NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q`

  23.   fi

  24. done

  25. # Finish with results

  26. case $KERN in

  27.   '2.4') HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`;

  28.          echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;;

  29.   '2.6' | '3.8' | '3.10' | '4.1' ) echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;;

  30.    *) echo "Unrecognized kernel version $KERN. Exiting." ;;

  31. esac

  32. # End

將它以 hugepages_settings.sh 為名儲存到 /tmp 中,然後執行之:

  1. root@kerneltalks # sh /tmp/hugepages_settings.sh

  2. Recommended setting: vm.nr_hugepages = 124

你的輸出類似如上結果,只是數字會有一些出入。

這意味著,你係統需要 124 個每個 2MB 的“大記憶體頁”!若你設定頁面大小為 4MB,則結果就變成了 62。你明白了吧?

配置核心中的“大記憶體頁”

本文最後一部分內容是配置上面提到的 核心引數 [1] ,然後重新載入。將下麵內容新增到 /etc/sysctl.conf 中,然後輸入 sysctl -p 命令重新載入配置。

  1. vm.nr_hugepages=126

註意我們這裡多加了兩個額外的頁,因為我們希望在實際需要的頁面數量之外多一些額外的空閑頁。

現在,核心已經配置好了,但是要讓應用能夠使用這些“大記憶體頁”還需要提高記憶體的使用閥值。新的記憶體閥值應該為 126 個頁 x 每個頁 2 MB = 252 MB,也就是 258048 KB。

你需要編輯 /etc/security/limits.conf 中的如下配置:

  1. soft memlock 258048

  2. hard memlock 258048

某些情況下,這些設定是在指定應用的檔案中配置的,比如 Oracle DB 就是在 /etc/security/limits.d/99-grid-oracle-limits.conf 中配置的。

這就完成了!你可能還需要重啟應用來讓應用來使用這些新的巨大頁。

如何禁用“大記憶體頁”?

“大記憶體頁”預設是開啟的。使用下麵命令來檢視“大記憶體頁”的當前狀態。

  1. root@kerneltalks# cat /sys/kernel/mm/transparent_hugepage/enabled

  2. [always] madvise never

輸出中的 [always] 標誌說明系統啟用了“大記憶體頁”。

若使用的是基於 RedHat 的系統,則應該要檢視的檔案路徑為 /sys/kernel/mm/redhat_transparent_hugepage/enabled

若想禁用“大記憶體頁”,則在 /etc/grub.conf 中的 kernel 行後面加上 transparent_hugepage=never,然後重啟系統。


via: https://kerneltalks.com/services/what-is-huge-pages-in-linux/

作者:Shrikant Lavhate[3] 譯者:lujun9972 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出

贊(0)

分享創造快樂