歡迎光臨
每天分享高質量文章

Go 程式的持續分析 | Linux 中國

Google 最有趣的部分之一就是我們規模龐大的持續分析服務。
— Jbd


致謝
編譯自 | https://medium.com/google-cloud/continuous-profiling-of-go-programs-96d4416af77b 
 作者 | Jbd
 譯者 | geekpi ? ? 共計翻譯:729 篇 貢獻時間:1683 天

Google 最有趣的部分之一就是我們規模龐大的持續分析服務。我們可以看到誰在使用 CPU 和記憶體,我們可以持續地監控我們的生產服務以爭用和阻止配置檔案,並且我們可以生成分析和報告,並輕鬆地告訴我們可以進行哪些有重要影響的最佳化。

我簡單研究了 Stackdriver Profiler[1],這是我們的新產品,它填補了針對雲端使用者在雲服務範圍內分析服務的空白。請註意,你無需在 Google 雲平臺上執行你的程式碼即可使用它。實際上,我現在每天都在開發時使用它。它也支援 Java 和 Node.js。

在生產中分析

pprof 可安全地用於生產。我們針對 CPU 和堆分配分析的額外會增加 5% 的開銷。一個實體中每分鐘收集 10 秒。如果你有一個 Kubernetes Pod 的多個副本,我們確保進行分攤收集。例如,如果你擁有一個 pod 的 10 個副本,樣式,那麼開銷將變為 0.5%。這使使用者可以一直進行分析。

我們目前支援 Go 程式的 CPU、堆、互斥和執行緒分析。

為什麼?

在解釋如何在生產中使用分析器之前,先解釋為什麼你想要在生產中進行分析將有所幫助。一些非常常見的情況是:

◈ 除錯僅在生產中可見的效能問題。
◈ 瞭解 CPU 使用率以減少費用。
◈ 瞭解爭用的累積和最佳化的地方。
◈ 瞭解新版本的影響,例如看到 canary 和產品級之間的區別。
◈ 透過關聯[2]分析樣本以瞭解延遲的根本原因來豐富你的分散式經驗。

啟用

Stackdriver Profiler 不能與 net/http/pprof 處理程式一起使用,並要求你在程式中安裝和配置一個一行的代理。

  1. go get cloud.google.com/go/profiler

在你的主函式中,啟動分析器:

  1. if err := profiler.Start(profiler.Config{

  2.   Service:        "indexing-service",

  3.   ServiceVersion: "1.0",

  4.   ProjectID:      "bamboo-project-606", // optional on GCP

  5. }); err != nil {

  6.   log.Fatalf("Cannot start the profiler: %v", err)

  7. }

當你執行你的程式後,profiler 包將每分鐘報告給分析器 10 秒鐘。

視覺化

當分析被報告給後端後,你將在 https://console.cloud.google.com/profiler 上看到火焰圖。你可以按標簽過濾並更改時間範圍,也可以按服務名稱和版本進行細分。資料將會長達 30 天。

你可以選擇其中一個分析,按服務,區域和版本分解。你可以在火焰中移動並透過標簽進行過濾。

閱讀火焰圖

Brendan Gregg[4] 非常全面地解釋了火焰圖視覺化。Stackdriver Profiler 增加了一點它自己的特點。

我們將檢視一個 CPU 分析,但這也適用於其他分析。

☉ 最上面的 x 軸表示整個程式。火焰上的每個框表示呼叫路徑上的一幀。框的寬度與執行該函式花費的 CPU 時間成正比。
☉ 框從左到右排序,左邊是花費最多的呼叫路徑。
☉ 來自同一包的幀具有相同的顏色。這裡所有執行時功能均以綠色表示。
☉ 你可以單擊任何框進一步展開執行樹。

你可以將滑鼠懸停在任何框上檢視任何幀的詳細資訊。

過濾

你可以顯示、隱藏和高亮符號名稱。如果你特別想瞭解某個特定呼叫或包的消耗,這些資訊非常有用。

☉ 選擇你的過濾器。你可以組合多個過濾器。在這裡,我們將高亮顯示 runtime.memmove
☉ 火焰將使用過濾器過濾幀並視覺化過濾後的框。在這種情況下,它高亮顯示所有 runtime.memmove 框。

via: https://medium.com/google-cloud/continuous-profiling-of-go-programs-96d4416af77b

作者:JBD[6] 譯者:geekpi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出

贊(0)

分享創造快樂