本文件說明如何修改 Python 應用程式,以便使用開放原始碼 OpenTelemetry 架構收集追蹤記錄和指標資料,以及如何將結構化 JSON 記錄寫入標準輸出。本文也提供可安裝及執行的 Python 應用程式範例相關資訊。應用程式使用 Flask 網路架構,並已設定為產生指標、追蹤記錄和記錄檔。
如要進一步瞭解檢測功能,請參閱下列文件:
關於手動和零程式碼檢測
針對這門語言,OpenTelemetry 將「零程式碼檢測」定義為從程式庫和架構收集遙測資料的做法,且不必變更程式碼。不過,您確實有安裝模組和設定環境變數。
本文不會說明零程式碼檢測功能。如需該主題的相關資訊,請參閱 Python 零程式碼檢測功能。
如需一般資訊,請參閱「Python 適用的 OpenTelemetry 檢測功能」。
事前準備
Enable the Cloud Logging, Cloud Monitoring, and Cloud Trace APIs.
檢測應用程式以收集追蹤記錄、指標和記錄
如要檢測應用程式以收集追蹤記錄和指標資料,並將結構化 JSON 寫入標準輸出,請按照本文件後續章節所述的步驟操作:
設定 OpenTelemetry
這個範例應用程式已設定為使用 OpenTelemetry Python SDK,透過 OTLP 通訊協定匯出追蹤記錄和指標。根據預設,OpenTelemetry Python SDK 會使用 W3C 追蹤記錄背景資訊格式傳播追蹤記錄背景資訊,確保跨度在追蹤記錄中具有正確的父項-子項關係。
以下程式碼範例說明如何設定 OpenTelemetry 的 Python 模組。如要查看完整範例,請按一下 more_vert「更多」,然後選取「前往 GitHub 查看」。
Flask 應用程式會依照 Flask 部署至實際工作環境指南中的建議,使用 Gunicorn 服務 HTTP 要求。Gunicorn 會在獨立的工作者程序中啟動多個應用程式副本,以提高處理量。為確保工作站程序的指標不會彼此衝突,建議每個工作站程序都為 service.instance.id
資源屬性設定不重複的值。其中一種做法是在 service.instance.id
中加入程序 ID。詳情請參閱「時序衝突」。
如需更多資訊和設定選項,請參閱 OpenTelemetry Python 檢測功能。
設定結構化記錄
如要記錄與追蹤記錄連結的結構化記錄,請將應用程式設為將 JSON 格式的記錄輸出至標準輸出,並包含含有追蹤資訊的鍵。以下程式碼範例說明如何設定標準 logging
程式庫,以便使用 python-json-logger
程式庫輸出 JSON 結構化記錄,以及如何使用 opentelemetry-instrumentation-logging
套件納入追蹤資訊。
先前的設定會從記錄訊息中擷取有效時間間隔的相關資訊,然後將該資訊做為屬性新增至 JSON 結構化記錄。這些屬性可用於將記錄與追蹤記錄建立關聯:
logging.googleapis.com/trace
:與記錄項目相關聯的追蹤記錄資源名稱。logging.googleapis.com/spanId
:與記錄項目相關聯的追蹤記錄中的時距 ID。logging.googleapis.com/trace_sampled
:這個欄位的值必須是true
或false
。
如要進一步瞭解這些欄位,請參閱 LogEntry
結構。
執行已設定為收集遙測資料的範例應用程式
範例應用程式使用供應商中立格式,包括用於記錄的 JSON,以及用於指標和追蹤的 OTLP。應用程式中的遙測資料會透過 Google Cloud Google 匯出工具設定的 OpenTelemetry Collector
路由傳送。這個檔案會使用 Flask 提供 HTTP 要求,並使用 requests 程式庫提出 HTTP 要求。為了為 HTTP 用戶端和伺服器產生指標和追蹤,範例應用程式會安裝 opentelemetry-instrumentation-flask
和 opentelemetry-instrumentation-requests
檢測程式庫:
這個應用程式有兩個端點:
/multi
端點由multi
函式處理。應用程式中的負載產生器會向/multi
端點提出要求。當這個端點收到要求時,會向本機伺服器上的/single
端點傳送三到七個要求。/single
端點由single
函式處理。這個端點收到要求時,會先短暫休眠,然後以字串回應。
下載及部署應用程式
如要執行範例,請按照下列步驟操作:
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
複製存放區:
git clone https://github.com/GoogleCloudPlatform/opentelemetry-operations-python
前往範例目錄:
cd opentelemetry-operations-python/samples/instrumentation-quickstart
建構並執行範例:
docker compose up --abort-on-container-exit
如果您不是在 Cloud Shell 上執行,請將
GOOGLE_APPLICATION_CREDENTIALS
環境變數指向憑證檔案,然後執行應用程式。應用程式預設憑證會在$HOME/.config/gcloud/application_default_credentials.json
提供憑證檔案。# Set environment variables export GOOGLE_CLOUD_PROJECT="PROJECT_ID" export GOOGLE_APPLICATION_CREDENTIALS="$HOME/.config/gcloud/application_default_credentials.json" export USERID="$(id -u)" # Run docker compose -f docker-compose.yaml -f docker-compose.creds.yaml up --abort-on-container-exit
查看指標
範例應用程式中的 OpenTelemetry 檢測工具會產生 Prometheus 指標,您可以使用 Metrics Explorer 查看這些指標:
Prometheus/http_server_duration_milliseconds/histogram
會記錄伺服器要求的時間長度,並將結果儲存在直方圖中。Prometheus/http_client_duration_milliseconds/histogram
會記錄用戶端要求的時間長度,並將結果儲存在直方圖中。
-
前往 Google Cloud 控制台的 leaderboard「Metrics Explorer」頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 在 Google Cloud 控制台的工具列中,選取 Google Cloud 專案。 如要設定 App Hub,請選取 App Hub 主機專案或已啟用應用程式的資料夾管理專案。
- 在「指標」元素中,展開「選取指標」選單,在篩選列中輸入
http_server
,然後使用子選單選取特定資源類型和指標:- 在「Active resources」選單中,選取「Prometheus Target」。
- 在「Active metric categories」(使用中的指標類別) 選單中,選取「Http」。
- 在「Active metrics」選單中,選取指標。
- 點按「套用」。
- 設定資料的檢視方式。
當指標的測量值為累積值時,「Metrics Explorer」會自動根據對齊期間將測量資料標準化,因此圖表會顯示速率。詳情請參閱「類型、類型和轉換」。
當系統測量整數或雙精度值時 (例如兩個
counter
指標),Metrics Explorer 會自動加總所有時間序列。如要查看/multi
和/single
HTTP 路徑的資料,請將「Aggregation」項目的第一個選單設為「None」。如要進一步瞭解如何設定圖表,請參閱「在使用 Metrics Explorer 時選取指標」。
查看追蹤記錄
系統可能需要幾分鐘的時間才能提供追蹤資料。舉例來說,當專案收到追蹤記錄資料時,Google Cloud Observability 可能需要建立資料庫來儲存該資料。建立資料庫可能需要幾分鐘的時間,在此期間,您無法查看追蹤記錄資料。
如要查看追蹤記錄資料,請按照下列步驟操作:
-
前往 Google Cloud 控制台的「Trace Explorer」頁面:
您也可以透過搜尋列找到這個頁面。
- 在頁面的表格部分,選取標間距名稱為
/multi
的資料列。 在「Trace details」面板的甘特圖中,選取標示為
/multi
的時距。畫面上會開啟一個面板,顯示 HTTP 要求的相關資訊。這些詳細資料包括方法、狀態碼、位元組數量,以及呼叫端的使用者代理程式。
如要查看與此追蹤記錄相關聯的記錄,請選取「Logs & Events」分頁標籤。
這個分頁會顯示個別記錄。如要查看記錄項目的詳細資料,請展開記錄項目。您也可以按一下「查看記錄檔」,然後使用記錄檔探索工具查看記錄檔。
如要進一步瞭解如何使用 Cloud Trace 探索工具,請參閱「尋找及探索追蹤記錄」一文。
查看記錄檔
您可以透過「記錄檔探索器」檢查記錄,也可以查看相關的追蹤記錄 (如有)。
-
前往 Google Cloud 控制台的「Logs Explorer」頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「Logging」的結果。
找出說明為
handle /multi request
的記錄。如要查看記錄的詳細資料,請展開記錄項目。
在含有「handle /multi request」訊息的記錄項目上,按一下
「Traces」,然後選取「View trace details」。
「Trace details」面板會隨即開啟,並顯示所選的追蹤記錄。
記錄資料可能會比追蹤資料早幾分鐘出現。如果您在查看追蹤記錄資料時遇到錯誤,無論是透過搜尋 ID 或按照本任務中的步驟操作,請稍候一兩分鐘,然後再重試該動作。
如要進一步瞭解如何使用記錄檔探索工具,請參閱「使用記錄檔探索工具查看記錄檔」。