Python 檢測工具範例

本文件說明如何修改 Python 應用程式,以便使用開放原始碼 OpenTelemetry 架構收集追蹤記錄和指標資料,以及如何將結構化 JSON 記錄寫入標準輸出。本文也提供可安裝及執行的 Python 應用程式範例相關資訊。應用程式使用 Flask 網路架構,並已設定為產生指標、追蹤記錄和記錄檔。

如要進一步瞭解檢測功能,請參閱下列文件:

關於手動和零程式碼檢測

針對這門語言,OpenTelemetry 將「零程式碼檢測」定義為從程式庫和架構收集遙測資料的做法,且不必變更程式碼。不過,您確實有安裝模組和設定環境變數。

本文不會說明零程式碼檢測功能。如需該主題的相關資訊,請參閱 Python 零程式碼檢測功能

如需一般資訊,請參閱「Python 適用的 OpenTelemetry 檢測功能」。

事前準備

Enable the Cloud Logging, Cloud Monitoring, and Cloud Trace APIs.

Enable the APIs

檢測應用程式以收集追蹤記錄、指標和記錄

如要檢測應用程式以收集追蹤記錄和指標資料,並將結構化 JSON 寫入標準輸出,請按照本文件後續章節所述的步驟操作:

  1. 設定 OpenTelemetry
  2. 設定結構化記錄

設定 OpenTelemetry

這個範例應用程式已設定為使用 OpenTelemetry Python SDK,透過 OTLP 通訊協定匯出追蹤記錄和指標。根據預設,OpenTelemetry Python SDK 會使用 W3C 追蹤記錄背景資訊格式傳播追蹤記錄背景資訊,確保跨度在追蹤記錄中具有正確的父項-子項關係。

以下程式碼範例說明如何設定 OpenTelemetry 的 Python 模組。如要查看完整範例,請按一下 「更多」,然後選取「前往 GitHub 查看」

def setup_opentelemetry() -> None:
    resource = Resource.create(
        attributes={
            # Use the PID as the service.instance.id to avoid duplicate timeseries
            # from different Gunicorn worker processes.
            SERVICE_INSTANCE_ID: f"worker-{os.getpid()}",
        }
    )

    # Set up OpenTelemetry Python SDK
    tracer_provider = TracerProvider(resource=resource)
    tracer_provider.add_span_processor(BatchSpanProcessor(OTLPSpanExporter()))
    trace.set_tracer_provider(tracer_provider)

    logger_provider = LoggerProvider(resource=resource)
    logger_provider.add_log_record_processor(BatchLogRecordProcessor(OTLPLogExporter()))
    logs.set_logger_provider(logger_provider)

    event_logger_provider = EventLoggerProvider(logger_provider)
    events.set_event_logger_provider(event_logger_provider)

    reader = PeriodicExportingMetricReader(OTLPMetricExporter())
    meter_provider = MeterProvider(metric_readers=[reader], resource=resource)
    metrics.set_meter_provider(meter_provider)

Flask 應用程式會依照 Flask 部署至實際工作環境指南中的建議,使用 Gunicorn 服務 HTTP 要求。Gunicorn 會在獨立的工作者程序中啟動多個應用程式副本,以提高處理量。為確保工作站程序的指標不會彼此衝突,建議每個工作站程序都為 service.instance.id 資源屬性設定不重複的值。其中一種做法是在 service.instance.id 中加入程序 ID。詳情請參閱「時序衝突」。

如需更多資訊和設定選項,請參閱 OpenTelemetry Python 檢測功能

設定結構化記錄

如要記錄與追蹤記錄連結的結構化記錄,請將應用程式設為將 JSON 格式的記錄輸出至標準輸出,並包含含有追蹤資訊的鍵。以下程式碼範例說明如何設定標準 logging 程式庫,以便使用 python-json-logger 程式庫輸出 JSON 結構化記錄,以及如何使用 opentelemetry-instrumentation-logging 套件納入追蹤資訊。

class JsonFormatter(jsonlogger.JsonFormatter):
    def formatTime(self, record: logging.LogRecord, datefmt: Optional[str] = None):
        # Format the timestamp as RFC 3339 with microsecond precision
        isoformat = datetime.fromtimestamp(record.created).isoformat()
        return f"{isoformat}Z"


def setup_structured_logging() -> None:
    LoggingInstrumentor().instrument()

    log_handler = logging.StreamHandler()
    formatter = JsonFormatter(
        "%(asctime)s %(levelname)s %(message)s %(otelTraceID)s %(otelSpanID)s %(otelTraceSampled)s",
        rename_fields={
            "levelname": "severity",
            "asctime": "timestamp",
            "otelTraceID": "logging.googleapis.com/trace",
            "otelSpanID": "logging.googleapis.com/spanId",
            "otelTraceSampled": "logging.googleapis.com/trace_sampled",
        },
    )
    log_handler.setFormatter(formatter)
    logging.basicConfig(
        level=logging.INFO,
        handlers=[log_handler],
    )

先前的設定會從記錄訊息中擷取有效時間間隔的相關資訊,然後將該資訊做為屬性新增至 JSON 結構化記錄。這些屬性可用於將記錄與追蹤記錄建立關聯:

  • logging.googleapis.com/trace:與記錄項目相關聯的追蹤記錄資源名稱。
  • logging.googleapis.com/spanId:與記錄項目相關聯的追蹤記錄中的時距 ID。
  • logging.googleapis.com/trace_sampled:這個欄位的值必須是 truefalse

如要進一步瞭解這些欄位,請參閱 LogEntry 結構。

執行已設定為收集遙測資料的範例應用程式

範例應用程式使用供應商中立格式,包括用於記錄的 JSON,以及用於指標和追蹤的 OTLP。應用程式中的遙測資料會透過 Google Cloud Google 匯出工具設定的 OpenTelemetry Collector 路由傳送。這個檔案會使用 Flask 提供 HTTP 要求,並使用 requests 程式庫提出 HTTP 要求。為了為 HTTP 用戶端和伺服器產生指標和追蹤,範例應用程式會安裝 opentelemetry-instrumentation-flaskopentelemetry-instrumentation-requests 檢測程式庫:

logger = logging.getLogger(__name__)

# Initialize OpenTelemetry Python SDK and structured logging
setup_opentelemetry()
setup_structured_logging()

app = Flask(__name__)

# Add instrumentation
FlaskInstrumentor().instrument_app(app)
RequestsInstrumentor().instrument()

這個應用程式有兩個端點:

  • /multi 端點由 multi 函式處理。應用程式中的負載產生器會向 /multi 端點提出要求。當這個端點收到要求時,會向本機伺服器上的 /single 端點傳送三到七個要求。

    @app.route("/multi")
    def multi():
        """Handle an http request by making 3-7 http requests to the /single endpoint."""
        sub_requests = randint(3, 7)
        logger.info("handle /multi request", extra={"subRequests": sub_requests})
        for _ in range(sub_requests):
            requests.get(url_for("single", _external=True))
        return "ok"
    
    
  • /single 端點由 single 函式處理。這個端點收到要求時,會先短暫休眠,然後以字串回應。

    @app.route("/single")
    def single():
        """Handle an http request by sleeping for 100-200 ms, and write the number of seconds slept as the response."""
        duration = uniform(0.1, 0.2)
        logger.info("handle /single request", extra={"duration": duration})
        time.sleep(duration)
        return f"slept {duration} seconds"
    
    

下載及部署應用程式

如要執行範例,請按照下列步驟操作:

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

  2. 複製存放區:

    git clone https://github.com/GoogleCloudPlatform/opentelemetry-operations-python
    
  3. 前往範例目錄:

    cd opentelemetry-operations-python/samples/instrumentation-quickstart
    
  4. 建構並執行範例:

    docker compose up --abort-on-container-exit
    

    如果您不是在 Cloud Shell 上執行,請將 GOOGLE_APPLICATION_CREDENTIALS 環境變數指向憑證檔案,然後執行應用程式。應用程式預設憑證會在 $HOME/.config/gcloud/application_default_credentials.json 提供憑證檔案。

    # Set environment variables
    export GOOGLE_CLOUD_PROJECT="PROJECT_ID"
    export GOOGLE_APPLICATION_CREDENTIALS="$HOME/.config/gcloud/application_default_credentials.json"
    export USERID="$(id -u)"
    
    # Run
    docker compose -f docker-compose.yaml -f docker-compose.creds.yaml up --abort-on-container-exit
    

查看指標

範例應用程式中的 OpenTelemetry 檢測工具會產生 Prometheus 指標,您可以使用 Metrics Explorer 查看這些指標:

  • Prometheus/http_server_duration_milliseconds/histogram 會記錄伺服器要求的時間長度,並將結果儲存在直方圖中。

  • Prometheus/http_client_duration_milliseconds/histogram 會記錄用戶端要求的時間長度,並將結果儲存在直方圖中。

如要查看範例應用程式產生的指標,請按照下列步驟操作:
  1. 前往 Google Cloud 控制台的 「Metrics Explorer」頁面:

    前往 Metrics Explorer

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果

  2. 在 Google Cloud 控制台的工具列中,選取 Google Cloud 專案。 如要設定 App Hub,請選取 App Hub 主機專案或已啟用應用程式的資料夾管理專案。
  3. 在「指標」元素中,展開「選取指標」選單,在篩選列中輸入 http_server,然後使用子選單選取特定資源類型和指標:
    1. 在「Active resources」選單中,選取「Prometheus Target」
    2. 在「Active metric categories」(使用中的指標類別) 選單中,選取「Http」
    3. 在「Active metrics」選單中,選取指標。
    4. 點按「套用」
  4. 設定資料的檢視方式。

    當指標的測量值為累積值時,「Metrics Explorer」會自動根據對齊期間將測量資料標準化,因此圖表會顯示速率。詳情請參閱「類型、類型和轉換」。

    當系統測量整數或雙精度值時 (例如兩個 counter 指標),Metrics Explorer 會自動加總所有時間序列。如要查看 /multi/single HTTP 路徑的資料,請將「Aggregation」項目的第一個選單設為「None」

    如要進一步瞭解如何設定圖表,請參閱「在使用 Metrics Explorer 時選取指標」。

查看追蹤記錄

系統可能需要幾分鐘的時間才能提供追蹤資料。舉例來說,當專案收到追蹤記錄資料時,Google Cloud Observability 可能需要建立資料庫來儲存該資料。建立資料庫可能需要幾分鐘的時間,在此期間,您無法查看追蹤記錄資料。

如要查看追蹤記錄資料,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Trace Explorer」頁面:

    前往「Trace Explorer」頁面

    您也可以透過搜尋列找到這個頁面。

  2. 在頁面的表格部分,選取標間距名稱為 /multi 的資料列。
  3. 在「Trace details」面板的甘特圖中,選取標示為 /multi 的時距。

    畫面上會開啟一個面板,顯示 HTTP 要求的相關資訊。這些詳細資料包括方法、狀態碼、位元組數量,以及呼叫端的使用者代理程式。

  4. 如要查看與此追蹤記錄相關聯的記錄,請選取「Logs & Events」分頁標籤。

    這個分頁會顯示個別記錄。如要查看記錄項目的詳細資料,請展開記錄項目。您也可以按一下「查看記錄檔」,然後使用記錄檔探索工具查看記錄檔。

如要進一步瞭解如何使用 Cloud Trace 探索工具,請參閱「尋找及探索追蹤記錄」一文。

查看記錄檔

您可以透過「記錄檔探索器」檢查記錄,也可以查看相關的追蹤記錄 (如有)。

  1. 前往 Google Cloud 控制台的「Logs Explorer」頁面:

    前往「Logs Explorer」(記錄檔探索工具)

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Logging」的結果

  2. 找出說明為 handle /multi request 的記錄。

    如要查看記錄的詳細資料,請展開記錄項目。

  3. 在含有「handle /multi request」訊息的記錄項目上,按一下 「Traces」,然後選取「View trace details」

    「Trace details」面板會隨即開啟,並顯示所選的追蹤記錄。

    記錄資料可能會比追蹤資料早幾分鐘出現。如果您在查看追蹤記錄資料時遇到錯誤,無論是透過搜尋 ID 或按照本任務中的步驟操作,請稍候一兩分鐘,然後再重試該動作。

如要進一步瞭解如何使用記錄檔探索工具,請參閱「使用記錄檔探索工具查看記錄檔」。

後續步驟