Một bài viết từ Matt Toback của raintank, công ty đằng sau Grafana

Giới thiệu

Grafana là công cụ xây dựng biểu đồ và bảng điều khiển hàng đầu để hình dung cơ sở hạ tầng và số liệu ứng dụng của chuỗi thời gian nhưng nhiều người sử dụng nó trong các lĩnh vực khác bao gồm cảm biến công nghiệp, tự động hóa nhà, thời tiết và kiểm soát quy trình. Nó cung cấp một cách mạnh mẽ và thanh lịch để tạo, khám phá và chia sẻ trang tổng quan và dữ liệu với nhóm của bạn và thế giới.

Trong hướng dẫn này, bạn sẽ tìm hiểu cách thêm Prometheus làm nguồn dữ liệu vào cá thể Grafana của bạn và cài đặt một Bảng điều khiển Thống kê Máy chủ Prometheus được cấu hình sẵn.

Điều kiện tiên quyết

Để làm theo hướng dẫn này, bạn sẽ cần:

  • Ubuntu 14.04 Giọt
  • Người dùng có quyền truy cập sudo (xem Hướng dẫn cài đặt máy chủ ban đầu với hướng dẫn Ubuntu 14.04 để biết chi tiết)
  • Prometheus và Grafana 2.5+ được cài đặt với các hướng dẫn từ Làm thế nào để cài đặt Prometheus bằng cách sử dụng Docker trên Ubuntu 14.04

Bước 1 - Thêm Prometheus làm nguồn dữ liệu Grafana

Trong phần này, chúng ta sẽ cấu hình Grafana để truy cập máy chủ Prometheus của bạn như một nguồn dữ liệu. Mỗi máy chủ Prometheus là một nguồn dữ liệu riêng biệt và nếu bạn định cấu hình nhiều máy chủ Prometheus, hãy lặp lại phần này cho từng máy chủ.

Chuyển đến chế độ xem chính của Grafana tại http://your_server_ip:3000/và đăng nhập vào tài khoản quản trị của bạn.

Nhấp vào biểu tượng Grafana ở góc trên cùng bên trái để hiển thị menu chính. Lựa chọn Nguồn dữ liệu để điều hướng đến trang danh sách nguồn dữ liệu. Nhấp chuột Thêm mới trong thanh điều hướng trên cùng. Bạn sẽ thấy như sau:

Prometheus Datasource

Sử dụng các giá trị sau để tạo nguồn dữ liệu mới:

  • Name: Prometheus
  • Type: Prometheus
  • URL: http: //<your_server_ip> : 9090, (cổng mặc định là 9090)
  • Access: Ủy quyền
  • Basic Auth: Đã bật hoặc Tắt, vì máy chủ Prometheus của bạn đã được cấu hình.

Nhấp chuột Thêm vào để thêm nguồn dữ liệu của bạn và sau đó nhấp vào Kiểm tra kết nối để xác minh mọi thứ đang hoạt động bình thường. Nếu thành công, hãy chuyển sang bước tiếp theo để nhập trang tổng quan của bạn.

Bước 2 - Nhập Bảng điều khiển Thống kê Prometheus

Phần này sẽ tải xuống Trang tổng quan chính thức, được xây dựng sẵn của Prometheus và hướng dẫn bạn cách nhập nó vào Grafana.

Tải xuống Bảng điều khiển Prometheus mới nhất theo một trong hai cách sau:

  1. Nhấp chuột phải và lưu liên kết sau: Thống kê Prometheus - Bảng điều khiển Grafana mặc định
  2. Điều hướng trình duyệt của bạn trực tiếp đến tệp JSON của trang tổng quan: http://grafana.org/assets/dashboards/prometheus-dash.json

Chế độ xem nhập có thể được tìm thấy tại trình đơn thả xuống của Bảng điều khiển Picker, bên cạnh nút Trang tổng quan và Danh sách phát mới.

Để nhập trang tổng quan từ tệp JSON cục bộ, hãy nhấp vào Chọn tập tin nút trong Nhập tệp phần. Tìm bản tải xuống prometheus-dash.json trên hệ thống tệp cục bộ của bạn và nhập nó.

Import

Chú thích: Nếu bạn đã đặt tên cho nguồn dữ liệu của mình ngoài Prometheus, bạn sẽ cần phải tìm và thay thế tên nguồn dữ liệu trong .json tập tin. Mở nó bằng:

nano prometheus-dash.json

Tìm phần sau và thay đổi tên tệp nguồn dữ liệu từ Prometheus cho bất cứ điều gì bạn đặt tên cho nó:

prometheus-dash.json

"datasource": "Prometheus",

Sau khi nhập Bảng điều khiển Prometheus, bạn sẽ ngay lập tức được đưa đến Bảng điều khiển Thống kê Prometheus và nếu mọi thứ được định cấu hình đúng, bạn sẽ bắt đầu thấy thống kê từ máy chủ Prometheus của mình.

Prom Stats Dash

Quan trọng: Nhấp vào nút Lưu ở menu trên cùng để lưu trang tổng quan của bạn trong phiên bản Grafana. Nếu bạn không lưu trang tổng quan của mình, trang tổng quan sẽ không xuất hiện trong Grafana của bạn sau khi bạn đóng trình duyệt.

Bước 3 - Xem Bảng thống kê Prometheus Thống kê

Sau khi nhập thành công, bạn sẽ ngay lập tức được đưa đến sản phẩm mới, chưa được lưu bảng điều khiển. Bảng điều khiển này được xây dựng với sự trợ giúp của nhóm Prometheus, nêu bật các số liệu cơ bản thường được sử dụng để khắc phục sự cố máy chủ Prometheus của bạn.

Prometheus Dashboard

Các bảng riêng lẻ và số liệu được báo cáo như sau:

Biểu đồ thống kê đơn lẻ

  • Thời gian hoạt động: Biểu đồ chỉ số này là thời gian hoạt động hoặc thời gian từ khi máy chủ Prometheus được đưa lên mạng. Trong nháy mắt, chỉ số này hữu ích khi biết máy chủ của bạn đã khởi động lại gần đây chưa.

  • Bộ nhớ cục bộ: Bảng điều khiển này hiển thị số lượng hiện tại của chuỗi được lưu trữ trong bộ nhớ, From giá trị được chỉ định trên phạm vi thời gian của trang tổng quan. Theo mặc định, đây là now.

  • Độ dài hàng đợi lưu trữ nội bộ: Lý tưởng nhất, chiều dài hàng đợi này phải là Empty (0) hoặc một số thấp.

  • Mẫu được nhập: Biểu đồ này hiển thị số lượng mẫu được máy chủ Prometheus nhập vào, được đo trong 5 phút cuối, mỗi chuỗi thời gian trong vectơ phạm vi. Khi khắc phục sự cố trên IRC hoặc Github, đây thường là chỉ số đầu tiên được nhóm Prometheus yêu cầu. Con số này phải phù hợp với số lượng số liệu bạn tin rằng bạn đang nhập.

Các Mẫu được nhập truy vấn như sau:

rate(prometheus_local_storage_ingested_samples_total[5m])

Phế liệu

Prometheus chỉ trích các số liệu từ các công việc cụ thể, trực tiếp hoặc thông qua cổng đẩy trung gian cho các công việc ngắn ngủi. Các Phế liệu mục tiêu biểu đồ sẽ hiển thị tần suất mục tiêu được lấy mẩu tin được đo trong 5 phút cuối cùng, theo chuỗi thời gian trong vectơ phạm vi. Các Scrape Duration biểu đồ sẽ hiển thị thời gian các mẩu tin lưu niệm đang thực hiện với phần trăm có sẵn dưới dạng chuỗi. Thời gian cạo cho thấy phần trăm thứ 50 (0,5), phần trăm thứ 90 (0,9). và phân vị thứ 99 (0,99) là ba chuỗi riêng biệt để giúp xác định các ngoại lệ có thể làm lệch dữ liệu.

Các Phế liệu mục tiêu truy vấn như sau:

rate(prometheus_target_interval_length_seconds_count[5m])

Các Scrape Duration truy vấn như sau:

prometheus_target_interval_length_seconds{quantile!="0.01", quantile!="0.05"}

Thời gian đánh giá quy tắc

Bảng điều khiển biểu đồ này vẽ thời lượng cho tất cả các đánh giá để thực thi. Phần trăm thứ 50 (0,5), phần trăm thứ 90 (0,9) và phần trăm 99 (0,99) được hiển thị dưới dạng ba chuỗi riêng biệt để giúp xác định các ngoại lệ có thể làm lệch dữ liệu.

Bước 4 - Phân tích dữ liệu từ Bảng điều khiển Prometheus

Đối với máy chủ Prometheus mới chạy, đồ thị của bạn sẽ xuất hiện khá bằng phẳng và nhỏ.

Dài hạn, các biểu đồ này sẽ thay đổi rất nhiều tùy thuộc vào trường hợp sử dụng cụ thể của bạn và khối lượng công việc. Nói chung, bạn muốn tất cả các đồ thị này vẫn ổn định. Nếu có nhiều mục tiêu bị cạo và / hoặc chúng bắt đầu xuất nhiều chỉ số hơn, số lượng mẫu được nhập, chuỗi bộ nhớ và mẩu tin lưu niệm mục tiêu mỗi giây sẽ tăng - đó là mong đợi.

Nếu mẩu tin lưu niệm mục tiêu của bạn giảm đột ngột hoặc độ trễ bị xóa tăng lên, bạn nên xác định nguyên nhân. Ví dụ: khách hàng có thể bắt đầu xuất 1 triệu chỉ số thay vì 10.000 chỉ số thông thường hoặc ai đó có thể xuất chuỗi thời gian bằng một nhãn khác cho từng người dùng. Cả hai điều này sẽ gây ra sự gia tăng về độ trễ cạo. Vì vậy, khi một đồ thị đột nhiên tăng lên, bạn nên điều tra xem một ứng dụng đã được thu nhỏ một cách đáng kể hay liệu nó có thể được thiết kế một cách tồi tệ hay không.

Đánh giá quy tắc chậm cũng là một chỉ báo tốt rằng nút mà máy chủ Prometheus chạy chỉ đơn giản là không đủ để xử lý tải.

Bước 5 - Tùy chỉnh đồ thị và số liệu

Bây giờ bạn có một Bảng điều khiển Prometheus được thêm vào cá thể Grafana của bạn với một tập hợp các thống kê máy chủ Prometheus được cấu hình sẵn.

Grafana cung cấp cho bạn sức mạnh để trực quan hóa bất kỳ số liệu nào có sẵn trên máy chủ Prometheus của bạn - tất cả đều có thể truy cập trong một Trình soạn thảo truy vấn Prometheus chuyên dụng. Để truy cập trình chỉnh sửa truy vấn trên bất kỳ bảng điều khiển nào, hãy nhấp vào khu vực tiêu đề của bảng điều khiển để hiển thị menu bảng điều khiển. Nhấp chuột Chỉnh sửa. Các Số liệu tab sẽ được chọn trước cho bạn và cung cấp quyền truy cập trực tiếp vào truy vấn và các tùy chọn có sẵn cho nguồn dữ liệu Prometheus.

Animated Gif

Khi các thay đổi được thực hiện trong trình chỉnh sửa truy vấn, biểu đồ sẽ ngay lập tức cập nhật để hiển thị các chỉnh sửa của bạn.

Phần kết luận

Để có danh sách đầy đủ các chỉ số có sẵn, bạn có thể điều hướng đến http: //<your_server_ip>:9090/ metric (cổng 9090 là mặc định).

Bất kỳ chỉ số nào trong số này có thể được sao chép và dán vào trình chỉnh sửa truy vấn Grafana và cho đến khi bạn lưu trang tổng quan, không có chỉnh sửa nào của bạn sẽ ghi đè trang tổng quan hiện tại.

Vì vậy, thử nghiệm, vui chơi và bắt đầu hình dung!